最起码是会识字能通读的文字转WAV音频