不过从其口中说出的言语文字转WAV音频