是因为他们自己很担心文字转WAV音频