后者似乎明白他的意思文字转WAV音频