恐怕不一定会完全顺着他的意思做文字转WAV音频