经过自己的推理猜测文字转WAV音频