很好奇他提出的会是什么条件文字转WAV音频