他们面临的是一个两难的选择文字转WAV音频