他们面临的是同样的麻烦文字转WAV音频