这个场景分别从顾燕帧和宁毅两个角度来叙述文字转WAV音频