此时她已经推测出文字转WAV音频