此时她已经有了一种推测文字转WAV音频