因为透视能力使用过渡文字转WAV音频