所以他需要仔细的探查文字转WAV音频