可能会错过第三阶段文字转WAV音频