剩下的就是短暂的等待文字转WAV音频