更不会专门去等待文字转WAV音频