需要大部分时间都处于安静的状态文字转WAV音频