而且也需要反应时间文字转WAV音频