但是没想到整个过程还是蛮缓和的文字转WAV音频