几乎最后的决定都是他定的文字转WAV音频