毕竟原本这一切都应该是他的文字转WAV音频