他几乎完全依靠他的直觉文字转WAV音频