但是他靠的全是自己的记忆文字转WAV音频