事实上就是记忆植入文字转WAV音频