只能用最简单的语言描述文字转WAV音频