根据我十几世的记忆碎片来分析文字转WAV音频