我建议以嵌入式结构为主体文字转WAV音频