不过我们原计划的场景是一个样子文字转WAV音频