整个过程被岳恒描述的是绘声绘色文字转WAV音频