当然楚枫倾向于第二种文字转WAV音频