他们很容易就会倾向于文字转WAV音频