他们很冷静地判断出文字转WAV音频