原本就嘈杂的人群文字转WAV音频