其他地市的数据可以忽略文字转WAV音频