二十个区域全部是长条直线型文字转WAV音频