而且是大规模的运动文字转WAV音频