然后就开始一样一样统计文字转WAV音频