最后进行统计文字转WAV音频