我们就按照一个折中数据来核算文字转WAV音频