只不过需要减半计算文字转WAV音频