若是单纯的以资源来换算的话文字转WAV音频