他是按照正常的比例卖出文字转WAV音频