又按照一个什么样子的比例来挑选文字转WAV音频