所以很难确定到底有几股文字转WAV音频