看来我们中间必须要牺牲一个文字转WAV音频