剩下的就按照原来的约定分成文字转WAV音频