而是分开的那一种文字转WAV音频