显然第一种可能性文字转WAV音频