他只拿到了十二个文字转WAV音频