第三次是八个文字转WAV音频