第三个部分则是文试文字转WAV音频