他自然是要满足的文字转WAV音频