其实是知道他可能会去的文字转WAV音频