他似乎感应到文字转WAV音频