因为他知道如果他说慢了文字转WAV音频