因为这个时候他们已经感觉出来了文字转WAV音频