他表面上看似是听进去了文字转WAV音频