他的注意力基本上被文字转WAV音频