他们似乎是下意识的就跟着唱出来文字转WAV音频