他们似乎选择留下文字转WAV音频