他们虽然未必能够第一时间辨认出文字转WAV音频