他们虽然无法分辨出文字转WAV音频