他们也很容易辨认文字转WAV音频