勉强可以辨认出文字转WAV音频