但是他能够懂文字转WAV音频