而是刻意的沙哑文字转WAV音频