但并不太重视文字转WAV音频