考虑到他看不见文字转WAV音频