他自认单凭文字转WAV音频