所以他们很难相信文字转WAV音频