它们比人类敏感的多文字转WAV音频