不能用人类的认知去解读文字转WAV音频