约瑟夫通过这种方法混淆了媒体的视听文字转WAV音频