AI系统:建立多维度向量进行数据检测
小编为您收集和整理了AI系统:建立多维度向量进行数据检测的相关内容:在网络时代,虚假新闻是压倒一切的,令人困惑。Facebook曾一度陷入虚假新闻的泥潭,不仅被指控影响美国总统选举的结果,还被指控触发德国zheng府的巨额罚款。就连以信誉著称的BBC也不能幸免。例如,
在网络时代,虚假新闻是压倒一切的,令人困惑。Facebook曾一度陷入虚假新闻的泥潭,不仅被指控影响美国总统选举的结果,还被指控触发德国zheng府的巨额罚款。就连以信誉著称的BBC也不能幸免。例如,BBC北安普顿分部的Twitter账户就发送了这样一条信息:
爆料新闻:特朗普总统在就职典礼上受枪伤。
10月4日,麻省理工学院的计算机科学与人工智能实验室(CSAIL)在其官方网站上发布了一则消息,声称该实验室与卡塔尔计算研究所的研究人员合作,开发了一个人工智能系统,该系统能够识别信息源的准确性,并且能够识别p.个人政治偏见。这项研究的结果将于本月底在比利时举行。布鲁塞尔举行的2023年自然语言处理经验方法会议(EMNLP)正式宣布。
研究人员使用人工智能系统创建了一个包含1000多个新闻源的开源数据集,这些新闻源被标记为真实性和偏见分数。据说,这是相似数据集中最多的新闻源。
研究人员写道,打击虚假新闻的一种(希望)方法是关注来源。尽管虚假新闻(帖子)主要通过社交媒体传播,但它们仍然有自己的原始来源,也就是说,一种,所以如果一个网站发布了虚假新闻,那么它很有可能在将来被发布。
人工智能系统的新颖之处在于它对所评估的媒体具有广泛的上下文理解。它并不仅仅从新闻文章中提取特征值(通过机器学习模型训练的变量),而是考虑维基百科、社交媒体,甚至基于URL和网络流量数据的结构来确定可信度。
系统的支持向量(SVM)训练用于评估事实和偏差。真实性分为:低、中、高;政治倾向分为:极左、左、中左、右、右和极右。
该小组表示,该系统只需要检测150篇文章,即可确定新源代码是否可靠,在检测新闻源是否具有高度、低度或中度真实性方面具有65%的准确率,在检测其政治倾向是左倾、右倾还是中立方面具有70%的准确率。
在上面显示的文章中,AI系统从六个维度测试了文章的文本和标题。它不仅分析了文章的结构、情感和参与(在本例中是股票数量、对Facebook的反应和评论),还分析了文章的主题、复杂性、偏见和道德观念,并计算了每个特征值的得分,然后对一组文章进行了平均评分。
维基百科和Twitter也被添加到人工智能系统的预测模型中。正如研究人员所说,维基百科页面的缺失可能表明一个网站不可信,或者说提及这个问题的政治倾向可能是讽刺的或者显然是左倾的。此外,他们指出,信息公开不太可能。通过未经身份验证的Twitter帐户,或者使用没有明确标记的新创建的帐户,都是正确的。
模型的最后两个向量是URL结构和网络流量,它们可以检测试图模仿可信新闻源的URL(例如,foxnews.co),参考网站的Alexa排名,该排名是根据网站的访问总数计算的。
该小组在MBCF(MediaBiasFactCheck)网站上对1066个新闻源进行了AI系统培训。为了生成上述信息,研究人员在每个网站上发表了10-100篇文章(总共94814篇)。
正如研究人员在报告中煞费苦心地介绍的那样,并非每个特征值都能有效地预测事实的准确性或政治偏见。例如,一些没有维基百科网页或Twitter档案的网站可能发布公平可信的信息,而Alexa排名靠前的新闻来源并不总是更公平或更真实。比那些交通不那么拥挤的人更可信。
研究人员有一个有趣的发现:来自虚假新闻网站的文章更倾向于使用夸张和情绪化的语言,而左倾的媒体更倾向于提及公平和互惠。同时,维基百科页面较长的出版物通常更值得信任,包含少量特殊内容的URL也是如此。字符和复杂子目录。
将来,研究小组打算探索人工智能系统是否可以适应其他语言(目前只有英语培训)以及它是否可以被训练来检测特定领域的偏见。他们还计划推出一个应用程序,通过政治领域的文章自动响应新闻。
该论文的第一作者兼博士后助理RamyBaly说:如果一个网站之前发布了虚假新闻,他们很可能会再次发布它。通过自动从这些网站抓取数据,我们希望我们的系统可以帮助找出哪些网站可以首先这样做。
新德里的初创公司MetaFact使用NLP算法在新闻报道和社交媒体帖子中标记错误信息和偏见;SAAS平台AdVerify。AI去年发布了测试版来分析错误消息、恶意软件和其他有问题的内容,并交叉引用定期更新的数据库,该数据库包含数千个错误和合法新闻。
如前所述,一度陷入虚假新闻的Facebook已经开始使用人工智能工具来识别虚假新闻,最近收购了位于伦敦的初创公司Bloomsb.AI,以帮助其识别和消除虚假新闻。
然而,一些专家不相信人工智能能够胜任这项任务。卡内基梅隆大学机器人研究所的科学家迪安·波默洛在接受外国媒体的采访时告诉《边缘》杂志,人工智能缺乏对语言的微妙理解,这对于识别谎言和虚假陈述至关重要。
我们最初的目标是建立一个系统来回答,'这是假消息,是或不是,'他说,但我们很快意识到,机器学习不符合任务。
但是人类事实检验员并不一定比人工智能做得更好。今年,在保守媒体指责谷歌对他们有偏见之后,谷歌暂停了过去在谷歌新闻上贴的标签FactCheck。
然而,无论识别假新闻和个人偏见的最终解决方案是人工智能系统还是人为的,或者两者兼而有之,假新闻被消除的那一天都不会马上到来。
以上就是小编为您收集和整理的AI系统:建立多维度向量进行数据检测相关内容,如果对您有帮助,请帮忙分享这篇文章^_^
本文来源: https://www.tushuolishi.com/a/66c54718a24b14a33207af60.html
相关推荐
热门专题
南北朝的歌妓苏小小,为何年仅二十三岁就凋零了呢?
说起古代四大名妓,相信大家对她们并不陌生,即:北宋时期的李师师、南北朝之际的苏小小、明朝的陈圆圆和清朝初年的柳如是,感兴趣的读者可以跟着途说历史网小编一起往下看。这四大名妓能歌善舞,才艺双绝,被当时之人称古代的青楼名妓是怎么收费的?唐朝身价最高的名妓值多少钱?
今天途说历史网小编为大家带来古代的青楼名妓是怎么收费的?希望对你们能有所帮助。此女堪称是历史上身价最高的青楼名妓,看一眼的价格可以买辆轿车与今天不一样,在古代,开设青楼是属于合法的,在那个时候,逛青楼不仅吕后的外孙女张嫣11岁当皇后,为何到死还是处子之身呢?
在我们现代社会中,已经禁止了近亲结婚,但在中国古代时期,近亲结婚却是一件司空见惯的事情。提到中国古代中的近亲结婚,接下来我们要讲到的这一位女子便是其中的典型,她就是汉惠帝刘盈身边的皇后——张嫣。张嫣本城隍姥爷是怎么来的?城隍的本意是什么?
“城隍”本意是什么?下面途说历史网小编为大家带来详细的文章介绍。千年以前,在我国古代某座城市的一条普通街道上,可能不会有商人的店铺、不会有官府的衙门、不会有烟花柳巷、不会有高门豪宅、不会有佛寺熏风,但一定和珅往灾粮中掺沙子,只是因为他想贪污吗?
可能在很多人的眼里,和珅一直都是一个十恶不赦的贪官形象,而这位乾隆身边的大红人在乾隆刚去世便被嘉庆帝抄了家,据说,抄出来的财富比国库的都多,然而在历史上,和珅并不是一件好事都没有做过,今天途说历史网小编就古代的美女主动献身,为何却往往下场并不好呢?
俗话说女追男,隔层纸,一捅就破,得到容易,男人会不会珍惜,就难说了。但古代的许多美女笃信“万般皆下品,唯有献身高”,大玩轻率献身的两性游戏。孔子的母亲颜徵在,就是个例子。十六七的年纪,闭月羞花似的容貌揭秘:为什么古代青楼女子从来不会怀孕?
古代的青楼女子也分两种,一种样貌出众的女子,这类女子会从小培养,琴棋书画,无所不精,而青楼培养她们的目的,就是为了更好满足那些达官贵人兴致。所以,这类女子待遇会比一般女子的待遇好很多,如果幸运的话,遇李广在边疆驻守时,经历过什么奇幻的故事?
据传说,西汉的著名飞将军李广曾在边疆驻守时经历过这么一段奇幻的故事,感兴趣的读者可以跟着途说历史网小编一起往下看。有一天,李广和他的同伴骑马打猎,突然发现白一只狐在大雪中奔跑。这只狐狸十分可爱,浑身雪白色揭秘:古代大户人家买一个丫鬟需要花多少银子?
可以说,在旧社会,老百姓就算是卖儿卖女也不一定能得到温饱。一旦将儿女们卖给别人,那么,他们将会世世代代为人奴仆,没有自己的人身自由,生活会很凄惨。一般,男孩子会被卖去当小厮,女孩子则会被卖去当丫鬟。在笮融曾经杀过自己的恩人,为何后世却得到佛教的追捧
三国乱世英雄辈出,同样也有许多小人,其中笮融就是这样的一类人,更是被称为三国时最卑鄙的将领,接下来听听途说历史网小编讲一讲他的一些故事。在很早之前,徐州牧陶谦很信任笮融,还让笮融担任下邳的国相,甚至还让其