当前位置:首页 > 资讯

研究发现:AI生成答案超三成“不可靠”

2025-09-19 来源:网络

  据英国《新科学家》周刊网站9月16日报道,生成式人工智能(AI)工具及其驱动的深度研究智能体和搜索引擎经常给出缺乏依据和存在偏见的说法,它们引述的资料并不支持这样的说法。一项分析得出了上述结论,它发现,AI工具提供的答案有大约三分之一缺乏可靠资料的支持。对开放人工智能研究中心(OpenAI)的GPT-4.5来说,这一比例更高,达到47%。

  赛富时公司AI研究部门的普拉纳夫·纳拉亚南·文基特和他的同事测试了一些生成式AI搜索引擎,包括OpenAI的GPT-4.5和GPT-5、You.com、“解惑”和微软的必应聊天。此外,他们还测试了5个深度研究智能体:GPT-5的深度研究功能、必应聊天的深度思考选项以及You.com、谷歌“双子座”和“解惑”提供的深度研究工具。

  纳拉亚南·文基特说:“我们希望对生成式搜索引擎进行社会技术评估。”目的是确定答案的质量及人类应该如何对待其中包含的信息。

  他们要求不同的AI引擎回答303个问题,评价AI的回应使用了8个指标。研究人员把这套指标称为DeepTrace。其设计目的是检测某个答案是否过于片面或自信,它与问题的相关性如何,它引述了什么资料,引述的资料对答案给出的说法有多少支持,以及引述的资料的详尽程度。

  问题大致被分成两组:第一组包含一些有争议的问题,以发现AI回应中的偏见;第二组用于检测一系列领域的专业知识,包括气象学、医学和人机交互。

  总的来说,AI驱动的搜索引擎和深度研究工具表现得相当差。

  研究人员发现许多模型给出了过于片面的答案。必应聊天搜索引擎给出的答案有大约23%包含缺乏依据的说法,而You.com和“解惑”AI搜索引擎的这一比例为31%左右。GPT-4.5给出的缺乏依据的说法更多,为47%,而“解惑”深度研究智能体的该比例高达97.5%。纳拉亚南·文基特说:“看到这样的情况确实让我们很惊讶。”

责任编辑:郑容

声明:

1、内容征集与合作:诚邀各界提供新闻稿件、文学创作;承接单位工作资讯代发服务;同步转发各类正能量文章;专业策划并刊登多种软性广告。

2、免责声明: 本平台转载并标注来源的作品,旨在拓宽信息传播渠道,不代表本平台对其观点的认同或内容真实性的背书,亦不承担该类作品因侵权引发的直接及连带责任。 同时,我们秉持分享理念,尊重原创权益。若涉及作品侵权,请及时与我们联系,我们将在24小时内予以删除,感谢理解与支持!

3、如因作品内容、版权和其他问题需要同本网联系的,请在30日内进行。电话:13716035981

相关阅读

  十年,足以让一个婴儿长成少年,却无法让一口被污染的机井恢复清澈。2026年4月,河北保定蠡县“红色地下水”事件刷屏网络。一段视频、数口泛红的机井、村民“

2026-04-26

  时过正午,河东区十四经路3号,微风轻拂,阳光斜照在玻璃幕墙上,将园区内一栋二层小楼映衬得格外醒目。  这是二次方二手商品流通电商产业园(以下简称二次方)为不断壮大的入驻

2026-04-24

春风吹绿了辽河两岸,更新改造的辽河双台子闸也焕然一新。与传统的拦河闸不一样,这里配置一条专门为鱼儿通行的生态鱼道,今年4月通水试验成功后新近投入使用,成为上下游鱼群自由

2026-04-24

  近日,2026暑期档电影《灵魂摆渡·浮生梦》官宣全AI生成,原班幕后坐镇、演员全AI换脸。然而,因AI复刻男主角夏冬青经典眼神时缺乏人情味,引发网友热议。  在人物情绪

2026-04-23

  4月22日,由中国科学院化学研究所宋延林研究员团队联合新加坡国立大学仇成伟教授团队完成的光学超材料制备突破性成果,在线发表于国际学术期刊《自然》。该研究开创卷对卷

2026-04-23

  据中国载人航天工程办公室消息,中国载人航天工程首批外籍航天员选拔工作于2026年4月上旬结束,2名巴基斯坦籍候选对象Muhammad Zeeshan Ali(穆罕默德·齐尚·

2026-04-23

  昨日以来,湖南东南部、江西南部、福建西部、广西东北部和西南部、广东北部等地部分地区出现大到暴雨,广西崇左、防城港等局地大暴雨;上述地区最大小时降雨量30~60毫米,局地

2026-04-23

  近年来,各类商品小样持续走俏。从护肤品到食品,从线上商城到线下集合店,昔日仅供试用的赠品,已形成规模可观的消费市场。对消费者而言,选购小样经济实惠;对商家来说,投放小样

2026-04-23

热门推荐

阅读排行

首页 | 资讯 | 城市 | 娱乐 | 农村 | 公益 | 生态 | 文化 | 教育 | 健康 | 旅游 | 职场 | 关于我们 | 联系我们 | 人员查询

运营单位:北京竣发文化传媒有限公司

地址:北京市丰台区泥洼北路6号院9号楼二层203-1520室

中华人民共和国国家工业和信息化部备案号: 京ICP备2025122738号-1

京公网安备11010602201975号

Copyright © 2025-2030 城乡观察网 版权所有

本网站内容来源于互联网,如因版权和其它问题需要同本网联系。 邮箱:axlt6@qq.com    电话:13716035981