探索“草莓”:迈向具备思考能力的人工智能的起点

   有消息人士透露,ChatGPT的开发公司OpenAI正在进行一个名为“草莓”的新人工智能模型项目。 该项目的具体信息此前未曾披露,目前微软...

  

有消息人士透露,ChatGPT的开发公司OpenAI正在进行一个名为“草莓”的新人工智能模型项目。

该项目的具体信息此前未曾披露,目前微软支持的初创企业正在积极展示其模型的高级推理能力。

根据路透社5月份获得的OpenAI内部文件,OpenAI的团队正在研发Strawberry。路透社无法确认该文件的具体日期,但文件中详细说明了OpenAI如何计划利用Strawberry进行研究。消息人士表示,该计划正在推进中,但路透社无法确定“草莓”何时会发布。

这位知情人士指出,即使在OpenAI内部,“草莓”的运作机制也是一个高度保密的内容。

据知情人士透露,该文件提到一个使用Strawberry模型的项目,旨在使公司的人工智能不仅能生成查询答案,还能提前进行充分的规划,自主且可靠地在互联网上导航,以执行OpenAI所称的“深度研究”。

根据对十多位人工智能研究人员的采访,这是当前人工智能模型尚未解决的难题。

当被问及“草莓”及相关细节时,OpenAI的一位发言人在声明中表示:“我们希望我们的人工智能模型能像我们一样理解这个世界。持续研究新的人工智能功能是行业的普遍做法,大家都相信,随着时间的推移,这些系统的推理能力将会得到提升。”

发言人没有直接回应关于“草莓”的问题。

草莓项目的前身是Q*,路透社去年报道,该项目在公司内部被视为一项重大突破。

两名消息人士描述了OpenAI员工早些时候展示的Q*演示,能够解决当前商用模型无法应对的复杂科学和数学问题。

另一位知情人士表示,OpenAI已在内部测试人工智能,其在数学数据集上的得分超过90%,该数据集是针对冠军数学问题的基准。路透社无法确认这是否与“草莓”项目相关。

据彭博社报道,在周二的一次内部全体会议上,OpenAI展示了一个研究项目的演示,声称该项目具备新的类人推理能力。OpenAI的一位发言人证实了会议的举行,但拒绝透露具体内容。路透社无法确认该项目是否为“草莓”。

知情人士表示,OpenAI希望这一创新能显著提升其人工智能模型的推理能力,并补充说,“草莓”涉及一种专门处理人工智能模型的方法,该模型是在非常大的数据集上进行预训练的。

路透社采访的研究人员表示,推理是人工智能实现人类或超人类智能水平的关键。

尽管大型语言模型已经能够比人类更快地总结复杂文本和撰写优美散文,但在解决对人类而言似乎直观的常识性问题时,这种技术往往表现不足,例如识别逻辑谬误和玩井字游戏。当模型遇到这类问题时,通常会产生“幻觉”或虚假信息。

接受路透社采访的人工智能研究人员普遍认为,在人工智能的背景下,推理包括构建一个模型,使人工智能能够提前计划,反映物理世界的运作方式,并可靠地解决具有挑战性的多步骤问题。

提升人工智能模型的推理能力被视为解锁模型潜力的关键,这将影响从重大科学发现到规划和构建新软件应用程序的各个方面。

OpenAI首席执行官萨姆·奥特曼早些时候表示,在人工智能领域,“最重要的进展将围绕推理能力展开。”

谷歌、Meta和微软等其他公司也在尝试不同的技术来提升人工智能模型的推理能力,大多数从事人工智能研究的学术实验室也是如此。然而,关于大型语言模型是否能够将想法和长期规划纳入预测方式,研究人员意见不一。例如,现代人工智能的先驱之一、Meta公司的Yann LeCun经常表示,法学硕士不具备类似人类的推理能力。

人工智能的挑战

知情人士称,Strawberry是OpenAI克服这些挑战计划的关键组成部分。路透社看到的文件描述了“草莓”的目标,但未说明如何实现。

据四名听过该公司宣传的人士透露,近几个月来,该公司一直在私下向开发者和其他外部各方暗示,技术即将发布,具备更先进的推理能力。他们拒绝透露身份,因为未获授权讨论私事。

其中一位消息人士称,“草莓”包括一种被称为“后训练”的OpenAI生成式人工智能模型的专门方法,即在对大量广义数据进行“训练”后,对基础模型进行调整,以特定方式提升其性能。

开发模型的后训练阶段涉及“微调”等方法,这是当今几乎所有语言模型都使用的过程,形式多样,例如让人类根据模型的反应提供反馈,并给予模型好的和坏的答案。

据知情人士透露,“草莓”与斯坦福大学2022年开发的“自学推理器”或“STaR”方法有相似之处。STaR的创始人之一、斯坦福大学教授诺亚·古德曼对路透社表示,STaR使人工智能模型能够通过迭代创建自己的训练数据来“引导”自己达到更高的智能水平,理论上可以用来让语言模型超越人类的智能水平。

“我认为这既令人兴奋又令人担忧……如果事情继续朝这个方向发展,我们作为人类将面临一些严肃的考量,”古德曼说。Goodman并不隶属于OpenAI,也不熟悉Strawberry。

第一个消息来源解释说,OpenAI将“草莓”瞄准的功能之一是执行长期任务(LHT),指的是需要模型提前计划并在较长时间内执行一系列动作的复杂任务。

OpenAI的内部文件显示,为此,OpenAI正在创建、训练和评估其所谓的“深度研究”数据集上的模型。路透社无法确认数据集的具体内容,也无法确定延长的时间意味着多长。

根据该文件和其中一位消息人士的说法,OpenAI特别希望其模型能够利用这些功能,在“CUA”(即使用计算机的代理)的帮助下自主浏览网页,从而进行研究。CUA可以根据其发现采取行动。OpenAI还计划测试其在软件和机器学习工程师工作方面的能力。

安娜·唐(Anna Tong)旧金山报道,凯蒂·保罗(Katie Paul)纽约报道;Ken Li和Claudia Parsons编辑。2024年版权。版权所有。本材料不得出版、广播、重写或重新分发。

本文来自作者[尔岚]投稿,不代表qgxnj号立场,如若转载,请注明出处:https://blog.qgxnj.cn/zskp/202507-1073.html

(2)

文章推荐

  • 美国计划打造新型“末日飞机”

    法新社/美国空军宣布,美国将研制一种新的“末日飞机”,以便在发生核战争或其他重大灾难、摧毁地面指挥和控制中心的情况下,让总统继续领导国家。美国空军发言人周五在一份声明中宣布,内华达山脉公司获得了一份价值130亿美元的可生存机载作战中心(SAOC)项目合同。

    2025年07月04日
    4
  • 警方即将结束对Tam Spider儿子遭受欺凌事件的调查

      吉隆坡:两份与涉嫌欺侮摇滚歌手谭斯比儿子有关的调查文件正在最终确定。吉隆坡警察总长拿督拉斯迪莫哈末伊沙表示,总检察署(AGC)已指示重新评估和完成两份文件。另一份调查报告交由学校内部审查。“如果有新的进展,内部调查的决定可以重新考虑,”他在周六(10月12日)在吉隆坡警察总

    2025年07月07日
    4
  • 阿根廷总统候选人在决选前的辩论中面对不确定性

    作者:HernanNessi和LucindaElliott路透布宜诺斯艾利斯7月19日电---在没有明显赢家的情况下,阿根廷两名总统候选人周日在11月19日决选前的最后一场电视辩论中展开了激烈角逐。这将是一代人中最重要的选举周期之一。阿根廷

    2025年07月08日
    4
  • 马丁·多布尼在唐宁街抗议中遭误捕——“我说明我是记者”

    英国广播公司新闻主持人马丁·多布尼以记者身份出席唐宁街抗议活动时被错误逮捕。此前,在索斯波特,示威者向防暴警察投掷物品,导致三名儿童被刺身亡,随后在唐宁街门口爆发了骚乱。几百名抗议者高呼“统治不列颠尼亚”、“拯救我们的孩子”和“阻止船只”。

    2025年07月09日
    4
  • 厄瓜多尔犯罪暴力激增的背后原因是什么?

      近期,武装分子的袭击,尤其是在直播期间对电视台的大胆攻击,揭示了厄瓜多尔在最近一次显著越狱事件后暴力事件的不断升级。周日,一名贩毒团伙的头目神秘地从他在沿海城市瓜亚基尔的监狱中消失,促使政府宣布进入紧急状态。这

    2025年07月17日
    4
  • 理智的Hidankyo:日本核灾幸存者的坚定立场

      對田中terumiTanaka來說,1945年對長崎的原子彈轟炸被證明是他生命中的決定性時刻。他成為了今年意外獲得諾貝爾和平獎的“日本氫彈受害者組織聯合會”(NihonHidankyo)的核心人物。現年92歲的田中

    2025年07月26日
    4
  • 贝尔法斯特哈兰德与沃尔夫造船厂启动管理重组

      贝尔法斯特的哈兰德和沃尔夫造船厂宣布进入破产管理程序。临时执行主席拉塞尔•唐斯表示,由于历史性的亏损和未能获得长期融资,该集团正面临“极具挑战性的时期”。此举将影响约50至60名员工,主要是行政人员。该公司在贝尔法斯特、德文郡的

    2025年08月01日
    4
  • 苹果iPhone 16已在商店上架,但缺乏人工智能功能

      苹果公司于周五在约60个国家推出了iPhone16系列,但这款新手机并未完全售罄。一些分析师认为,市场对新手机的需求平平,主要是因为缺少一个重要的开箱即用功能:苹果公司大力宣传的人工智能功能。“iPhone16Pro系列需求低于预期的一个

    2025年08月02日
    5
  • 乔什·伯恩斯的八个有趣真相

    对在政坛掀起波澜的澳大利亚政客乔希·伯恩斯(JoshBurns)感到好奇吗?你来对地方了!代表澳大利亚工党的乔希·伯恩斯(JoshBurns)在澳大利亚政治舞台上的地位越来越重要。作为麦克纳马拉的成员,他从一个充满激情的社区倡导者到一个受人尊敬的立法者的旅程提供了一个引人注目

    2025年08月12日
    5
  • Navratri期间送礼或投资黄金?了解相关税务信息

      在节日期间交换礼物一直是印度不同节日不可或缺的一部分。多年来,黄金一直是投资和送礼的首选,尤其是在节日期间。在Navratri期间,礼物的文化重要性通常通过交换贵金属(如金和银)来体现。印度因其永恒的辉煌、天然的纯度和无与伦比的耐用性而高度尊重黄金。然而,在赠送或投资黄金之前,重要的是要考虑

    2025年08月13日
    1

发表回复

本站作者后才能评论

评论列表(4条)

  • 尔岚
    尔岚 2025年07月24日

    我是qgxnj号的签约作者“尔岚”!

  • 尔岚
    尔岚 2025年07月24日

    希望本篇文章《探索“草莓”:迈向具备思考能力的人工智能的起点》能对你有所帮助!

  • 尔岚
    尔岚 2025年07月24日

    本站[qgxnj号]内容主要涵盖:国足,欧洲杯,世界杯,篮球,欧冠,亚冠,英超,足球,综合体育

  • 尔岚
    尔岚 2025年07月24日

    本文概览:   有消息人士透露,ChatGPT的开发公司OpenAI正在进行一个名为“草莓”的新人工智能模型项目。 该项目的具体信息此前未曾披露,目前微软...

    联系我们

    邮件:qgxnj号@sina.com

    工作时间:周一至周五,9:30-18:30,节假日休息

    关注我们