OpenAI首席执行官山姆·奥尔特曼周二宣布,公司将在未来几天里带来许多新东西 ,其中周二会迎来一项“小而重磅”的更新——预热已久的开源模型GPT-OSS。
简单而言,OpenAI周二共发布两款开放权重AI推理模型 。其中参数量达到1170亿的gpt-oss-120b能力更强,可以由单个英伟达专业数据中心GPU驱动;参数量210亿的gpt-oss-20b模型 ,则能够在配备16GB内存的消费级笔记本电脑上运行。
虽然公司名字叫OpenAI,但这已经是2019年的GPT-2后,这家AI初创公司时隔6年首度推出开源模型。在今年1月DeepSeek引爆开源AI风暴后 ,奥尔特曼曾认错称OpenAI在开源技术方面“站在了历史的错误一边 ”,这正是OpenAI重新推出开源模型的原因 。
两款模型都以宽松的Apache 2.0许可证发布,企业在商用前无需付费或获得许可。
就模型性能而言 ,GPT-OSS大致位于开源模型的第一梯队,但整体略逊于自家的GPT-o3和o4-mini。
例如在Codeforces(带工具)的编程测试中,gpt-oss-120b和gpt-oss-20b的“跑分”分别为2622和2516分,虽然高于一些头部开源模型 ,但依然比不过头部闭源推理模型 。
类似的情况也发生在“人类最后的考试”测试中,两款开源模型的得分分别为19%和17.3%,同样比不过o3。
与闭源模型类似 ,两款开放模型都采用了混合专家(MoE)技术,处理问题时只会激活较少的参数。对于1170亿参数量的gpt-oss-120b,处理每一个token时仅激活51亿个参数 。
值得注意的是 ,相较o3和o4-mini模型,两款开放模型也会出现更多的幻觉。OpenAI解释称,由于较小的模型拥有的世界知识比大型前沿模型少 ,所以更容易产生幻觉也在意料之中。在OpenAI内部用于衡量模型对人物知识准确性的PersonQA基准测试中,gpt-oss-120b和gpt-oss-20b分别对49%和53%的问题产生幻觉,达到o1模型的3倍多 ,也高于o4-mini模型的36%。
顺便一提,作为毫无惊喜的预告,奥尔特曼同时强调本周晚些时候会有一项“重大更新 ” 。鉴于公司这段日子不断吊业界胃口的举动,市场普遍预期OpenAI下一个重磅更新将是推出GPT-5。
(文章来源:财联社)
股票平台杠杆:股票配资穿仓-AI医疗重磅!华为+瑞金医院宣布 开源核心模型 概念股曝光
买股票可以杠杆的app:上海股票配资-从“看三年”到“看五年” ROE考核周期再度拉长对险资入市影响几何?
股票配资平台下载:十大炒股杠杆平台哪个好-地产股爆发!A股港股房企集体飙升 机构称政策预期升温
场外配资公司:买股票可以杠杆的app-餐饮商家单店补贴最高5万元!美团打响“反内卷”新战役 淘宝闪购、京东如何应对?
股票杠杆平台app:个人场外配资-暴涨后“腰斩” VLCC日租金回归季节性震荡
股市杠杆配资:股票配资机构-经济日报:“人工智能+”会取代“互联网+”吗?
淘配网配资提示:文章来自网络,不代表本站观点。
概伦电子4月11日晚间公告,公司拟通过发行股份及支付现金的方式购买成都锐成芯微科技股份有限公司100%股权及纳能微电子(...
界面新闻记者| 杜萌4月12日,景顺长城基金发布四则基金经理变动公告,鲍无可在管的景顺长城价值稳进三年...
宏观要闻外交部回应中方宣布对加拿大部分产品加税据《北京日报》客户端消息,商务部3月8日公布就加拿大对华相...
布伦特原油自2021年2月以来首次跌破60美元,日内大跌近5%,现报59.8美元/桶。WTI原油期货跌幅扩大至5%,报5...
4月10日至11日,2025中国移动云智算大会在苏州盛大举行。本次大会由中国移动通信集团主办,以“由云向智 共绘算网新生...