-
OpenAI推出GPT-4o mini,号称“最具成本效益的小模型”
最后更新: 2024-07-19 11:44:46
美东时间7月18日,OpenAI推出GPT-4o mini,并声称这是“最具成本效益的小型模型”。GPT-4o mini预计将通过让智能变得更加实惠,显著扩大使用AI构建的应用程序范围。
据OpenAI发布的消息,GPT-4o mini在MMLU(大规模多任务语言理解,衡量模型广泛的世界知识和解决问题的能力)上的得分为82%,比另外两款低成本竞品更高——Google的Gemini Flash得分为77.9%,Anthropic的Claude Haiku得分为73.8%。目前,GPT-4o mini在LMSYS排行榜上的聊天偏好方面优于GPT-4.
GPT-4o mini已经在几个关键基准上进行了评估,涉及文本和视觉的推理任务、数学推理和编码任务、多模态推理,结果均优于其他小型模型。
各种评估基准下的模型评估分数OpenAI官方网站
GPT-4o mini还在API中支持文本和视觉功能,未来还将支持文本、图像、视频和音频的输入和输出,并且拥有截至2023年10月的知识。得益于与GPT-4o共享的改进的tokenizer(编译器),GPT-4o mini处理非英语文本方面也更具成本效益。
GPT-4o mini成本更低、延迟更低,能够完成更多的任务,例如调用多个API(应用程序编程接口)、传递和记录大量完整的代码库或对话记录、更快速、实时地与使用者聊天等。
作为模型开发过程的一部分,OpenAI 已经与一些值得信赖的合作伙伴合作,以更好地了解GPT-4o mini的使用场景和局限性。目前已与Ramp和超人等公司进行了合作,反馈发现在执行从收据文件中提取结构化数据或在提供线程历史记录时生成高质量电子邮件响应等任务时,GPT-4o mini的表现明显优于GPT-3.5 Turbo。
考虑到价格因素,轻量化且廉价的“小而精”AI模型可能更受企业欢迎,小模型的相关开发竞争激烈。谈及为何没有更早地推出“小而精”的模型时,OpenAI的API产品负责人Olivier Godement说,“我们的使命是使用最前沿技术,构建最强大、最有用的应用程序,我们当然希望继续做前沿模型,推动技术进步……但我们也希望拥有最好的小模型,我认为它会非常受欢迎。”
OpenAI称,开发过程中的每一步都考虑了安全性。开发时会过滤掉仇恨言论、色情信息、个人隐私信息等不宜模型学习和输出的内容,并采用自动和人工(超过70位来自社会心理学和错误信息等领域的外部专家)对模型进行了评估,以识别潜在风险。GPT-4o mini是第一个应用指令层次结构的模型,有助于提高模型抵抗越狱、即时注入和系统即时提取的能力,这使得模型的响应更加可靠,并有助于使其在大规模应用中更安全地使用。
自2022年推出功能较弱的模型text-davinci-003以来,GPT-4o mini的每token成本已下降99%。GPT-4o mini定价比之前的Frontier型号便宜一个数量级,比GPT-3.5Turbo便宜60%以上。在ChatGPT中,免费版、Plus版和团队版用户已经能够使用GPT-4o mini替代GPT-3.5,企业用户也将从下周开始使用。
本文系观察者网独家稿件,未经授权,不得转载。
- 责任编辑: 李亚丽 
-
被欧盟法院裁定为“守门人”,字节跳动:失望
2024-07-18 17:54 观网财经-互联网 -
去年亏损近40亿元,东风汽车集团仍难回归A股
2024-07-18 17:22 观出行 产业新闻 -
开售3个月,华为Pura70官宣降价
2024-07-18 13:32 观网财经-科创 -
20多座高铁站“闲置”,还有救吗?
2024-07-18 13:28 高铁世纪 -
“实现中国式现代化,需要三大区域共挑大梁”
2024-07-18 11:36 中国经济 -
陈文玲:开放就是最大的改革
2024-07-18 10:33 2024中国经济季度观察 -
陈文玲:这是中国在大国竞争博弈中的底气
2024-07-18 10:33 2024中国经济季度观察 -
香港消委会就农夫山泉事件致歉
2024-07-18 09:22 观网财经-消费 -
饮用水跌回“1元时代”
2024-07-18 07:34 观网财经-消费 -
31省份上半年人均可支配收入:10省份超两万元
2024-07-17 20:20 观网财经-宏观 -
管涛:人民币国际化加速的原因是……?
2024-07-17 18:14 中国经济 -
普华永道将裁掉一半在中国的金融审计员工?回应称,调整是艰难的决定
2024-07-17 17:29 金融观察 -
中国大陆发力成熟芯片,连续占据光刻机巨头半数营收
2024-07-17 15:41 观网财经-科创 -
中国经济发展有独门法宝
2024-07-17 15:34 2024中国经济季度观察 -
杨建文:产业层面要能够推出“新新三样”
2024-07-17 15:22 2024中国经济季度观察 -
财政部拟再发总额550亿元超长期特别国债
2024-07-17 15:20 金融观察 -
“如果让购房者感受到,之后再也没有这么低的按揭利率…”
2024-07-17 13:50 观网财经-房产 -
连平:房地产企稳将是重要的积极信号
2024-07-17 13:40 2024中国经济季度观察 -
特朗普称台湾应交“保护费”,台积电应声大跌超2%
2024-07-17 11:47 特朗普 -
一夜之间,黄金价格再创新高!有人一次下单近20万元金条
2024-07-17 09:57 黄金游戏
相关推荐 -
普京访印:美国都在买,印度凭啥不能买? 评论 1
日本开发稀土担心中国干扰?日防相放话 评论 96
“美欧抢矿,遭殃的却是他们” 评论 10
美国又开炮欧盟:你们在“霸凌”美国军工! 评论 68
时代变了,“欧洲人迫切想要中国技术” 评论 202最新闻 Hot-
日本开发稀土担心中国干扰?日防相放话
-
“按下葫芦浮起瓢”,英伟达想重返中国市场又难了…
-
“特朗普高兴太早咯,中国把枪放进枪套,但枪还在手上”
-
又出狂言,“加墨不能成为中国出口中心…”
-
“美欧抢矿,遭殃的却是他们”
-
“今年就当广告时间,等英国接任后我们再回归”
-
美国又开炮欧盟:你们在“霸凌”美国军工!
-
“不要惊醒‘美洲豹’”
-
土耳其急了:别碰能源设施!
-
时代变了,“欧洲人迫切想要中国技术”
-
“原来特朗普对中国做这么多”,某些美国鹰派急眼了
-
17年来最低,“好感急剧恶化”
-
韩国入境系统标示“中国台湾”,民进党当局破防
-
“在美欧闻了一鼻子尾气,才反应过来:中国早没这味了”
-
中企在非遭800亿美元天价索赔,BBC老毛病又犯了
-
俄乌冲突后普京首次来访,印“外交钢丝”还能走多久?
-

观察员
上海市互联网违法与不良信息举报中心