-
阶跃开源Step 3.7 Flash:面向生产级Agent,最高生成速度每秒400 tokens
(文/陈济深 编辑/张广凯)
5月29日,基础大模型创业公司阶跃星辰(StepFun)发布并开源新一代Flash模型Step 3.7 Flash。这是一款专为生产级Agent打造的模型,官方称其目标是在速度、成本、可靠执行和复杂任务处理能力之间取得更好的平衡。
随着Agent从演示阶段走向企业真实的生产环境,对基础模型的要求也在发生变化。模型不仅要能回答问题,还要理解复杂输入、主动搜索信息、稳定调用工具,并在多轮长程任务中保持执行的一致性。阶跃星辰表示,模型能力的评价标准正从单纯追求智能水平,转向兼顾效率、可靠性与规模化部署能力,Step 3.7 Flash正是面向这一需求设计。
根据官方介绍,Step 3.7 Flash采用稀疏MoE架构,总参数为196B加上1.8B的ViT,每次推理激活参数约11B,最高生成速度可达每秒400个token,支持256k上下文,并提供低、中、高三档推理级别,便于开发者在响应速度、token成本和能力之间按需平衡。较低的激活参数和较高的生成速度,使其适合高频、多轮的Agent调用场景。
在能力上,模型针对生产级Agent的需求做了多项优化。它支持原生多模态理解,能够直接处理UI界面、图表、文档、图片以及各类应用界面,并将复杂的视觉信息转化为结构化结果和可执行任务;在信息不确定时,还能主动发起联网与视觉搜索进行交叉验证。在生产级Agent最看重的工具调用可靠性上,Step 3.7 Flash做了针对性优化,可在长程多轮工作流中稳定调用API、浏览器、终端、Office工具等,降低跑偏和执行失败的风险。
官方公布的基准测试显示,Step 3.7 Flash在SimpleVQA (with Tool)、V* (with Python)等复杂视觉任务上的表现接近规模更大的旗舰模型;在考察多工具协同的Toolathlon上得分49.5%,在考察真实环境下日常自主任务执行的ClawEval-1.1上达到67.1%,在横跨44种职业的GDPval上达到45.8%,在τ²-bench Telecom的低、中、高三档推理难度下通过率均超过98%。
阶跃还对主流Agent框架和工具调用协议做了兼容优化,可稳定接入Claude Code、OpenClaw、Hermes Agent、KiloCode、RooCode、OpenCode等主流Coding与Agent工具,并支持MCP、Skills等协议,云端部署与本地部署均可使用,以降低开发者的接入和工作流编排成本。观察者网实测阶跃模型发现,输入"做一份美伊局势的分析PPT"这样一句话,系统便并行生成了四个不同风格、不同配色的版本,每个版本都是六到八页的完整成稿,单个版本的生成耗时在数十秒量级,直观体现了高生成速度在批量、连续出活场景下的作用。
这是阶跃在Flash系列上的延续。今年2月开源的上一代Step 3.5 Flash,将预训练权重、中训练权重以及配套的Steptron训练框架全链路开源,上线一个月即登顶OpenRouter平台OpenClaw(被开发者称作"小龙虾")调用量月榜全球第一,在HuggingFace上的下载量超过30万。
面向Agent的高效模型正在成为各厂商竞争的新焦点。本月19日的Google I/O上,谷歌发布Gemini 3.5 Flash,称其在编程和Agent基准上超过上一代旗舰Gemini 3.1 Pro,输出速度为同级前沿模型的四倍。与谷歌Gemini 3.5 Flash、Anthropic Claude Haiku等走闭源API路线的同类模型不同,阶跃将Step 3.7 Flash连同模型权重一并开源,开发者可以自行部署和调整。业内人士认为,Flash类模型的角色正在转变,从单纯的轻量替代品,逐步成为支撑生产级Agent规模化落地的基础设施。
阶跃星辰表示,后续将围绕Step 3.7 Flash推出生态共建计划和生态伙伴限时体验活动,与开发者共同探索Agent效率的评估方式、工程实践和生产化路径。
公开资料显示,阶跃星辰成立于2023年,CEO为姜大昕,董事长为旷视科技联合创始人印奇。印奇去年加入后,公司将战略锚定在"AI+终端"上,收入采取端侧按License收费、云侧按消耗计费的模式。其模型已作为系统级能力预装进OPPO、荣耀等手机厂商的设备,总装机量超过4200万台,目前公司正推进港股上市。
- 责任编辑: 陈济深 
-
-
台积电领先10年?黄仁勋误读了华为韬定律
2026-05-29 12:09 观网财经-科创 -
柠季洽谈收购哈根达斯
2026-05-29 12:07 观网财经-消费 -
“这是中国战略要务,欧盟改不了”
2026-05-29 11:41 欧洲乱局 -
“厂长杀手”的二十年:中国离子注入机集体突围
2026-05-28 22:45 观察者头条 -
把伯牙绝弦冻成一勺Gelato,霸王茶姬在赌什么
2026-05-28 21:58 观网财经-消费 -
6家企业获评我国首批产品碳足迹标识认证证书
2026-05-28 18:54 观网财经-科创 -
十年喜马拉雅生物多样性守护,ESG正在成为自然堂的产业能力
2026-05-28 17:47 -
市场规模比白酒还大,足疗龙头华夏良子值得一个IPO吗?
2026-05-28 16:02 产业万象 -
美国掀起AI安全竞赛,外媒热议中国路线
2026-05-28 15:19 观网财经-科创 -
逻辑折叠不是传统3D封装,北大称EDA方向有关键进展
2026-05-28 13:52 观网财经-科创 -
双汇发布致歉声明!子公司猪肉林可霉素超标近38倍已流入超市
2026-05-28 13:36 -
5天通过聆讯,量贩零食是溜溜梅的蜜糖还是毒药?
2026-05-28 10:49 观网财经-消费 -
快手Q1:营收337亿元,可灵AI收入飙升超300%
2026-05-28 10:49 观网财经-互联网 -
小红书官宣获2026年世界杯持权转播权!104场赛事免费看
2026-05-28 10:43 观网财经-互联网 -
美大使泼脏水:小心中国,他们会渗透关键领域
2026-05-27 23:34 -
当英国无赖抢救最后一座高炉:不要紧张,时代真的变了
2026-05-27 21:56 产经 科创 -
科创板第二大IPO,长鑫科技首发过会
2026-05-27 17:25 观网财经-科创 -
美团发布“跑腿Skill”,接上各家AI的腿
2026-05-27 17:14 观网财经-互联网 -
低线城市消费更强?中国人口正在再分布
2026-05-27 16:55 观网财经-房产
相关推荐 -
美国紧盯,“首批中国产的到加拿大了” 评论 48
慢火一炖,国产长剧这回争了口气 评论 145
缸中之脑?美生物公司用“非生非死”的人脑测试药物 评论 269
加拿大总理:人民币上桌,我们能帮忙 评论 160
“厂长杀手”的二十年:中国离子注入机集体突围 评论 57最新闻 Hot-
对华强硬不惜“化疗”?“欧盟处境不妙”
-
贝佐斯火箭炸了 马斯克:搞这个很难的
-
特朗普如何让一个激进独立斗士变成“爱国者”
-
美国紧盯,“首批中国产的到加拿大了”
-
慢火一炖,国产长剧这回争了口气
-
宝莱坞傻眼,“官方警告:不得抨击中国”
-
“日元,全球最弱”
-
贝森特:国会需要修改法律,让特朗普肖像出现在美元上
-
63%不支持率!特朗普民调跌入“尼克松水门时刻”
-
接着挑拨,“都自以为从中国捞到甜头,比别人多”
-
缸中之脑?美生物公司用“非生非死”的人脑测试药物
-
画风迥异:印度一邦警员被黑帮搜身,另一邦警员拉嫌疑人游街
-
美“新格伦”火箭在发射台上爆炸
-
“这是中国战略要务,欧盟改不了”
-
还狡辩!“中国不了解真相,美国没施压…”
-
黄仁勋:原本不去,特朗普致电坚持让其上飞机
-

观察员
上海市互联网违法与不良信息举报中心