-
讯飞刘庆峰:今天,中国的大模型底座能力到底怎么样?
发展中国通用人工智能,一定要有大模型的底座能力
在去年9月份发布的GPT-4V,OpenAI大模型在图文识别和理解分析能力上,上了一个大台阶,随后11月推出语音识别大模型Whisper,今年2月又推出了文生视频大模型Sora ,今年5月推出GPT-4o,看起来是一个又一个的热点,但实际上还是依托GPT-4的底层通用大模型能力。
以Sora为例,并不是外界所说的“对物理世界的认知进一步加强了”,而是通过GPT-4V的理解能力和生成能力,结合GPT-4V的“打标签”能力、传统的文生视频能力,用GPT方法做了重写,从而实现了Sora。本质上,与大模型在医疗领域做一个医疗专用模型,在教育领域做一个教育专用模型并没有本质差别,只要有算力、有数据,其实没有真正核心技术的壁垒。
我们要发展中国通用人工智能,整个产业一定要有大模型的底座能力,我们有很多人可以做专用系统,很多人可以做我刚才说的大模型所调用的各种专用的小系统。但是国家不能没有自主可控的通用大模型底座,这决定了我们本轮通用人工智能发展到底能走多远。我们这么热热闹闹的社会热点,这么多的投入,将来能不能真的走到红利兑现那一天,我觉得底座能力是至关重要的。
今天所有的企业一定要科学地认识到大模型能力的边界,我们可以举出很多成功的例子,也可以举出很多的坑、很多不行的地方,每一家都是如此,所以我们要给统计数据。比如医疗八十几分是什么概念,国家执业医师资格考试60分就可以通过了,我们要考协和医学院等分数最高的医学院,七十几分也就可以上了。大模型的能力并不是包治百病,并不是什么任务都能100%完成。但是可以大概把它分成这几块,一个是叫一般难度任务,用通用大模型底座就直接可做,比如说代码、文案、翻译这些,会用到文本生成、摘要这些能力,直接用底座就可以满足应用。
中等难度任务涉及了知识库、深度的客服,它需要定制优化后才能用,这一般来说必须要做SFT的专门优化,很多地方可以做到,现在在很多客服行业可以大幅提升效率。
还有很多高难度任务,比如说高难度数学推理、多阶的推理类的知识问答,以及开放域的通用智能体等,实际上是非常难的,需要更大的模型,还需要专门的算法去摸索,在这些领域中,它具有很强的不确定性。所以今天我们认清这个边界,每个企业就可以知道自己应该怎么去做。
实际上,今天企业要探讨的话题是我们怎么能用更少的算力、更高的效率来打造我们的专属模型和专属应用。我们企业可以拿通用底座来做自己的专用行业模型,一般来说一个月就可以上线,在底座能力上进一步提升。底座如果60分,专业模型可能会做到80分,然后有了专用的行业模型,每个企业或者企业的不同岗位,在针对私域的IT语料加上高质量的微调,又可以进一步提升,一周就可以完成。所以,我们现在希望与很多龙头企业打造行业模型,提供给行业内所有上下游公司。
若GPT-5发布,差距会有多大?
今天人工智能技术的发展绝不是一家公司可以把所有事情都做完的,在这个时代,做帝国注定要衰落,只有生态才能生生不息;必须是自主可控的繁荣生态,才有中国通用人工智能大未来。
我非常高兴地向大家报告,从今年1月30日讯飞星火V3.5发布以来,我们的开发者团队持续高速增长,目前已经增长到702万,这都是实名认证的开发者团队。海外开发者数量从34万增加到40万,大模型的直接相关开发者达到了57万,这些数据都还在快速增长中。
面向下一阶段的人工智能的发展,这一波通用人工智能浪潮,我们要打造新的生态。特别要关注到的,第一是源头技术生态。科大讯飞针对几百万开发者团队,我们希望只要有比较好的AI能力,不论是高校还是创业企业,都可以集成在我们的底层平台上,让几百万开发者团队都能够用起来。
过去18个月,用过我们人工智能能力的独立终端已经突破40亿。我们把源头技术生态打开来,让更多的英雄有用武之地。今天人工智能非常重要的一个特点是大平台加上英雄主义,所以我们把源头技术生态打开。智能体生态让无论是企业每个岗位的人,可以做自己岗位的助手,也可以做自己的个性化助手,做完以后都可以分享出来。在我们的平台上,我们将来会设计分享模式和商业机制,从而形成智能体的生态。只要你懂场景,只要你愿意自己去试,试完成功了,你就可以发布到我们的智能体生态上,让所有的一线洞察能力和经验成为整个商业体中的一环。还可以有应用生态,用原来的开发者生态来做各种应用,无论是创业,还是企业内部的应用。去年我们新增的几百万开发者团队中,有50%以上是企业应用。
最后行业生态是希望跟各个行业里面的龙头企业一道来打造整个行业模型,然后把这个行业模型提供给行业里面的生态伙伴来共享产业收益,目前我们已经和现在很多龙头企业在做这件事。
从源头智能体开发到行业生态,在推动的过程中,特别重要的是一定要底座技术的完全自主可控,否则可能我们就把大楼建在别人的院子里,建在沙滩上,随时会倒塌,要真正做到软硬件一体化,才能更深度地落地。
在这样大的发展过程中,我们一定要科学理性地认识到中美科技的综合差距。今天我们说讯飞星火V4.0对标GPT-4 turbo是全方位对标。但是我们同时要看到,一旦GPT-5发布,因为它的模型尺寸更大、训练时间更长、数据更多,又会把这个差距给拉开,甚至拉到一年以上。
当然,我们有信心快速追赶,而且是在完全国产算力自主可控算法和数据基础上来追赶,保证不出现代差,保证极限情况下,能够顶上扛上。我们既要认识到差距,又要有充分的信心,要能够科学理性地给出从源头技术、到生态、到产业应用落地的一整套打法,要以长期主义来打造真正自主可控的AI产业生态。
- 责任编辑: 沐梵 
-
专稿|任正非说的“盐碱地”,中国光伏的希望田野
2024-06-28 09:50 -
OpenAI终止对中国提供API服务,周鸿祎发声
2024-06-26 13:53 人工智能 -
首次!我国科学家实现猕猴全脑尺度神经活动监测
2024-06-25 18:20 科技前沿 -
习近平代表党中央、国务院和中央军委致电祝贺
2024-06-25 14:50 航空航天 -
专稿|不顾一切的脱钩:美国国会为何瞄准这家中国企业
2024-06-25 09:54 -
2023年度国家科学技术奖励名单公布
2024-06-24 17:46 -
“NASA和波音早就知道这个问题,但仍发射了火箭”
2024-06-24 16:23 -
李德仁、薛其坤获2023国家最高科技奖
2024-06-24 10:32 科技前沿 -
我国科研人员在月壤样本中首次发现天然石墨烯
2024-06-24 09:19 嫦娥奔月 -
我国重复使用运载火箭首次10公里级垂直起降飞行试验成功
2024-06-23 14:58 航空航天 -
纯度达99.9%!中国团队实现海上风电驱动海水制氢
2024-06-23 08:07 观察者头条 -
全球首台!这一重要装备研制成功
2024-06-22 13:09 中国精造 -
专稿丨鸿蒙与安卓彻底切割,未来胜算几何?
2024-06-21 19:35 华为 -
“加拿大决定跟,但也怕…”
2024-06-21 18:08 -
中国科学家发现治疗免疫性血小板减少症突破性新疗法
2024-06-21 07:27 -
2024世界人工智能大会7月4日开幕,特色亮点抢先看!
2024-06-20 16:00 2024世界人工智能大会 -
我国首个工业用途核能供汽项目正式建成投产
2024-06-19 15:17 能源战略 -
“千里眼”最大“角膜”:相当于把北京五环内地面平整到高低差小于1毫米
2024-06-19 09:10 中国精造 -
全球首台全高温超导托卡马克装置在上海建成运行
2024-06-19 08:15 -
“美国在核电技术上落后中国10-15年”
2024-06-18 16:42
相关推荐 -
爱泼斯坦烂账上还有这位西方“人权先生” 评论 0
美欧分崩离析,但至少还有这共识:旧世界秩序已死 评论 34
马克龙疾呼:我们是所有人的榜样,欧洲要自信! 评论 172
默茨翻旧账:美国想赶上中国,但这么搞弄巧成拙 评论 47
这个重要产业,美国确定对华下手 评论 98最新闻 Hot-
美国官方“开盒”:反对我的统统查社媒信息
-
谷爱凌发声后,BBC又来搞事情了
-
普京总统say no!
-
特朗普果然记仇了
-
叫特朗普爸爸?“好大儿”用流利英语辩解:我英语不好,没有恋父情结
-
马克龙疾呼:我们是所有人的榜样,欧洲要自信!
-
十几个欧洲领导人苦等,最后一刻人不来了…
-
默茨翻旧账:美国想赶上中国,但这么搞弄巧成拙
-
北约演习,乌军轻松“摧毁”英国旅
-
默茨“训斥”:德国人工作不够拼,请假太多
-
俄乌打了快4年,掏空家底的“欧公子”刚反应过来…
-
美欧分崩离析,但至少还有这共识:旧世界秩序已死
-
在委内瑞拉,美能源部长点名中俄伊
-
日方提醒渔民:别去,会被抓
-
最新进展:日本放人
-
祝爱泼斯坦在岛上“玩得开心”,印部长被要求辞职
-

观察员
上海市互联网违法与不良信息举报中心