-
中国大模型图鉴:深度解读《2023大模型落地应用案例集》
最后更新: 2023-12-31 09:12:2702. 大模型应用拐点已至
图灵奖获得者Yann LeCun说过:AI大模型的技术都是公开的,算不上底层技术上的创新,如果你愿意一探究竟的话,可以发现它背后没有任何秘密可言。
但借着这些“过时”的技术,在中国拥有庞大的人才基数和数据集的情况下,可以发展出更适合本土环境和语境的大模型。
那么如何形象理解大模型?前科技部长王志刚从高维度表示,大模型,就是大数据、大算力、强算法。形象一些:大模型事实上就是算法、数据、算力上的有效结合。传统巨头在大模型领域的技术投入普遍都是在积极防御,而中国企业在非常积极地推动向应用中的落地。
目前,业界除了把AI大模型商业落地模式统分为 toB 和 toC之外,在市场划分上则遵循通用与垂直两大路径,两者在参数级别、应用场景等方面差异正在显性化。
通用大模型往往是指具备处理多种不同类型任务的AI模型,这些模型通常是通过大规模的数据训练而成,能够在多个领域和应用中表现出良好的效能。大家耳熟能详的几个通用大模型均来财力雄厚的企业:
1.书生浦语开源大模型:由上海人工智能实验室研发,涵盖 70 亿参数的轻量级版本 InternLM-7B,以及 200 亿参数的中量级版本和 InternLM-20B,以及完整的开源工具链体系。InternLM-7B 在包含 40 个评测集的全维度评测中展现出卓越且平衡的性能,它在两个被广泛采用的基准 MMLU 和 CEval 上分别取得了 50.8 和 52.8 的高分,开源一度刷新了 7B 量级模型的纪录。
2.昆仑万维天工大模型:“天工”是一个 AI 搜索引擎,一个对话式 AI 助手。“天工”拥有强大的自然语言处理和智能交互能力,能够实现个性化 AI 搜索、智能问答、聊天互动、文本生成、编写代码、语言翻译等多种应用场景并且具有丰富的知识储备,涵盖科学、技术、文化、艺术、历史等领域。
3.通义千问 2.0:由阿里云研发的超大规模的语言模型,具备多轮对话、文案创作、逻辑推理、多模态理解、多语言支持等功能。通义千问 2.0 在复杂指令理解、文学创作、通用数学、知识记忆、幻觉抵御等能力上均比上代有显著提升。
4.MiniMax-abab:由科技创业公司MiniMax研发。据悉,“Max-abab”是文本、语音、视觉三模态的千亿参数大语言模型,在中、英文服务领域均已超过GPT-3.5 的水平。今年8月份,“MiniMax-abab”大模型通过了国家首批大模型服务备案,面向社会公众提供服务。
5.言犀基础大模型:由京东科技研发,该模型融合了70%的通用数据和30%的数智供应链原生数据,具有更高的产业属性。
6.百灵语言大模型:由蚂蚁集团基于Transfromer架构研发。该模型基于万亿级Token语料训练而成,支持窗口长度达32K,在主流推理类榜单中排名前列。据悉,蚂蚁百灵大模型已完成备案,基于百灵大模型的多款产品已陆续完成内测,正陆续向公众开放。
通用大模型示例,数据来自:《2023大模型落地应用案例集》
这些通用大模型包含千亿甚至万亿参数,覆盖自然语言处理、图像识别、语音识别等方面的任务,已在知识问答、医疗咨询、娱乐领域、视频生成等数十个行业场景领域,展现出广阔的落地应用潜力。
与通用大模型相比,垂类大模型参数量相对较小。但是因为有一些行业的核心数据和业务系统的生产数据参与,所以在相应行业解决问题更为高效、直接。
从《案例集》来看,在金融、教育、医疗等领域,已经有不少公司发布了相应产品。
垂类大模型示例,数据来自:《2023大模型落地应用案例集》
根据《案例集》入选案例的应用场景,垂类大模型更针对于企业级应用场景的垂直性和专业性要求,而在模型部署层面,更少的模型参数、训练数据意味着更少的成本,因此垂直应用领域有望实现“万模齐发”。
《案例集》公布的名单,也恰恰验证了目前垂类大模型发展的一些趋势:
1. 加注端侧、边缘侧应用。轻量化参数能让手机助手接入AI大模型能力。目前已有案例包括OPPO的小布助手、华为的智能助手小艺等等。
2. 更倾向于“解决方案”式的交付方式。由于垂类大模型接受了大量特定领域的数据和知识,因此可以基于领域知识生成更具深度的解决方案。例如ChatDD 新一代对话式药物研发助手,面向游戏行业的图像内容生成式大模型等等。
3. 大模型开始向多模态领域发展。多模态意味着丰富的数据形式,包含视觉、听觉和时序信息。对于大模型模型来说,这意味着可以从多模态中提取和学习更多维度的信息。类似于《案例集》中的单晶炉自动化工艺识别多模态模型,相信未来将会出现更多。
4. “通用+垂直”模型互相融通的态势。随着AI技术的发展,不同类型的模型之间的界限变得越来越模糊。例如,一些通用模型开始整合垂直领域的知识,而一些垂直模型也开始利用通用模型的技术来增强其功能。例如百川大模型在娱乐领域的应用。
-
本文仅代表作者个人观点。
- 责任编辑: 史岱君 
-
“中国首艘、远超美日”,力争率先钻穿地壳
2023-12-29 15:42 科技前沿 -
陆地探测一号01组卫星正式投入使用
2023-12-29 13:57 航空航天 -
以军杀害3名人质前,误认为“求救声是哈马斯伏击”
2023-12-29 08:12 巴以恩仇录 -
我国学者首次建立从端粒到端粒的中国人全基因组
2023-12-29 07:44 -
能够拍摄天体“彩色纪录片”的巡天望远镜“梦飞”来了
2023-12-28 10:00 天文 -
面向太空的“超级CT”!最大空间环境地基监测网如何建成?
2023-12-27 18:17 -
我国单体规模最大漂浮式光伏电站并网发电
2023-12-27 15:31 科技前沿 -
把星光变成照片,墨子巡天望远镜运行百天获16500幅图像
2023-12-27 11:31 科技前沿 -
我国最新一代深远海一体化大型风电安装船试航
2023-12-27 08:29 -
全球首创!我国成功研制可注射溶栓纳米机器人
2023-12-26 10:28 科技前沿 -
几分钟成功复现诺奖成果!AI科研机器要来了?
2023-12-26 07:37 -
我国成功发射天目一号气象星座11~14星
2023-12-25 09:38 航空航天 -
逆转催化剂“熟化”,中国科学家用新思路实现突破
2023-12-23 17:46 科技前沿 -
华为云CTO:云原生与AI叠加,将带来七大技术“跃迁”
2023-12-23 10:16 观网财经-科创 -
美驻华大使称“中国没打算合作”,国家航天局发声
2023-12-22 10:04 中美关系 -
祝贺!神舟十七号航天员乘组圆满完成第一次出舱活动
2023-12-21 21:56 航空航天 -
续集?“发现LK-99存在超导相的明确证据”
2023-12-21 09:39 -
2023全球十大工程:ChatGPT、中国空间站、鸿蒙…
2023-12-20 11:40 科技前沿 -
我国科学家开创新理论,研发出超薄高能效光学晶体
2023-12-19 14:44 -
应对AI安全风险,OpenAI要搞分级
2023-12-19 11:56 人工智能
相关推荐 -
“照你说的,我们是输给中国了吧?”,她被问住了 评论 41联大通过涉巴勒斯坦“入联”决议 评论 337“对于联大第2758号决议,美国只有严格遵守的义务” 评论 210与匈牙利关系升级!中国的“朋友圈”还有哪些布局? 评论 125美又对37家中国实体下黑手,中方:将采取必要措施 评论 457最新闻 Hot
-
她被问住:照你说的,我们是输给中国了吧
-
“西班牙、爱尔兰等国本月承认巴勒斯坦,后续还有更多”
-
联大通过涉巴勒斯坦“入联”决议
-
“电动汽车关税将升至100%,还要对医疗器械下手”
-
美国认了,又没认…
-
“美国想玩权游,中国会反击”
-
最后一天,印度从马尔代夫全部撤军
-
美欲对中国联网车下手,韩国又紧张了
-
为对付中国,他称美国得向印度取经
-
他向美媒“告洋状”,想蹭乌克兰却忘了……
-
乌克兰称俄军可能在北部开辟新战线
-
拜登都承认了,“布林肯报告仍将嘴硬”
-
“韩国得自卫,不然美军赢不了中国”
-
“对于联大第2758号决议,美国只有严格遵守的义务”
-
上万人抗议以色列,她也现身了
-
美议员举例广岛长崎支持向以供武,日外相:不可接受
-