-
百度版ChatGPT“文心一言”亮相,李彦宏:发展远未完善、进步空间很大
最后更新: 2023-03-16 18:36:53(文/吕栋 贺喜格)
在OpenAI推出大模型GPT-4一天后,百度官宣已久的类ChatGPT产品“文心一言”也终于公开露面,并且和GPT-4一样是多模态。
北京时间3月16日下午,百度召开发布会,主题围绕新一代大语言模型、生成式AI产品“文心一言”。
观察者网在现场看到,百度首席执行官李彦宏和百度首席技术官王海峰均出席了发布会,并在现场展示了“文心一言”在文学创作、商业文案创作、数理推算、中文理解、多模态生成五个使用场景中的综合能力。
在现场,李彦宏用录好的视频进行了演示。
从展示案例来看,“文心一言”某种程度上具有了对人类意图的理解能力。但李彦宏也多次提及,这类大语言模型还远未到发展完善的阶段,进步空间很大,未来这段时间它一定会飞速发展。
观察者网从现场了解到,此次“文心一言”公开亮相后,并不会直接面向公众推出,而是先采用邀请测试方案。从3月16日起,首批用户可通过邀请测试码,在官网体验产品,后续才会陆续开放给更多用户。
那么,百度为何甘冒风险,略显仓促地推出“文心一言”呢?这一方面可能是为了抢得对标ChatGPT的头筹,获得更多用户以训练大语言模型,另一方面则可能考虑到内外部的需求。
李彦宏在现场表示:“在全球的大厂中,百度是第一个做出对标ChatGPT的产品的企业。虽然‘文心一言’的内测体验不能称作完美,但为什么现在发布呢?是因为百度的各个产品现都在等着这样的产品,我们的客户和合作伙伴也在等着这样的技术。”
在此次发布会之前,有外媒援引知情人士称,为了开发“文心一言”,数百名百度员工一直在夜以继日地工作。甚至在正式发布前夕,“文心一言”基于的AI模型仍在接受数据训练。一些员工坦言,他们没有足够的时间来打造一款功能完善的产品。
根据百度方面的披露,“文心一言”大模型的训练数据包括万亿级网页数据、数十亿的搜索数据和图片数据、百亿级的语音日均调用数据,以及5500亿事实的知识图谱等。
那这次通过视频亮相的“文心一言”表现如何呢?在现场,李彦宏展示了“文心一言”在五个使用场景的表现,包括文学创作、商业文案创作、数理推算、中文理解和多模态生成。
以文学创作场景为例,“文心一言”根据对话问题将《三体》的核心内容进行了总结,并提出了五个续写《三体》的建议角度,体现出对话问答、总结分析、内容创作生成的综合能力。商业文案创作场景中,文心一言顺利完成了给公司起名、写Slogan、写新闻稿的创作任务。
在数理推算场景中,“文心一言”能够学会数学推演及逻辑推理等相对复杂任务。面对“鸡兔同笼”这类锻炼人类逻辑思维的经典题,文心一言能理解题意,并有正确的解题思路,进而像学生做题一样,按正确的步骤,一步步算出正确答案。
作为扎根于中国市场的大语言模型,文心一言在中文语言和中国文化上,相比国外的大模型产品无疑会有更好的表现。在现场展示中,文心一言正确解释了成语“洛阳纸贵”的含义、“洛阳纸贵”对应的经济学理论,还用“洛阳纸贵”四个字创作了一首藏头诗。
昨日(3月15日),OpenAI发布多模态模型GPT-4,可接收图像和文本输入来输出文本内容,受到外界关注,而文心一言本次发布的版本同样具备多模态功能,支持文本、图片、音频、视频生成。
在更体现技术能力的多模态生成方面,李彦宏现场展示了“文心一言”生成文本、图片、音频和视频的能力。有趣的是,“文心一言”甚至能够生成四川话等方言语音;“文心一言”的视频生成能力则因成本较高,现阶段还未对所有用户开放,未来会逐步接入。
从“文心一言”的表现看,某种程度上它具有了对人类意图的理解能力,回答的准确性、逻辑性、流畅性都逐渐接近人类水平。但整体而言,这类大语言模型还远未到发展完善的阶段,有赖于通过真实的用户反馈而逐步迭代。
王海峰表示,文心一言,是新一代知识增强大语言模型,是在ERNIE及PLATO系列模型的基础上研发的。它的关键技术包括有监督精调、人类反馈的强化学习、提示、知识增强、检索增强和对话增强。
前三项是这类大语言模型都会采用的技术,ERNIE和PLATO中也已经有应用和积累,在文心一言中又有了进一步强化和打磨;后三项则是百度已有技术优势的再创新。
多年来,百度大语言模型上投入积极,有市场数据显示,百度研发的50%-60%的投入都给到了Ernie。
近日有外媒援引知情人士称,随着ChatGPT热度上升,今年1月初,百度高管让其自然语言处理团队开始用文心大模型整合出一款对标ChatGPT的产品。但前述知情人士表示,与其他从事类ChatGPT技术的AI开发者所遇到的情况一样,这一项目面临一些挑战。
其中一个挑战是,需要训练该模型对有多种释义的短语或可指代多人的名字进行辨别,从而能对用户的要求做出更精确的反应。另一个挑战是使该聊天机器人生成的语言看起来更像人类说的话。第三个挑战是提高事实准确性,这是大语言模型的一个技术限制;大语言模型会根据不同词语可能出现在一起的概率将句子串起来,而不是根据信息片段。这种限制也使得这种模型难以控制以避免敏感话题。
“文心一言”的真实水平如何,还有待观察百度后续推出的公测版本。据百度披露,自2月份该公司官宣“文心一言”以来,已有超过650家企业宣布接入文心一言生态。
有市场观点指出,百度之所以没有迅速开放公测,一方面是因为产品尚未成熟,另一方面可能也是出于成本和收入考虑。之前有估算称,ChatGPT每天成本消耗有超过10万美元。来自摩根士丹利的分析师估计,ChatGPT每次查询的成本大约是谷歌传统搜索查询成本的七倍。
在本次发布会上,李彦宏表示:“无论哪家公司,都不可能靠突击几个月就能做出这样的大语言模型。深度学习、自然语言处理,需要多年坚持和积累,没法速成。”他同时提到,如果建立起真实用户反馈、开发者调用和模型迭代之间的飞轮,“文心一言”效果会迅速提升。
本文系观察者网独家稿件,未经授权,不得转载。
- 责任编辑: 贺喜格 
-
华之杰转战主板IPO,科创属性曾被质疑
2023-03-16 17:21 观网财经-金融 -
每16个中国人中就有1位残障人士,街道上为何很少看到他们?
2023-03-16 16:51 观网财经-科创 -
外交部:美方迄今未能证明TikTok威胁其国家安全
2023-03-16 16:20 观网财经-海外 -
日本2月贸易逆差8977亿日元,连续19个月逆差
2023-03-16 14:55 日本 -
威尔仕健身就“转卡理财”致歉:下月起会籍年限不得超过15年
2023-03-16 12:07 315维权 -
车市价格战愈演愈烈,吉利、北汽“参战”
2023-03-16 10:53 -
被曝后厨乱象,网红西餐厅蓝蛙致歉
2023-03-16 10:52 315维权 -
2月70城房价:商品住宅售价环比总体上涨
2023-03-16 10:02 观网财经-房产 -
欧美银行股遭巨量抛售,新的“雷曼时刻”要来了?
2023-03-16 09:48 观网财经-金融 -
六连降!中国对美国债持仓规模连续10月低于1万亿美元
2023-03-16 09:29 美国经济 -
全国12315平台上线以来,为消费者挽回经济损失144.72亿
2023-03-16 08:36 -
我担心发展中国家会出现类似1998年亚洲金融危机
2023-03-16 07:53 -
美国财政部公布1月国际资本流动报告
2023-03-16 07:35 -
用比特币还债被判无效,法院:不具有法偿性
2023-03-16 07:35 疯狂比特币 -
关于2022年国民经济和社会发展计划执行情况与2023年草案的报告
2023-03-16 07:21 2023两会 -
中沙首笔人民币贷款合作,会影响什么?
2023-03-16 07:11 观网财经-海外 -
关于2022年中央和地方预算执行情况与2023年草案的报告
2023-03-16 07:11 2023两会 -
315晚会第一枪:这些“泰国香米”竟是香精勾兑而来
2023-03-15 20:18 食品安全 -
我国成功发射试验十九号卫星
2023-03-15 20:16 航空航天 -
杨紫琼奥斯卡“封后”马来西亚放假一天?梦一场
2023-03-15 15:29
相关推荐 -
石破茂都不敢提了,他又开始拱火:搞“经济北约” 评论 52“中国同意了,能赶上春节” 评论 175德国今年怕是又要当“欧洲病夫” 评论 91欧洲议会爆激烈交锋,欧尔班:对华加税损人不利己 评论 215与澳合作开发停滞多年,他不忍了:已找中企商谈 评论 55最新闻 Hot
-
石破茂都不敢提了,他又开始拱火:搞“经济北约”
-
外媒炒作“A股遭遇27年来最严重跌幅”,太心急了吧
-
“中国同意了,能赶上春节”
-
欧洲议会爆激烈交锋,欧尔班:对华加税损人不利己
-
关键里程碑!“中国又一领域缩小与西方差距”
-
《天佑美国圣经》,原来是在中国印刷的
-
她激怒俄方:不可接受!
-
飞行员执飞航班时死亡,紧急迫降
-
“谈到中国,他态度明显不那么强硬了”
-
与澳合作开发停滞多年,他不忍了:已找中企商谈
-
克宫、特朗普均否认
-
拆分谷歌,美国司法部要打响四十年来“第一枪”?
-
“重启中英关系,他俩都打算访华”
-
时隔近50天,他俩终于要通上话了
-
彻底急眼!“240多家酒商该筹钱给中国交保证金了”
-
墨西哥希望美国公司帮忙减少对华依赖,但...
-