-
宋睿华:我们让AI造比喻句,她想到了爱情和中国足球
关键字: 人工智能爱情中国足球创作在人机对话的过程中,有时候会冷场,不知道从何说起。所以,我们进行了优化。当你关注小冰之后,小冰会尽量通过一些细节来拉近自己和用户的距离。可惜,这个人的头像被识别错了。这其实是技术上的一个错误,但却造成了一个有趣的效果。
当我们做小冰的时候,也曾经受到质疑:这样一个聊天工具有什么用?实际上,小冰可以对个体形成全天候陪伴,当用户有难以向他人倾诉的情绪的时候还可以向小冰倾诉,她可以跟你互动,同时还会保守秘密,不会跟别人嚼舌头。我们曾经有个用户和小冰的单次聊天时长达到29小时。
现在,在人机对话的设计中,很多项目做的是Task-oriented Conversation,也就是任务型对话,而我们设计的对话则是一种闲聊式的对话。任务型的各种东西是很有用,但人机对话有时候需要一种闲聊做铺垫,我们希望具体的对话过程像河流一样,可以流畅地流淌下去,中间也可以偶尔做任务,偶尔做知识支持。而且从小冰的用户需求角度看,大家对知识的索求非常少,几乎小于百分之一。
在做计算机的同行里,大家有一种传统认知是对话就应该是知识问答。但实际用户需要的未必是这样子的。他需要的可能就是陪伴与回应。在对话中,问答的相关性也越来越被淡化,“神回复”往往更能让大家莞尔一笑。于是,在小冰的程序里,我们会把对话标注为0、1、2,0是不相关,1是相关,2是神回复。在对话偶尔出现一些神回复的话,用户也会更愿意和AI聊下去。相反,如果每一个对话都是相关的,AI总是回复“呵呵”、“哈哈”,用户很难有长久的兴趣与之聊天。
在小冰里,如果你想要听歌的话,她不会像电子商务一样硬要给你推歌,而是说会提问“为什么我要推给你”,“为什么你要听这首歌”等等,来营造一种聊天的氛围。所以我们就做了一个理由的推荐。
其实很容易理解,就比如说我有一首歌叫《认真的雪》,以前大家把它收藏起来的时候会放到一个歌单里,给它起名叫“校园时光”、“我与经典”等等。这样就可以提供一定的信息。我们有一个用户是学生,可能因为他和小冰聊了这些事情,所以我们就给他设置了一个标签叫“学生”。我们希望通过一个序列,形成推荐的理由。
举一个具体的例子,我们算法的结果是周杰伦的《夜的第七章》这样一首歌,我们把它作为一个输入。因为这个用户以前跟小冰聊过音乐,所以就给他打了一个标签叫“音乐”,兼顾“音乐”和“学生”这两个标签,那么小冰推荐周杰伦的《夜的第七章》的时候,就会说:“这首歌是我们学校的下课铃。”这样子的推荐理由,可能会更吸引用户去点击。实验证明也的确如此。
另一部分,我们其实又向前走了一步。除了小冰,我们还希望能够帮我们的客户去做其他的IP。比如,在网上有一部流行的小说叫《全职高手》,它里面有五个人物。我们期望通过专业的技术处理,塑造五个不同的人物性格。这里面有个比较关键的技术叫做Attitude detection,就是态度的检测。比如下面这组例子:
一个人问:“《瓦尔登湖》好看吗?”
第二个人说:“真心读不懂。”
从这组问答可以看出答复者对《瓦尔登湖》持负面态度。
第二组对话,一个人问的是:“有什么新歌推荐吗?”另一个人回答:“《追光者》。”
那么你就会发现这个回答者对于《追光者》持有的是正面态度。
在以往的工作中,很多时候做这种情感色彩分析是基于较长文本的分析。但是我们做对话的时候发现,人们对话往往是很简短的。说话者给出的信息可能是片段的,而听者需要把相关的信息补全,这样才能形成对对话的完整理解。所以我们就通过一系列技术处理进行分析。其中,有一个比较成熟的模型叫指针网络,目的是预测某个问题的答案到底从哪儿开始,到哪儿结束。它具体预测了两个指针,而我们刚好也是要在问答串里头知道说话者的目标起点和终点。当然,这其中也涉及到联合优化的内容。
接下来进入比较重点的部分——人工智能创造。这也是小冰率先提出的一个概念。诗歌创作历史悠久,但这本书某种意义上说是人类历史上第一本百分之百由人工智能创作的诗集,它叫《阳光失了玻璃窗》。
当我拿到这本书的时候,我很好奇书名是谁起的,后来市场部的经理告诉我,这个就是小冰起的!我们其实提供了很多小冰写的诗句给合作方,合作方的编辑最终选择了这一句作为书名。
在书出版之前,我们市场团队的同事还灵机一动,把小冰的诗匿名投稿到了一些诗歌杂志,后来竟然还被录用了。对方在要准备寻找作者打款的时候才知道这是人工智能写的诗。后来,我们还到很多论坛上匿名发布了小冰的诗,网友会为她指点,有的还会说“你发到这儿浪费了,为什么不去投稿”。所以,人们其实都没发现这是人工智能写的诗。
小冰是怎样写诗的呢?
比如这里有一个非常普通的时代广场的照片,小冰接受了图像之后就会写道:
像每一座城市愧对乡村,
我才有一个美好的完成,
每个失眠的夜晚我是一个花言巧语的人,
隐匿在灵魂最迷失的火,
绕出城市的边缘,
美好的,在风里,
最轻微的触动。
小冰写的主要是现代诗,没有专门去作律诗。经常有人问我为什么这样设计?我的想法是现代诗和我们现代用户使用的语言比较接近,也许会更容易被看出问题来。但要是写得好的话,大家会更容易形成共鸣。
再给大家展示几首小冰的诗,比如看到船的照片,小冰说:
游子是一只船上的沙土,
如同美丽的灵魂,
我不能创造世界,
伴着古老的遗恨。
看到一条鱼,她会写:
鱼的人,
甜蜜的风,
灵魂的呼吸,
那最高的天空。
最神奇的是这个,小冰根据一张蓝天白云的CBD的图,写了一首诗:
所有的城市愧对你强大的数字,
美好的希望,
最好的朋友 心爱的老婆,
大风起来。
我当时就觉得很好玩。因为那会儿北京雾霾非常严重,她竟然就知道我们北京人在等大风。而且,强大的数字又好像暗暗在指GDP。
小冰之所以能写出这些诗句,主要依赖的是图像识别技术。通过图像的训练,小冰可以找到一些词汇,按照这些名词、形容词找它们对应使用频次比较高的词组,作为诗歌第一句和第二句的关键字。这里我们刻意不生成全部诗句,因为生成全部诗句的话就更像是图片的描述。然后利用RNN模型,拓展出更多的表达,由此带来一种触景生情的效果。
- 原标题:宋睿华|我们让AI造比喻句,她想到了爱情和中国足球 本文仅代表作者个人观点。
- 请支持独立网站,转发请注明本文链接:
- 责任编辑:吴立群
- 最后更新: 2019-05-14 07:55:32
-
学生定制机自带管控功能引争议 华为:不知情
2019-05-13 14:55 -
挑战西方软件巨头 华为中旬将推出云数据库产品
2019-05-13 11:19 大公司 -
超越日本!71个领域中国科学论文被引次数世界第一
2019-05-12 10:38 -
中国移动回应美国禁入:有悖市场经济原则
2019-05-11 13:15 -
华为杨超斌:5G千元机最快明年底上市
2019-05-10 19:31 -
史德年:智能手机芯片国产化率23.6% 屏幕国产化率67.5%
2019-05-10 17:11 -
小米王腾认同华为余承东“2K无用论”:2K分辨率意义不大且耗电
2019-05-10 16:01 -
国家电网董事长会见马化腾
2019-05-10 15:11 BAT -
第一季度北美智能机:总出货量降18%,苹果跌19%,联想TCL增长
2019-05-10 13:13 手机 -
科技兴农路上的“中国速度”
2019-05-09 18:05 -
华为新专利曝光:凸起上边框+无刘海全面屏
2019-05-09 16:48 手机 -
中兴:拥抱5G时代,每年投入超30亿元进行5G研发
2019-05-09 15:21 -
国内首家5G安全协同创新中心在蓉成立
2019-05-09 15:12 -
又想社交又要电商 “微信之师”Line成了腾讯阿里两不像
2019-05-09 11:16 TMT观察 -
网友P30跑分大跌眼镜 安兔兔回应
2019-05-08 23:06 -
京东方柔性屏市场份额超11%:华为助力
2019-05-08 20:25 华为 -
谷歌CEO:制造一个种族主义、性别歧视的AI非常容易
2019-05-08 11:48 大公司 -
三星称折叠屏手机尚无发货日期 向美国客户道歉
2019-05-08 07:16
相关推荐 -
伊朗外长否认以空袭:除非遭重大袭击,否则不予回应 评论 120重庆通报“燃气费异常”:燃气集团党委书记被免职 评论 670“伊以都在降调”,国对国直接打击结束? 评论 143以色列“有限复仇”:选在了伊朗核计划中心 评论 357以色列“报复”开始:伊朗多地传出爆炸声 评论 591最新闻 Hot
-
“伊以都在降调”,国对国直接打击结束?
-
美方挑事:中国做出贡献,威胁全欧洲
-
印度大选开锣,莫迪稳赢了?
-
俄气真香?欧盟机构警告:一时断不了
-
“德国车是世界上最好的,不必害怕中国,但…”
-
抛弃自家兄弟,肯尼迪家族15人支持拜登
-
“拜登考虑再援以10亿美元武器”
-
日教材称“殖民推动韩国近代化”,韩外交部召见日大使抗议
-
重庆通报“燃气费异常”:燃气集团党委书记被免职
-
G7竟威胁中国:跟俄罗斯走近,与西方就远
-
以色列“有限复仇”:选在了伊朗核计划中心
-
5.3%,一季度“开门红”能转化为“全年红”吗?
-
两大家族开撕?菲第一夫人公开指责副总统:不道歉,这事就没完
-
美国一票否决,多方回应
-
李迅雷:发展服务业与做强制造业不矛盾,可参照德国、日本
-
欧盟跟着泼脏水:中国不仅坐山观虎斗,还下场了
-