首页 » 技术分享 » 谷歌知识图谱:搜索的未来是提供答案

谷歌知识图谱:搜索的未来是提供答案

 

你想在你家附近找一间名字里有“蜜室”的甜品店,但是你手上的信息只有这些,于是你和老婆孩子坐在车里,拿出手机,可是谷歌却给了你一堆八竿子打不着的东西,这是怎么回事?

你还以为搜索就是放几个抽象的词汇过去,答案就会自己蹦出来呢。在过去,如果我们想要找到哪个地方,我们要有确切的地址,然后拿着地图翻腾半天,毕竟是搜索引擎让我们解脱了出来。所以,让人气愤的不是谷歌搜不出正确的结果来,而是它居然没有如你想象那般神乎其神。因为,你曾经听说:“你可以向上天祈求,但却无法得到回应。但若你向谷歌祈求,它却会在0.n秒内回应你。”于是你去找那个为谷歌设计搜索引擎算法的人,你问:“为什么谷歌一点都不理解我?”可是阿密特·辛格(Amimt Singhal)只淡淡地回你一句:“搜索给你的从来都不是现成的答案。”他说,谷歌无法给你准确的答案是因为它不知道你的所在地。他说,如果你用了iPhone就不会有这个困扰。就这样,用未来主义者保罗·萨福(Paul Saffo)的话说就是,我们被困在了“乔治·布尔(George Boole)式的搜索囚牢”中。没有了语境及背景,我们就这样被困在了一个维多利亚时期数学家所发明的二进制囚牢中,我们搜到的总是别人想要的结果,别人搜到的却不是他们想要的。

“搜索引擎”已成古汉语

短短几年里,我们已经在搜索引擎的道路上走了很远,远到“搜索引擎”这个词组已经成了古汉语,如今我们只用“搜索”两个字。《搜索》(The Search)一书的作者约翰·巴特尔(John Battelle)说:“如今,搜索的意义并不仅仅是往一个盒子里输几个词然后得到一个目标网页,搜索是一种模式,是二次元与三次元的互动。Siri仅仅是搜索而已吗?YelpFoursquare这样的手机应用都只是设计好的搜索机器吗?如今搜索无处不在,并且已经超越了它在网络的根源。”

搜索已经与我们异常得亲密,它是一个值得信任的朋友,给你准确无误地指路,有时它让你心神不宁地匆匆看一眼世界。过去我们搜索我们知道的东西,后来我们搜索我们不知道的东西。现在,当我们搜到了我们不知道的东西,我们甚至不知道这是我们不知道的东西。我们不再需要去记住什么,因为谷歌都帮你记着呢,我们只需要从谷歌那里把它认出来就好了。我们踩在前人的脚印上,我们听到一首歌,很想知道这首歌是谁唱的,我们把听到的那句歌词“如何知道他爱我”输进搜索栏里,但我们字还没打完,搜索网站已经帮你把剩下的部分补全了。如果你把滚动条往下拉,还会看到“如何知道自己的ip地址”和“如何知道自己是否怀孕”。曾经我们搜索是为了寻找资讯,如今我们搜索是为了找到自己。辛格说:“作为一个科学家,我只能说‘理解’这个概念不太好理解。就算你跟我说我们理解了什么事,我们其实也并不理解。”

没有人比辛格更知道,谷歌是多么不理解你了。拿简单易懂的“国王”来说,你输入了这个词,谷歌有可能会给你找到NBA萨克拉门托国王队的消息,也有可能给你找到电视剧《国王纪》。谷歌更像是一个拼字游戏冠军,它只消记住所有的词汇,并不一定需要了解这些词的意思。

不过,辛格和他的消歧义伙伴们正在山景城为了搜索的未来而忙碌,谷歌将会开始理解,它所做的将不仅仅是把形状类似的东西配对,而是开始知道,它们都有自己的背景和内涵。根据你个人的情况,谷歌将会有能力辨别出究竟哪一个“国王”才是你需要的那个。它将会掌握更复杂的技能:“它会理解你的语言、你的手势,甚至你的眼神。”辛格说。

辛格早年师从搜索大师萨尔顿教授,是谷歌的首席工程师,负责谷歌的搜索排序团队。在公司内部,谷歌的排序算法便是以他的名字命名的。他总是记得当年那个看黑白电视机的印度小男孩:“当时我们在印度没什么乐子,我就一直翻来覆去地看《星际迷航》(Star Trek)重播。”就在那时他的梦想开始萌芽:“你走过去对电脑说:‘那颗星球上的大气什么样?’我就想建立一个这样的世界。”

“人们很久以来一直想把全世界的资讯都整理起来,”约翰·詹南德雷亚(John Giannandrea)在谷歌的员工餐厅说,“我非常羡慕亚历山大大帝,因为他的老师是亚里士多德。他几乎什么问题都可以从老师那里得到解答。”

教会电脑像人类一样理解世界

如今,对知识的渴求已经没有对知识的处理来得重要。“我们处在一个一切都唾手可得的世界里,”詹南德雷亚说,“可是你要如何应对这一切呢?”打开“知识图谱”(Knowledge Graph),想象那是集合了全世界最有用信息的数据库,它在谷歌收购的Metaweb的基础上建立起来。“首先我们想把你们所有想知道的事情罗列出来,同时我们想把它们和人们在搜索引擎上最关心的问题结合起来。”詹南德雷亚说。

举例来说,纽约市长迈克尔·布隆伯格,他在知识图谱中以“个体”的形式存在,他的两个女儿乔治娜和艾玛分别是两个个体,而他的母校哈佛商学院是另一个个体,他们在广袤的图谱中有联结,但更有“边界”,他们只是图谱中的“事物”,而知识图谱中有5亿个类似的事物(詹南德雷亚指出,英语版维基百科里只有4亿个“事物”)。当你输入“迈克尔·布隆伯格”时,谷歌并不是单纯地寻找这个“字眼”,而是这个“个体”。“有了知识图谱相助,谷歌已经变得更聪明。”辛格说道。输入“汤姆·克鲁斯”,你会看到他的身高;输入“阿米特·辛格”,你会看到他出生于印度占夕,你还会看到他的导师萨尔顿的网页。

知识图谱的野心是教会电脑像人类一样理解世界。“对于很多在我们眼里是理所当然的事,我们的电脑并没有概念,”詹南德雷亚说,“我们知道有本书叫《无尽的玩笑》(Infinite Jest)是大卫·福斯特·华莱士(David Foster Wallace)写的。当我提到这本书的时候你会说:‘哦那本书啊。’但是我们的电脑并不明白它是一本书。”对于电脑来说,《无尽的玩笑》可以是任何东西,它只是一件事物、一个个体。电脑知道这个东西有很多种形式:精装、简装、电子书。

谷歌请来各个领域的专家为知识图谱增添内容,比如一个伯克利的蜜蜂专家就为数据库增加了4万个物种。它旨在覆盖你能想象得到的所有知识。同样,它也为事物寻找联系,这是传统的搜索做不到的。两件看似没什么关系的事物之间,有着你想象不到的联系。爱因斯坦和甘地之间有什么联系?他们晚年都是和平主义者——当然,目前电脑还不能理解这是为什么。

有了知识图谱,谷歌已经向着搜索的未来迈出了关键的一步:提供答案,而不是单纯的链接。“链接可不是答案,”华盛顿大学的计算机教授奥伦·埃齐奥尼(Oren Etzioni)说,“这些年来,我们被谷歌误导了,以至于以为链接就是答案,但你要的是更深层的分析。”比如你要找一家甜品店,除了根据你的所在地找到最近的甜品店以外,它还应该按照你的要求,帮你找到距离你最近、质量最优、口碑最好的那家甜品店。“这可是个难题,因为谷歌不会分析口碑呀,”埃奇奥尼与学生们分析Yelp的用户体验时说。

苹果在Siri上的成功引起了消费者巨大的热情。人们正需要这样一个东西,有互动、有对话——给你一个答案,而不是链接。逐渐地,我们已经不再满足于资讯,比尔·盖茨曾说:“搜索的未来是动词。”人们开始希望搜索能够付出行动,而不单只是提出建议。知识图谱正在建立一个名词的集合,它能够帮我们订餐吗?订特价机票呢?如今,“搜索”这个词几乎已经等同于“谷歌”,不过人们的搜索行为已经开始转向了手机应用。

转载自原文链接, 如需删除请联系管理员。

原文链接:谷歌知识图谱:搜索的未来是提供答案,转载请注明来源!

0