
当互联网让人们分享信息变得如此便捷之时,对于信息本身,由于发布信息太容易,而信息的辨别过难的缘故,它已经不是人们所追逐的第一目标了。取而代之的是,由互联网所带来的人际关系之间的变革,人们开始基于看上去无所不能的搜索引擎,去搜索他们想接触的人,并与其沟通。对人的搜索,不是寂寞,而是趋势。
从Blog的兴起,到SNS的大行其道,再到微博客的来势汹汹。社会化媒体明确的将信息与人链接在了一起。人际链的关系,从信息是人的标签,变换为人是信息的聚合。因此,信息的多寡,质量的高低,时效的即时与否都决定了这个人是否会值得被关注,是否会被搜索到。人如此,商家亦如斯。传统的搜索商家,我们已经司空见惯,而商家将自身形象定位成个体一样,能够与普通用户对等进行交流,等待潜在顾客像关注、搜索普通人一样搜索商家的形式,在搜索引擎中表现的效果不可谓不一般。
因为,在搜索时,传统的搜索引擎总会给我们灌输对方是商家的信号。试想在搜索ps3时,搜索结果中的商家怎么能够将它看作是对等关系的朋友呢?所以,要祛除这样的信号,要让潜在顾客从社会化交朋友的角度,降低决策风险,与商家建立关联。
阅读全文…

Web1.0时代,互联网的支柱是信息,为了应用信息,我们使用搜索引擎。
Web2.0时代,互联网的主角是每一位网民。为了更好的使用互联网,我们希望能够通过互联网搜索到人。
若干年以前,一位同窗好友对我说,他的名字独一无二。于是乎,我用Google进行搜索,果然没有一个匹配。时光飞逝,目下在Google与百度之上搜索之,已经有很多索引。当然,搜索的质量并不乐观。
那么,搜人真的有必要么?我认为答案是肯定的。人是信息的源泉,同时作为互联网的主人,在交互信息之中起着关键作用。冷冰冰的数据,不是我们追求的目标,数据背后人的搜索乃是未来发展的方向。
从寻找多年未见的亲友到查找能够完成某一项目与工作的人才,从以降低人力成本的出发点到降低时间成本的目的,等等以往看似不可能完成的事情,在互联网的影响下,变得可行。但是不得不承认其效率低下。无论是从传统的搜索引擎还是web2.0新贵中进行搜索,其结果要么是匹配程度低,要么就是因范围有限而搜索不到。这点在国内更甚。不足或意味着市场,而市场意味着机会。睿智的创业者往往有着敏锐的嗅觉,或许在接下来可预见的时间内会有以下搜人的服务出现: 阅读全文…
今天一早惊闻谷歌推出人肉搜索引擎,于是便立刻尝试搜索。结果,呵呵,竟然是Google的愚人节恶作剧。不愧是Google,恶作剧的很有创意。恶作剧归恶作剧,谷歌还不忘宣传一下它的合作伙伴——天涯问答。
天涯问答是什么?能做什么?简单的说,与新浪爱问,百度知道,雅虎知识堂基本类似。新意无多。那么,我们不禁要问,曾放弃自己知识搜索的谷歌为何会与天涯合作,重新来开拓这个市场?仅仅是为了本地市场,以对抗百度?
或许是,然而我认为更主要的原因是,谷歌希冀能用天涯庞大的忠诚用户群,来尝试所谓的人肉搜索+知识搜索。进一步达到“搜人”的境界。如果说web1.0时代,信息的搜索是其极致;那么在2.0时代,巅峰就是搜人。
随着互联网上的主角从不可计数的信息,向每个平常的网民来转移。“搜人”的呼声也越来越高。但是,人毕竟不是冷冰冰的数据与信息,很难进行结构化,更不要言及数据挖掘了。然而,难归难,不是不可能。有需求就一定会有知识能够满足。我认为,人虽然不能简单的用数据来定义,但是可以根据人在互联网上留下的信息,并选取一个“样本(Sample)”来进行分析。就像一张照片、一段视频、一首音乐可以用很多人的智慧来打上标签(tags)一样。人在互联网上留下的信息,可以同理地反映人的属性,进而被索引,进一步可以达到搜索的目的。
但是,这其中也存在问题,每个人在互联网上留下的信息有多有少,关注的方向亦不尽相同。怎么办?这就要依靠数理统计的知识,合理的选择一个能够充分代表这个人信息的样本(sample)。同时还要考虑小样本下如何解决,样本中的信息如何量化估计等问题。在这里,我不引出任何的数学证明,只是简单的将思想表于下:
首先,让反映个人信息的样本选取成为一个动态的过程,结合贝叶斯估计与信息熵(information entropy)之理论,对其反映的情况(variance等统计量)进行评估。而后,将所有的人进行综合处理,标准化,提炼出一个“标准值”。以便最终横向评估搜索质量。最后,告诉被分析的每个人他的情况,每个人都有成就感,这种成就感会让他们在其关注的方面不断的自我更新,同时在互联网上留下这方面的信息。使得每个“人”自行帮助整个系统来良性运转。记住,搜人的目标是让我们整体的智慧更高,而不是为了把人分成三六九等。
回到天涯与谷歌的合作。毋庸置疑,天涯的洋量原创信息,其中最为重要的是每个用户的信息(发布的帖子,天涯问答的回答等),对于谷歌而言是一个廉价的数据库。经过严密的计算,对每个用户的信息进行抽样,所得之样本,根据信息熵等理论,反映用户在某方面的能力。进而可以达到按某种需求搜人的目的。(比如,搜索历史爱好者或者知道曹操八卦的人,就会搜出留下大量历史文字,甚至是设计曹操的人)。
当然,上述只不过是我的大胆假设,不当之处,敬请海涵,欢迎讨论。谢谢!
最近评论