<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>小眼睛看大世界 &#187; 搜人</title>
	<atom:link href="http://www.melonlab.com/tag/%e6%90%9c%e4%ba%ba/feed/" rel="self" type="application/rss+xml" />
	<link>http://www.melonlab.com</link>
	<description>IT、数据、产品、营销</description>
	<lastBuildDate>Fri, 20 Jan 2012 08:27:12 +0000</lastBuildDate>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.2.1</generator>
		<item>
		<title>搜人:搜索引擎巨人靠边站</title>
		<link>http://www.melonlab.com/search-people-in-a-field-that-no-classic-search-engine/</link>
		<comments>http://www.melonlab.com/search-people-in-a-field-that-no-classic-search-engine/#comments</comments>
		<pubDate>Tue, 22 Sep 2009 08:58:25 +0000</pubDate>
		<dc:creator>孙 晗</dc:creator>
				<category><![CDATA[IT视野]]></category>
		<category><![CDATA[头脑风暴]]></category>
		<category><![CDATA[网络观察]]></category>
		<category><![CDATA[营销推广]]></category>
		<category><![CDATA[搜人]]></category>
		<category><![CDATA[搜索]]></category>
		<category><![CDATA[搜索引擎]]></category>
		<category><![CDATA[社会化媒体]]></category>
		<category><![CDATA[筛选]]></category>
		<category><![CDATA[聚合]]></category>

		<guid isPermaLink="false">http://www.melonlab.com/?p=452</guid>
		<description><![CDATA[尽管搜索引擎对于社会化媒体的搜索能力不可忽视，但在面对一个简单robot时，也是无能为力。facebook也好,twitter也罢，他们早已开始尝试搜索。在面对社会化媒体给你带来平等、真实感觉下，这座金山已经有人在挖掘。而传统搜索引擎，暂时靠边站吧。 <a href="http://www.melonlab.com/search-people-in-a-field-that-no-classic-search-engine/">继续阅读 <span class="meta-nav">&#8594;</span></a>]]></description>
			<content:encoded><![CDATA[<p><img class="alignleft" src="http://farm1.static.flickr.com/183/429755338_3c0ee094a8.jpg" alt="" width="375" height="500" /></p>
<p>当互联网让人们分享信息变得如此便捷之时，对于信息本身，由于发布信息太容易，而信息的辨别过难的缘故，它已经不是人们所追逐的第一目标了。取而代之的是，由互联网所带来的人际关系之间的变革，人们开始基于看上去无所不能的搜索引擎，去搜索他们想接触的人，并与其沟通。对人的搜索，不是寂寞，而是趋势。</p>
<p>从Blog的兴起，到SNS的大行其道，再到微博客的来势汹汹。社会化媒体明确的将信息与人链接在了一起。人际链的关系，从信息是人的标签，变换为人是信息的聚合。因此，信息的多寡，质量的高低，时效的即时与否都决定了这个人是否会值得被关注，是否会被搜索到。人如此，商家亦如斯。传统的搜索商家，我们已经司空见惯，而商家将自身形象定位成个体一样，能够与普通用户对等进行交流，等待潜在顾客像关注、搜索普通人一样搜索商家的形式，在搜索引擎中表现的效果不可谓不一般。</p>
<p>因为，在搜索时，传统的搜索引擎总会给我们灌输对方是商家的信号。试想在搜索ps3时，搜索结果中的商家怎么能够将它看作是对等关系的朋友呢？所以，要祛除这样的信号，要让潜在顾客从社会化交朋友的角度，降低决策风险，与商家建立关联。</p>
<p><span id="more-452"></span></p>
<p>暂时忘记传统的搜索引擎吧，目前他们仅仅是用来搜索信息的。这些信息多的让人窒息，同时信息背后的人也跟着模糊。在这种人们越来越害怕信息不能理性分析的情况下，回避使用，成了一种必然。传统搜索引擎上信息检索，通过其他方式与供应商进行交易，这早已不是一厢情愿。什么样的方式呢？窃以为，对各种各样的社会化媒体聚合类网站进行搜索，对这些聚合信息发出者进行筛选、分类的检索机制，能够为用户带来更好的体验。因为这是在平等的机会下，基于对社会化媒体的好恶来进行的筛选。在搜索的时候，目标不再是冷冰冰的信息，而是有血有肉的人。</p>
<p>尽管搜索引擎对于社会化媒体的搜索能力不可忽视，但在面对一个简单robot时，也是无能为力。facebook也好,twitter也罢，他们早已开始尝试搜索。在面对社会化媒体给你带来平等、真实感觉下，这座金山已经有人在挖掘。而传统搜索引擎，暂时靠边站吧。</p>
<p>收听孙晗的广播，请点击<a href="http://bit.ly/jIhS">http://bit.ly/jIhS</a></p>
]]></content:encoded>
			<wfw:commentRss>http://www.melonlab.com/search-people-in-a-field-that-no-classic-search-engine/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>搜索2.0：搜人记</title>
		<link>http://www.melonlab.com/search20-searching-people/</link>
		<comments>http://www.melonlab.com/search20-searching-people/#comments</comments>
		<pubDate>Thu, 21 May 2009 13:26:59 +0000</pubDate>
		<dc:creator>孙 晗</dc:creator>
				<category><![CDATA[创意melon]]></category>
		<category><![CDATA[头脑风暴]]></category>
		<category><![CDATA[web2.0]]></category>
		<category><![CDATA[描述性搜索]]></category>
		<category><![CDATA[搜人]]></category>
		<category><![CDATA[搜索]]></category>
		<category><![CDATA[标签云]]></category>
		<category><![CDATA[预言]]></category>

		<guid isPermaLink="false">http://www.melonlab.com/?p=120</guid>
		<description><![CDATA[Web1.0时代，互联网的支柱是信息，为了应用信息，我们使用搜索引擎。
Web2.0时代，互联网的主角是每一位网民。为了更好的使用互联网，我们希望能够通过互联网搜索到人。 <a href="http://www.melonlab.com/search20-searching-people/">继续阅读 <span class="meta-nav">&#8594;</span></a>]]></description>
			<content:encoded><![CDATA[<p><img class="alignnone size-full wp-image-127" title="search" src="http://www.melonlab.com/wp-content/uploads/2009/05/search.jpg" alt="search" width="467" height="309" /></p>
<p>Web1.0时代，互联网的支柱是<strong>信息</strong>，为了应用信息，我们使用搜索引擎。<br />
Web2.0时代，互联网的主角是每一位<strong>网民</strong>。为了更好的使用互联网，我们希望能够通过互联网<strong>搜索到人</strong>。</p>
<p>若干年以前，一位同窗好友对我说，他的名字独一无二。于是乎，我用Google进行搜索，果然没有一个匹配。时光飞逝，目下在Google与百度之上搜索之，已经有很多索引。当然，搜索的质量并不乐观。<br />
那么，搜人真的有必要么？我认为答案是肯定的。人是信息的源泉，同时作为互联网的主人，在交互信息之中起着关键作用。冷冰冰的数据，不是我们追求的目标，<strong>数据背后人的搜索</strong>乃是未来发展的方向。<br />
从<strong>寻找多年未见的亲友</strong>到查找能够<strong>完成某一项目与工作的人才</strong>，从以<strong>降低人力成本</strong>的出发点到<strong>降低时间成本</strong>的目的，等等以往看似不可能完成的事情，在互联网的影响下，变得可行。但是不得不承认其效率低下。无论是从传统的搜索引擎还是web2.0新贵中进行搜索，其结果要么是匹配程度低，要么就是因范围有限而搜索不到。这点在国内更甚。不足或意味着市场，而市场意味着机会。睿智的创业者往往有着敏锐的嗅觉，或许在接下来可预见的时间内会有以下搜人的服务出现：<span id="more-120"></span><br />
1.    <strong>基于威客与博客的垂直搜索</strong>：通过评估（如信息熵）项目或文章的质量，以人和项目为搜索对象，找到项目合作者、匹配的职员将变得更有效率。这种模式或大有可为。<br />
2.    <strong>描述人的标签云引入及搜索</strong>：除了诸如年龄、性别、所在地、职业等结构化的搜索之外，针对描述性语言进行搜索的模式将会在一段时间后推出。届时，每一个用户都会有一片为他人所贴上的描述性标签云。通过搜索，或者总体标签云，对感兴趣的人进行搜索及检索。当然，这种模式需要大量活跃用户来支撑，难度很大，可以预见的情况将会是采用插件的形式放诸博客或web2.0应用之中，以获得样本数据。</p>
<p>其实这些搜人的服务，还是需要大量的人肉参与，与其说人工智能，不如说工人智能。当然这其中有太多的问题需要解决，如隐私，搜索效率等可行性问题。在这边提出这个概念，仅是起一个抛砖引玉的作用，万望诸友狗尾续貂，不吝赐教。</p>
]]></content:encoded>
			<wfw:commentRss>http://www.melonlab.com/search20-searching-people/feed/</wfw:commentRss>
		<slash:comments>5</slash:comments>
		</item>
		<item>
		<title>从人肉搜索到搜索人肉</title>
		<link>http://www.melonlab.com/from-human-search-to-search-human/</link>
		<comments>http://www.melonlab.com/from-human-search-to-search-human/#comments</comments>
		<pubDate>Tue, 01 Apr 2008 08:59:49 +0000</pubDate>
		<dc:creator>孙 晗</dc:creator>
				<category><![CDATA[创意melon]]></category>
		<category><![CDATA[头脑风暴]]></category>
		<category><![CDATA[网络观察]]></category>
		<category><![CDATA[search engine]]></category>
		<category><![CDATA[信息熵]]></category>
		<category><![CDATA[搜人]]></category>
		<category><![CDATA[搜索引擎]]></category>
		<category><![CDATA[数据咀嚼]]></category>
		<category><![CDATA[数据挖掘]]></category>
		<category><![CDATA[数理统计]]></category>

		<guid isPermaLink="false">http://www.melonlab.com/from-human-search-to-search-human/</guid>
		<description><![CDATA[今天一早惊闻谷歌推出人肉搜索引擎，于是便立刻尝试搜索。结果，呵呵，竟然是Google的愚人节恶作剧。不愧是Google，恶作剧的很有创意。恶作剧归恶作剧，谷歌还不忘宣传一下它的合作伙伴——天涯问答。 天涯问答是什么？能做什么？简单的说，与新浪爱问，百度知道，雅虎知识堂基本类似。新意无多。那么，我们不禁要问，曾放弃自己知识搜索的谷歌为何会与天涯合作，重新来开拓这个市场？仅仅是为了本地市场，以对抗百度？ 或许是，然而我认为更主要的原因是，谷歌希冀能用天涯庞大的忠诚用户群，来尝试所谓的人肉搜索+知识搜索。进一步达到“搜人”的境界。如果说web1.0时代，信息的搜索是其极致；那么在2.0时代，巅峰就是搜人。 随着互联网上的主角从不可计数的信息，向每个平常的网民来转移。“搜人”的呼声也越来越高。但是，人毕竟不是冷冰冰的数据与信息，很难进行结构化，更不要言及数据挖掘了。然而，难归难，不是不可能。有需求就一定会有知识能够满足。我认为，人虽然不能简单的用数据来定义，但是可以根据人在互联网上留下的信息，并选取一个“样本(Sample)”来进行分析。就像一张照片、一段视频、一首音乐可以用很多人的智慧来打上标签（tags）一样。人在互联网上留下的信息，可以同理地反映人的属性，进而被索引，进一步可以达到搜索的目的。 但是，这其中也存在问题，每个人在互联网上留下的信息有多有少，关注的方向亦不尽相同。怎么办？这就要依靠数理统计的知识，合理的选择一个能够充分代表这个人信息的样本（sample）。同时还要考虑小样本下如何解决，样本中的信息如何量化估计等问题。在这里，我不引出任何的数学证明，只是简单的将思想表于下： 首先，让反映个人信息的样本选取成为一个动态的过程，结合贝叶斯估计与信息熵（information entropy)之理论，对其反映的情况（variance等统计量）进行评估。而后，将所有的人进行综合处理，标准化，提炼出一个“标准值”。以便最终横向评估搜索质量。最后，告诉被分析的每个人他的情况，每个人都有成就感，这种成就感会让他们在其关注的方面不断的自我更新，同时在互联网上留下这方面的信息。使得每个“人”自行帮助整个系统来良性运转。记住，搜人的目标是让我们整体的智慧更高，而不是为了把人分成三六九等。 回到天涯与谷歌的合作。毋庸置疑，天涯的洋量原创信息，其中最为重要的是每个用户的信息（发布的帖子，天涯问答的回答等），对于谷歌而言是一个廉价的数据库。经过严密的计算，对每个用户的信息进行抽样，所得之样本，根据信息熵等理论，反映用户在某方面的能力。进而可以达到按某种需求搜人的目的。（比如，搜索历史爱好者或者知道曹操八卦的人，就会搜出留下大量历史文字，甚至是设计曹操的人）。 当然，上述只不过是我的大胆假设，不当之处，敬请海涵，欢迎讨论。谢谢！]]></description>
			<content:encoded><![CDATA[<p class="MsoNormal" style="text-indent: 21pt; line-height: 150%"><span style="font-family: 宋体">今天一早惊闻谷歌推出<a href="http://www.google.cn/intl/zh-CN/renrou/index.html" target="_blank">人肉搜索引擎</a></span><a href="http://www.google.cn/intl/zh-CN/renrou/index.html" target="_blank"><span lang="EN-US"></span></a><span style="font-family: 宋体">，于是便立刻尝试搜索。结果，呵呵，竟然是</span><span lang="EN-US">Google</span><span style="font-family: 宋体">的愚人节恶作剧。不愧是</span><span lang="EN-US">Google</span><span style="font-family: 宋体">，恶作剧的很有创意。恶作剧归恶作剧，谷歌还不忘宣传一下它的合作伙伴——天涯问答。</span></p>
<p class="MsoNormal" style="text-indent: 21pt; line-height: 150%"><span style="font-family: 宋体">天涯问答是什么？能做什么？简单的说，与<a href="http://iask.sina.com.cn" target="_blank">新浪爱问</a>，<a href="http://zhidao.baidu.com">百度知道</a>，<a href="http://ks.cn.yahoo.com">雅虎知识堂</a>基本类似。新意无多。那么，我们不禁要问，曾放弃自己知识搜索的谷歌为何会与天涯合作，重新来开拓这个市场？仅仅是为了本地市场，以对抗百度？</span></p>
<p class="MsoNormal" style="text-indent: 21pt; line-height: 150%"><span style="font-family: 宋体">或许是，然而我认为更主要的原因是，谷歌希冀能用天涯庞大的忠诚用户群，来尝试所谓的人肉搜索</span><span lang="EN-US">+</span><span style="font-family: 宋体">知识搜索。进一步达到“搜人”的境界。如果说</span><span lang="EN-US">web1.0</span><span style="font-family: 宋体">时代，信息的搜索是其极致；那么在</span><span lang="EN-US">2.0</span><span style="font-family: 宋体">时代，巅峰就是搜人。</span></p>
<p class="MsoNormal" style="text-indent: 21pt; line-height: 150%"><span style="font-family: 宋体">随着互联网上的主角从不可计数的信息，向每个平常的网民来转移。“搜人”的呼声也越来越高。但是，人毕竟不是冷冰冰的数据与信息，很难进行结构化，更不要言及数据挖掘了。然而，难归难，不是不可能。有需求就一定会有知识能够满足。我认为，人虽然不能简单的用数据来定义，但是可以根据人在互联网上留下的信息，并选取一个“样本</span><span lang="EN-US">(Sample)</span><span style="font-family: 宋体">”来进行分析。就像一张照片、一段视频、一首音乐可以用很多人的智慧来打上标签（</span><span lang="EN-US">tags</span><span style="font-family: 宋体">）一样。人在互联网上留下的信息，可以同理地反映人的属性，进而被索引，进一步可以达到搜索的目的。</span></p>
<p class="MsoNormal" style="text-indent: 21pt; line-height: 150%"><span style="font-family: 宋体">但是，这其中也存在问题，每个人在互联网上留下的信息有多有少，关注的方向亦不尽相同。怎么办？这就要依靠<strong>数理统计</strong>的知识，合理的选择一个能够充分代表这个人信息的<strong>样本</strong>（</span><span lang="EN-US">sample</span><span style="font-family: 宋体">）。同时还要考虑小样本下如何解决，样本中的信息如何量化估计等问题。在这里，我不引出任何的数学证明，只是简单的将思想表于下：</span></p>
<p class="MsoNormal" style="text-indent: 21pt; line-height: 150%"><span style="font-family: 宋体">首先，让反映个人信息的样本选取成为一个动态的过程，结合<strong>贝叶斯估计</strong>与<strong>信息熵（information entropy)</strong>之理论，对其反映的情况（</span><span lang="EN-US">variance</span><span style="font-family: 宋体">等统计量）进行评估。而后，将所有的人进行综合处理，标准化，提炼出一个“标准值”。以便最终横向评估搜索质量。最后，告诉被分析的每个人他的情况，每个人都有成就感，这种成就感会让他们在其关注的方面不断的自我更新，同时在互联网上留下这方面的信息。使得每个“人”自行帮助整个系统来良性运转。记住，搜人的目标是让我们<strong>整体的智慧更高</strong>，而不是为了把人分成三六九等。</span></p>
<p class="MsoNormal" style="text-indent: 21pt; line-height: 150%"><span style="font-family: 宋体">回到天涯与谷歌的合作。毋庸置疑，天涯的洋量原创信息，其中最为重要的是每个用户的信息（发布的帖子，天涯问答的回答等），对于谷歌而言是一个廉价的数据库。经过严密的计算，对每个用户的信息进行抽样，所得之样本，根据信息熵等理论，反映用户在某方面的能力。进而可以达到按某种需求搜人的目的。（比如，搜索历史爱好者或者知道曹操八卦的人，就会搜出留下大量历史文字，甚至是设计曹操的人）。</span></p>
<p class="MsoNormal" style="text-indent: 21pt; line-height: 150%"><span style="font-family: 宋体">当然，上述只不过是我的大胆假设，不当之处，敬请海涵，欢迎讨论。谢谢！</span></p>
]]></content:encoded>
			<wfw:commentRss>http://www.melonlab.com/from-human-search-to-search-human/feed/</wfw:commentRss>
		<slash:comments>2</slash:comments>
		</item>
	</channel>
</rss>

