人有三种心理可以通过互联网更好的满足,它们是成就感,猎奇心理和独家尊贵感。Web2.0大行其道的今天,互联网入侵到我们生活的每一个环节,与此同时,在不同程度的满足我们前述三个心理。在此环境下,用户开始慷慨的分享信息。
而在用户分享信息的同时,网站也在希冀根据这些信息为用户提供更新的体验。这种模式,很多人称之为“数据挖掘”。从web1.0的被动接受网站到web2.0的人人参与网站,越来越多的站点将用户的访问数据分别统计,基于这些统计数据为用户服务。比如一些推文网站,会根据用户所推荐之文,或者所阅读之内容来为用户推荐类似的文章;再比如一些分享影音分享网站,也会同理的向用户推荐比较受其欢迎,抑或所有用户喜爱的内容。
这种数据挖掘的模式,主要是将用户所分享的信息,标准成矩阵化,记录每个用户访问什么页面多少次,呆了多久,这些页面的tag引用多频繁,跳出率多高等等这些统计量。基于这些访问量,对所有用户最喜爱的内容进行排序;基于tag的引用,就类别进行排序等等。这样的数据挖掘诚然为用户提供了新的体验,为网站增添了新的元素,但是似乎还不够。我们是否能再进一步,不仅能从页面的访问量,基于标签的类别来各自相互独立的统计,而又考虑了各个变量间的相关性,做深一步的统计分析。在这里,相对于以往经验中各自统计的“数据挖掘”,我将添加了各变量间的统计分析妄称之为“数据咀嚼”。
在数据咀嚼中,我们可以通过数理统计的知识,深层次地咀嚼各种变量间的关系。比如,社群网站中,用户会将自己的兴趣爱好表露其外,而一般的网站,通常只是会对具有某一个爱好的所有用户进行统计,给网友一个人以群分的渠道。但是,每个人的爱好不可能仅有一个,那么若将用户所有爱好间的相关性进行分析,进一步到因子分析,聚类分析。为用户提供基于所有爱好的分类指标分析,帮助用户找到与自身相似的人群。这样的体验岂不妙哉?
再比如,在通常的分享影音网站中,是根据tag来分类的,如果用户访问某个视频,会根据tag为用户提供相应的讯息(如相关tag的视频)。这虽然应用了一些统计学知识,但是戛然而止,岂不可惜?若能将这些内容tag与观赏过内容的用户tag同时进行统计分析,则善之善也。试想,在阁下观看了一部影片之后,不单单推荐影片内容tag中同类影片(可能还会有与自己留下的tag统计最相关的影片),并且为您提供了这支影片所访问人群中与您最观赏习惯相似的人及他们分享抑或观赏的影片,这样PV量就会大大提升,而网站的粘性也会有更大的改观。要知道,靠用户量来生存网络业,能够让用户有以“片”会“友”的体验,打败其他同类网站,还会那么困难么?
盖数据咀嚼之要义,乃是在统计各变量之余,进一步分析各变量之间关系,达到充分利用网友慷慨分享信息之作用。
虽然我们这个时代被称为信息时代,却从来没有人把之称为知识时代。因为信息并不等于知识,信息要经过处理——包括接触、吸收、理解、整合与保留——然后才能转化为知识。数据咀嚼就是要把信息,转换成知识,为用户提供更好体验的知识。
如果哪位有兴趣,不妨留意讨论,或者发邮件到这里。