眼界决定世界
人有三种心理可以通过互联网更好的满足,它们是成就感,猎奇心理和独家尊贵感。Web2.0大行其道的今天,互联网入侵到我们生活的每一个环节,与此同时,在不同程度的满足我们前述三个心理。在此环境下,用户开始慷慨的分享信息。
而在用户分享信息的同时,网站也在希冀根据这些信息为用户提供更新的体验。这种模式,很多人称之为“数据挖掘”。从web1.0的被动接受网站到web2.0的人人参与网站,越来越多的站点将用户的访问数据分别统计,基于这些统计数据为用户服务。比如一些推文网站,会根据用户所推荐之文,或者所阅读之内容来为用户推荐类似的文章;再比如一些分享影音分享网站,也会同理的向用户推荐比较受其欢迎,抑或所有用户喜爱的内容。
这种数据挖掘的模式,主要是将用户所分享的信息,标准成矩阵化,记录每个用户访问什么页面多少次,呆了多久,这些页面的tag引用多频繁,跳出率多高等等这些统计量。基于这些访问量,对所有用户最喜爱的内容进行排序;基于tag的引用,就类别进行排序等等。这样的数据挖掘诚然为用户提供了新的体验,为网站增添了新的元素,但是似乎还不够。我们是否能再进一步,不仅能从页面的访问量,基于标签的类别来各自相互独立的统计,而又考虑了各个变量间的相关性,做深一步的统计分析。在这里,相对于以往经验中各自统计的“数据挖掘”,我将添加了各变量间的统计分析妄称之为“数据咀嚼”。
在数据咀嚼中,我们可以通过数理统计的知识,深层次地咀嚼各种变量间的关系。比如,社群网站中,用户会将自己的兴趣爱好表露其外,而一般的网站,通常只是会对具有某一个爱好的所有用户进行统计,给网友一个人以群分的渠道。但是,每个人的爱好不可能仅有一个,那么若将用户所有爱好间的相关性进行分析,进一步到因子分析,聚类分析。为用户提供基于所有爱好的分类指标分析,帮助用户找到与自身相似的人群。这样的体验岂不妙哉?
再比如,在通常的分享影音网站中,是根据tag来分类的,如果用户访问某个视频,会根据tag为用户提供相应的讯息(如相关tag的视频)。这虽然应用了一些统计学知识,但是戛然而止,岂不可惜?若能将这些内容tag与观赏过内容的用户tag同时进行统计分析,则善之善也。试想,在阁下观看了一部影片之后,不单单推荐影片内容tag中同类影片(可能还会有与自己留下的tag统计最相关的影片),并且为您提供了这支影片所访问人群中与您最观赏习惯相似的人及他们分享抑或观赏的影片,这样PV量就会大大提升,而网站的粘性也会有更大的改观。要知道,靠用户量来生存网络业,能够让用户有以“片”会“友”的体验,打败其他同类网站,还会那么困难么?
盖数据咀嚼之要义,乃是在统计各变量之余,进一步分析各变量之间关系,达到充分利用网友慷慨分享信息之作用。
虽然我们这个时代被称为信息时代,却从来没有人把之称为知识时代。因为信息并不等于知识,信息要经过处理——包括接触、吸收、理解、整合与保留——然后才能转化为知识。数据咀嚼就是要把信息,转换成知识,为用户提供更好体验的知识。
伏愿上苍赐恻隐,贻怜悯,止余震,息暴雨。佑吾诸夏,度此难关!
眼界决定世界!
转载本站文章时,请注明作者,原文出处及超链接地址。欢迎转载,谢谢!
Dailly
03月 26th, 2008 at 11:30 pm
加油
hhh
03月 27th, 2008 at 2:51 pm
数据咀嚼,不错的想法,不过到底要怎样才能算是咀嚼呢?
kylin
03月 27th, 2008 at 3:03 pm
关于数据咀嚼后面的文章会有一系列的讨论,包括实现方法以及思想。感谢关注。敬请斧正
bornde
04月 1st, 2008 at 4:35 pm
确实目前国内的网站,甚至许多企业应用数据挖掘技术,也仅仅是对数据简单的count计数,能够出一些数的描述统计报表,就号称“商业智能”了。这就是博主文中提到的“数据挖掘”的意思吧,一般地说,应该包括数据库技术、数据仓库、数据清洗这些内容。
而真正能够做到文中所说的“数据咀嚼”,即应用推断统计知识(包括聚类分析和因子分析只是其中应用之一)解析积累的大量用户数据的,少之又少。之所以很难做到“数据咀嚼”,这种人才不是没有,缺的领导对统计学结论的理解和把握。
随着以后数据量的增加和挖掘用户数据重要性的提升,我想很快就会从表面的数据描述进一步深入到数据、变量之间的相关联系上去吧。那个时候,数据分析的价值才能真正体现出来。
以上博主的观点我基本赞同。不过“数据咀嚼”这个词个人认为不是很好听,也显得不严谨。不过用什么词我也没想好,其实比较好的提法是用“数据挖掘”来指代着重于使用描述统计方法和数据库整理的数据使用方法,重点在于获得“数据本身”;然后用“数据分析”来指代着重于使用推断统计方法的数据使用方法,重点在于“分析”,得出有效结论。可惜的是“数据分析”这个词已经被用滥了,现在是能写个SQL查询的都敢说会数据分析。
Kylin
04月 1st, 2008 at 5:16 pm
感谢关注
无论名称如何,窃以为:获得数据,整理数据,分析数据,推断整体,得到结论,进而改善用户体验,是现在网站对于数据的一个整体要求。尤其是以用户体验为根本价值观的网站,更宜如此。
victor
04月 3rd, 2008 at 8:23 am
因为以下原因:一是您的文章显然是有一定的经验和感触而成的;二是对其它从事产品设计和运营的人士有一定的借鉴作用。
现在的产品设计和运营者很多时候并没有意识到这些问题,同时资本方和管理层有时也没有足够的耐心来这样实施。
呵呵,但理论毕竟可以给人以指导和希望,实施则要依情而定了。
因此转载到了个人的博客,同时看到您的评论,特来此解释一下,希望您不要介意本人的未招呼而直接转载的行为。
coolcat
04月 11th, 2008 at 2:33 pm
That IS progress. Your blogging skills are getting better and better. I had a great time reading this post.
jason
06月 25th, 2008 at 1:46 am
肥肥,用什么工具,怎么来咀嚼,望指点下