眼界决定世界
世界在数据车轮上运转向前,一切行业都不能逃脱出万一。然而,我们该如何获取期望中的数据呢?下面,我抛砖引玉的写出一点我的看法:
1.结构化数据:
何谓结构化数据?就是可以放入数据库表单中的数据。比如一个人的信息,有生日、职业、住址、收入等等,这些属性都被结构化,各个变量也被声明。这样的数据放入数据库中,每次查询非常方便。那么,如何获取这类型的准确数据呢?我认为有两种比较可行的方法:
第一,用实用的信息来交换数据:为用户提供某些服务,而用户不必为此付任何的费用,而仅仅是填写一个表单,以此作为交换。这样,用户不会因为觉得自己信息是无偿奉献而填写一些虚假信息或者拒绝提供。当然,保证隐私安全是其根本。(获取信息后的使用方法,将在以后跟大家探讨。)
第二,利用信息黏性,分批逐次的获取结构化信息:就如同买洗发水时要先告诉服务人员自己发质一样。用户每次获取信息的同时,必然也会透露一部分信息。这种流程,窃妄言之为信息黏性,是由一个信息黏合另外一个相关信息,诚如前面说的“买洗发水”信息,黏合“个人发质”以及“预算”信息。
这两种方式如何在互联网上应用呢?我以为,不妨将信息搜集从注册过程向整个过程转变。即每个用户的信息非但在注册时,也可在使用过程中不断完善与更新。将这个过程拆散,可以使改善用户体验。如,在web2.0站点中,注册时仅用提供邮箱和注册密码(甚至连重复密码都可以省去,找回密码直接发至邮箱。如需避免恶意注册,可以验证,不过2.0时代,谁不希望用户多多呢?)。在用户使用过程中,如果希望给某人发信息或者点评某人的分享时,需要给自己起一个昵称,此时的昵称在确定后,写入数据库。希望搜索跟自己志趣相投之人,那么就要写出自己的兴趣。就像这样,把整个流程延长,利用信息的黏性和实用的信息来不断的促使用户奉献我们期望的数据,而这些数据则被结构化的写入数据库,供未来的数据分析之用。
(下周三写数据获取中的非结构化数据,有感兴趣的朋友不妨留意)
伏愿上苍赐恻隐,贻怜悯,止余震,息暴雨。佑吾诸夏,度此难关!
眼界决定世界!
转载本站文章时,请注明作者,原文出处及超链接地址。欢迎转载,谢谢!
e.dazonth
07月 11th, 2008 at 4:17 pm
我以前看过一个美国佬和垃圾箱的故事(好像是美国佬),和你的意思基本上差不多吧!不过他已经成功了!
数据秘籍(二)——非结构化数据的整理 - 小眼睛看大世界
07月 16th, 2008 at 3:50 pm
[…] 前接数据秘籍(一) […]