刚开始接触数据仓库时,觉得这个东西就是一堆数据的集合,可以是一个数据库,可以是多个数据库,其它没什么。
做了一年之后,大概了解了它的结构,可以提供历史变化的数据,可以写一些sql统计不同的指标,做数据分析,给各小组查看产品的运营情况。也进行了业务系统和仓库之间的数据质量对比、元数据同步等功能。
再然后重新去找数据仓库的工作,发现其实不然,数据仓库除了上述的一些特点之外,我们还缺元数据管理,去管理仓库中的数据。也缺OLAP分析系统,分析人员可以使用不同的维度组合进行数据分析,使得数据发挥最大的价值。
工作没找着,反而发现之前的数据仓库做的很浅很浅,其实更强大的功能是数据挖掘,除了提供基本的数据分析功能外,能否从当前已有的数据中挖掘出更有价值的东西来,才是数据仓库最大的最有价值的功能。
对不同的部门,做不同的数据特征,用户画像,用户标签,才是王道。
I might say that success is won by three things: first, effort; second, effort; third, still more effort.
书山有路勤为径,学海无涯苦作舟。
欢迎关注微信公众号:【程序员写书】
喜欢宠物的朋友可以关注:【电巴克宠物Pets】
一起学习,一起进步。
