乐知付加密服务平台

如果你有资源, 平台可以帮你实现内容变现, 无需搭建知识付费服务平台。

点击访问官方网站 https://lezhifu.cc

扫码关注公众号 乐知付加密服务平台-微信公众号
企业级数据仓库设计之业务库模型设计 | chenzuoli's blog

企业级数据仓库设计之业务库模型设计

      数据仓库的数据哪里来,业务库、日志文件、第三方提供、历史业务数据、外部爬取数据等,这些数据可能是结构化的,也可能是非结构化的,也可能是半结构化(json),我们放到数据仓库中,需要统一规范(字段、度量、维度等),那么我们如何去规范呢?

      本公司业务库、业务日志等是目前我们能够控制的,在设计的初期去满足范式设计模式、实体设计模式,这样当数据实时或者按小时或者按天收集到数据仓库中,我们所做的清洗工作、主题业务模型设计、报表就会简单许多。
      想象一下,如果我们在获取某个业务指标时,如果表中即存在会员基本信息,也包含会员渠道信息,也包含会员订单信息(不符合实体设计模式),而且你在获取唯一关联id时,需要从某个字段中截取或者json格式中获取字段(不符合第一范式),一个指标下来,关联内嵌的表达到十几个,你是不是要疯了,而且后期维护起来特别麻烦,过几周再去查看sql时自己都看得费劲。
      这样的结果是我们不愿看到的,出现这样的情况就是业务库在设计表结构时没有遵循相应的设计模式,不管是第三范式还是实体设计模式,应至少遵循其中一个设计模式,这样我们后期的集市建设、主题模型设计就不至于逻辑复杂、sql复杂了。
      希望大家能够知道这一点,这是我工作中亲身经历的情况。

这里有篇文章可以参考,讲解 范式设计模式和实体设计模式


希望你能每遇到一个问题,多思考为什么会出现这个问题。

书山有路勤为径,学海无涯苦作舟。

欢迎关注微信公众号:【程序员写书】
程序员写书

喜欢宠物的朋友可以关注:【电巴克宠物Pets】
电巴克宠物

一起学习,一起进步。

-------------本文结束感谢您的阅读-------------