自助广告
立即入驻
大数据书籍 Big data books

大数据应用与技术丛书·数据仓库工具箱(第3版):维度建模权威指南 [The Data Warehouse Toolkit:The Definitive Guide to Dimensional Modeling, Third Edition]

维度建模技术、模式和实践,14个案例涉及零售业、电子商务、客户关系管理、采购、库存、订单管理、会计、人力资源、金融服务、医疗卫生、保险、教育、电信和运输等

维度建模技术、模式和实践,14个案例涉及零售业、电子商务、客户关系管理、采购、库存、订单管理、会计、人力资源、金融服务、医疗卫生、保险、教育、电信和运输等.

内容简介

  随着TheDataWarehouseToolkit(1996)第1版的出版发行,RalphKimball为整个行业引入了维度建模技术。从此,维度建模成为一种被广泛接受的表达数据仓库和商业智能(DW/BI)系统中数据的方法。该经典书籍被认为是维度建模技术、模式和实践的资源。
该书汇集了到目前为止全面的维度建模技术。
该书采用新的思路和实践对上一版本进行了全面修订,给出了设计维度模型的全面指南,既适合数据仓库新手,也适合经验丰富的专业人员。
该书涉及的所有技术都基于作者实际从事DW/BI的设计经验,通过实际案例加以描述。
该书主要内容:
实用设计技术——有关维度和事实表的基本和高级技术。
14个案例研究,涉及零售业、电子商务、客户关系管理、采购、库存、订单管理、会计、人力资源、金融服务、医疗卫生、保险、教育、电信和运输等。
为12个案例研究提供了数据仓库总线矩阵示例。
需要避免的维度建模陷阱和错误。
增强的缓慢变化维度(SCD)技术类型0~类型7。
用于处理参差不齐的可变深度层次和多值属性的桥接表大数据分析的实践。与业务参与方合作、交互设计会议的指南。
有关KimballDW/BI项目生命周期方法论的概论。
对ETL系统和设计思考的总结构建维度和事实表的34个ETL子系统和技术。

作者简介

  Ralph Kimball,博士,自1982年以来,一直是数据仓库和商业智能行业的思想开拓者。自1996年以来,The Data Warehouse Toolkit系列书籍一直是受读者欢迎的畅销书。

Margy Ross,Kimball集团总裁,她与Ralph Kimball合作撰写了5本工具箱系列书籍。她关注数据仓库和商业智能已有30多年的历史。

目录

第1章 数据仓库、商业智能及维度建模初步
1.1 数据获取与数据分析的区别
1.2 数据仓库与商业智能的目标
1.3 维度建模简介
1.3.1 星型模式与OLAP多维数据库
1.3.2 用于度量的事实表
1.3.3 用于描述环境的维度表
1.3.4 星型模式中维度与事实的连接
1.4 Kimball的DW/BI架构
1.4.1 操作型源系统
1.4.2 获取.转换-力口载(ETL)系统
1.4.3 用于支持商业智能决策的展现区
1.4.4 商业智能应用
1.4.5 以餐厅为例描述Kimball架构
1.5 其他DW/BI架构
1.5.1 独立数据集市架构
1.5.2 辐射状企业信息工厂hlmon架构
1.5.3 混合辐射状架构与Kimball架构
1.6 维度建模神话
1.6.1 神话1:维度模型仅包含汇总数据
1.6 ,2神话2:维度模型是部门级而不是企业级的
1.6.3 神话3:维度模型是不可扩展的
1.6.4 神话4:维度模型仅用于预测
1.6.5 神话5:维度模型不能被集成
1.7 考虑使用维度模型的更多理由
1.8 本章小结

第2章 Kimball维度建模技术概述
2.1 基本概念
2.1.1 收集业务需求与数据实现
2.1.2 协作维度建模研讨
2.1.3 4步骤维度设计过程
2.1.4 业务过程
2.1.5 粒度
2.1.6 描述环境的维度
2.1.7 用于度量的事实
2.1.8 星型模式与OLAP多维数据库
2.1.9 方便地扩展到维度模型
2.2 事实表技术基础
2.2.1 事实表结构
2.2.2 可加、半可加、不可加事实
2.2.3 事实表中的空值
2.2.4 -致性事实
2.2.5 事务事实表
2.2.6 周期快照事实表
2.2.7 累积快照事实表
2.2.8 无事实的事实表
2.2.9 聚集事实表或OLAP多维数据库
2.2.1 0合并事实表
2.3 维度表技术基础
2.3.1 维度表结构
2.3.2 维度代理键
2.3.3 自然键、持久键和超自然键
2.3.4 下钻
2.3.5 退化维度
2.3.6 非规范化扁平维度
2.3.7 多层次维度
2.3.8 文档属性的标识与指示器
2.3.9 维度表中的空值属性
2.3.10 日历日期维度
2.3.11 扮演角色的维度
2.3.12 杂项维度
2.3.13 雪花维度
2.3.14 支架维度
2.4 使用一致性维度集成
2.4.1 一致性维度
2.4.2 缩减维度
2.4.3 跨表钻取
2.4.4 价值链
2.4.5 企业数据仓库总线架构
2.4.6 企业数据仓库总线矩阵
2.4.7 总线矩阵实现细节
2.4.8 机会/利益相关方矩阵
2.5 处理缓慢变化维度属性
2.5.1 类型0:原样保留
2.5.2 类型1:重写
2.5.3 类型2:增加新行
2.5.4 类型3:增加新属性
2.5.5 类型4:增加微型维度
2.5.6 类型5:增加微型维度及类型1支架
……

第3章 零售业务
第4章 库存
第5童采购
第6章 订单管理
第7章 会计
第8章 客户关系管理
第9章 人力资源管理
第10章 金融服务
第11章 电信
第12章 交通运输
第13章 教育
第14章 医疗卫生
第15章 电子商务
第16章 保险业务
第17章 KimballDW/BI生命周期概述
第18章 维度建模过程与任务
第19章 ETL子系统与技术
第20章 ETL系统设计与开发过程和任务
第21章 大数据分析

前言/序言

  围绕Kimball与Inmon先生有关数据仓库体系架构的论战已持续多年,Kimball数据仓库架构并非唯一选择。正如作者在书中所述:“我们承认许多成功构建数据仓库/商业智能系统的组织采用其他架构方法。”但论战的结果是提出了大量促使数据仓库研究和应用得以快速发展的新技术和新方法。
本书就是这些新技术、新方法的集大成者。书中对许多技术的探讨来源于实际需求。因此,本书的写作是以案例研究为本体,根据应用的需求提出解决方案。针对应用中反映出来的问题,适时提出相关技术和方法。许多问题对于应用开发者来说都似曾相识,例如对于缓慢变化维度的探讨。实际上,我们往往认为,数据仓库中的数据主要应用于分析工作,因此不太关注个别数据的变化对整体带来的影响。本书却从实际业务需求出发,提出了从类型O~类型7等8种方法,给人以“于无声处听惊雷”的感觉。
Kirdball先生是数据仓库业界的翘楚之一。本书提出的许多技术贴近应用,对技术的讨论深入浅出,便于读者学习和应用。例如维度属性层次、桥接表、支架表、无事实的事实表等都是解决在实际工作中经常遇到的棘手问题的良好方法。
对于这本经典之作,译者本着“诚惶诚恐”的态度,在翻译过程中力求“信、达、雅”,但是鉴于译者水平有限,错误和不当之处在所难免,恳请读者批评指正。
参加本书翻译工作的还有博士研究生祝官文、王瑛琪、何鸣、张爽等,在此一并致谢。

相关图书

Hadoop 3大数据技术快速入门/大数据技术丛书
快速学习Hadoop、Hive、HBase、Docker技术
企业级大数据平台构建:架构与实现
以横向视角出发,拉通Hadoop体系技术栈,手把手教你快速构建一个真实可用、安全可靠的企业级大数据平台
移动通信大数据分析——数据挖掘与机器学习实战
全彩印刷,4G/5G无线技术、机器学习和数据挖掘的新研究和新应用。亚信科技董事长田溯宁博士,AT&T(美国电话电报)公司首席科学家大卫·贝兰格博士联袂推荐
数据算法:Hadoop/Spark大数据处理技巧
Mahmoud Parsian计算机科学博士力作,31个Hadoop与Spark大数据算法,包含基本设计模式、优化技术和数据挖掘及机器学习解决方案,涵盖生物信息学、基因组学、统计和社交网络分析等领域。
工业大数据融合体系结构与关键技术
从各种不同角度探究数据融合,相较于现有的同类书籍更具完备性。
统计分析:从小数据到大数据
统计分析老兵多年潜心编写,业务视角的统计思维,从小数据到大数据,厘清数据分析的技术脉络,并深入解读了统计算法和机器学习

暂无评论

暂无评论...