论述进行逻辑模型设计所要完成的主要工作。
(1)分析主题,确定当前要装载的主题;数据仓库的设计方法是一个逐步求精的过程,必须对概念模型设计步骤中确定的几个基本主题进行分析,选择首先要实施的主题。
(2)确定数据粒度的选择:数据仓库是面向联机分析处理和数据挖掘的,针对OLAP和DM,粒度具有两种形式;针对OLAP的粒度和针对DM的粒度。
(3)确定数据分割策略;确定粒度之后要考虑的是数据的分割策略。分割是数据仓库中的另一个重要概念。它是指把逻辑上是统一整体的数据分割成较小的、可以独立管理的物理单元进行存储,从而提高数据处理的效率。分割后的数据单元称为分片。
(4)增加导出字段;导出数据是指事先在原始数据的基础上进行总结或计算而生成的数据,这些数据可以在以后的应用中直接利用,从而避免了重复计算。
(5)定义关系模式;通过概念模型设计,确定了数据仓库的基本主题及每个主题的公共码键、基本内容等信息。
(6)定义记录系统;数据仓库通常在原有业务数据库的基础上构建,记录系统的定义是指明数据仓库中关系表各个字段来源于哪个业务数据库的哪些张表的哪些个字段。
免费的网站请分享给朋友吧