semaphore提示您:看后求收藏(第288章 粽子!,离语,semaphore,御书屋),接着再看更方便。
请关闭浏览器的阅读/畅读/小说模式并且关闭广告屏蔽过滤功能,避免出现内容无法显示或者段落错乱。
数据仓库是一个面向主题的集成的相
对稳定的反映历史变化的数据集合Y用于支持管理决策
面向主题
2集成
3相对稳定
4反映历史变化
数据库是面向事务的设计Y数据仓库是面向主题设计的数据库
一般存储在线交易数据Y数据仓库存储的一般是历史数据数据
库是为捕获数据而设计Y数据仓库是为分析数据而设计的。
一个典型的数据仓库系统通常包含数据源数据存储和管理
OLAP服务器前端工具和应用等四个部分。
数据源X是数据仓库的基础系统的数据来源Y包含企业的各种内部数
据和外部数据内部数据包括存在于OLTP系统中的各种业务数据和办
公自动化系统中的各类文档数据外部数据包括各类法律法规市场信
息竞争对手信息及各类外部统计数据和其他相关文档等。
数据存储和管理X是数据仓库系统的核心是指在各业务系统基础上周
期性地对数据进行抽取按照主题进行重新组织Y最终确定数据仓库的物理存储结构Y同
时存储数据仓库的各种元数据�0�5数据字典记录系统定义数据转换规
则数据加载频率及业务规则等�0�6对数据仓库系统的管理Y就是对相
应数据库系统的管理Y通常包括数据的安全归档备份维护和恢复
等工作。
OLAP服务器X联机分析处理服务器将需要分析的数据按照多维数据模
型进行重组Y以支持用户随时多角度多层次进行数据分析Y发现数据
规律与趋势
前端工具和应用X数据查询工具自由报表工具数据分析工具数据
挖掘工具和各类应用系统。
实时主动数据仓库是一个集成的信息存储仓库Y既具备批量和周期性的数据
加载能力�0�5采用ETL技术�0�6Y也具备数据变化的实时探测传播和加载能力
�0�5采用CDC技术�0�6Y并能结合历史数据和新颖数据实现查询分析和自动规则
触发Y从而提供对战略决策和战术决策的双重支持。
数据整合。
不同数据源的数据被物理地集成到数据目标
利用ETL工具把数据源中的数据批量地加载到数据仓库就属于数据整
合。
数据联邦。
在多个数据源的基础上建立统一的逻辑视图Y对外界应用屏蔽数据
在各个数据源的分布细节
对应用而言Y只有一个数据访问入口Y但事实是被请求的数据只是
逻辑上的集中Y物理上仍然分布在各个数据源中
只有收到请求时Y数据仓库才临时从不同数据源获取相关数据Y进
行集成后提交给数据请求者。
数据传播。
数据在多个应用之间传播
在企业应用集成解决
方案中Y不同应用之间可以通过传播消息进行交互
4混合方式
对那些不同应用都使用的数据采用数据整合的方式进行集成Y而对
那些只有特定应用才使用的数据则采用数据联邦方式进行集成。
有多种技术可以为实时主动数据仓库提供数据集成服务Y比如脚本ETL
EAI和CDC但是Y只有部分技术能提供实时(连续)的数据集成X
�0�5
1�0�6脚本脚本是数据集成的一种快速解决方案Y其优点是Y使用灵活且比
较经济Y很容易着手开发和进行修改Y几乎任何操作系统和绝大部分DBMS都
可以使用脚本但是Y使用脚本也有很多问题Y比如Y耗费开发者的时间和
精力Y不好管理和操作Y以及不能满足服务水平协议�0�5
等等。
有多种技术可以为实时主动数据仓库提供数据集成服务Y比如脚本ETL
EAI和CDC但是Y只有部分技术能提供实时(连续)的数据集成X
�0�5
2�0�6ETLETL是实现大规模数据初步加载的理想解决方案Y它提供了高级
的转换能力ETL任务通常都是在 维护时间窗口进行Y在ETL任务执行期间Y
本章未完,点击下一页继续阅读。