semaphore提示您:看后求收藏(第320章 看牙去,离语,semaphore,御书屋),接着再看更方便。

请关闭浏览器的阅读/畅读/小说模式并且关闭广告屏蔽过滤功能,避免出现内容无法显示或者段落错乱。

数据源默认不会发生变化Y这就使得用户不必担忧ETL任务开销对数据源的影

响Y但同时也意味着Y对于商务用户而言Y数据和应用并非任何时候都是可

用的。

有多种技术可以为实时主动数据仓库提供数据集成服务Y比如脚本ETL

EAI和CDC但是Y只有部分技术能提供实时(连续)的数据集成X

�0�5

3�0�6EAIEAI解决方案通常和ETL解决方案并存Y从而增强ETL的功能EAI

解决方案在源系统和目标系统之间进行连续的数据分发Y并且保证数据的成

功分发Y同时提供高级的工作流支持和基本的数据转换但是YEAI受到数据

量的限制Y因为EAI的初衷是为了实现应用的集成而不是数据的集成Y即它是

用来调用应用或者分发命令和消息的然而Y由于EAI具有在数据集成过程中

实时分发数据和维护数据一致性的特性Y所以也就能够提供实时数据获取的

能力Y而这种能力正是实时主动数据仓库所需要的。

有多种技术可以为实时主动数据仓库提供数据集成服务Y比如脚本ETL

EAI和CDC但是Y只有部分技术能提供实时(连续)的提供了连续变化数据的捕捉和分

发能力Y并且只需要很低的开销和时间延迟CDC在提交的数据事务上进行

操作Y从OLTP系统中捕获变化的数据Y再进行基本的转换Y最后把数据发送

到数据仓库中虽然在体系结构上YCDC属于异步的Y但它表现出类似同步

的行为Y数据延迟只有不到1秒的时间Y同时能够维护数据事务的一致性。

ETL是将业务系统的数据经过抽取�0�5

Extract�0�6清洗转换�0�5

Transform�0�6

之后加载�0�5

Load�0�6到数据仓库的过程Y目的是将企业中的分散零乱

标准不统一的数据整合到一起Y为企业的决策提供分析依据

ETL是指从原系统中抽取数据Y并根据实际商务需求对数据进行转换Y然

后把转换结果加载到目标数据存储结构中源和目标通常都是数据库和文

件Y也可以是消息队列等。

数据抽取

可以采用周期性的pull机制或者事件驱动的push机制

pull机制支持数据整合Y通常以批处理的方式工作

push机制通常采用在线方式工作Y可以把数据变化传播到目标数据存储

结构。

数据转换

包括数据重构和整合数据内容清洗或集成

数据加载

对整个目标数据存储结构进行刷新Y或者只是对目标数据存储进行增量更

新。

早期的ETL解决方案通常以固定的周期运行批处理工作Y从平面文件和

关系数据库中捕捉数据Y并把这些数据整合到数据仓库中最近这几年Y

商业ETL工具供应商已经对产品做了很大的改进Y对产品功能进行了扩

展Y具体如下X

1额外的数据源

2额外的目标

3改进的数据转换功能

4更好的管理

5更好的性能

6改进的可用性

7增强的安全性

8支持基于数据联邦的数据集成方法

数据抽取模块的功能X

1确定数据源Y即从哪些源系统进行数据抽取。

2定义数据接口Y对每个源文件及系统的每个字段进行详细说明。

3确定数据抽取的方式X是主动抽取还是由源系统推送Y是增量抽取。

还是全量抽取Y是每日抽取还是每月抽取。

数据清洗与切换

数据清洗与转换X

数据清洗主要是对不完整数据错误数据重复数据进行处理

数据转换包括如下操作

www.mbeoge.cc。m.mbeoge.cc

本章未完,点击下一页继续阅读。

女生小说小说相关阅读More+

一人之下:混沌升华

文月学院插班生

协议闪婚后,禁欲老公是初恋

盛七玥

深圳:爱与恨的纠缠

文刀客栈

完蛋!我被合欢宗妖女包围了

劝妇从良

荒岛求生三兄弟

世间百味皆是你

千情劫

天上的卓玛