IT部门经常认为数据库未来的需求会不断增长,数据集市会变成一个企业仓库,于是把数据库的基础架构设计得异常庞大,毫不考虑短期需求。
许多用来创建OLAP数据库的产品都会有多个数据源。一个系统拥有多个数据源或通过多个小型数据仓库获取所需要的数据是很常见的情况。
建立一个拥有强大处理能力的大型数据仓库,能够帮助企业处理大规模数据集和建立一个覆盖整个企业的全面视图。
在商业领域,人们最关注两个报表系统为相同的数据产生完全不同的结果。在许多报表系统中,最难完成的任务之一就是保持非规范化数据的一致性和同步性。
如果业务分析师希望从企业数据仓库中获得最大价值,那么他们必须可靠高效地查询数据仓库的数据。
大多数人都知道,在IT词汇中,更大意味着更昂贵。随着系统的增大,成本也会显著提高。这可能会使组织不愿意创建大型数据仓库系统。
我发现,公司会明确描述他们所需要的报表类型。他们很少会告诉你数据的来源;他们不关心如何收集原始数据,也不关心如何将信息处理为可供他们使用的格式。
数据仓库可将企业中所有的数据泛化为一个规范模式。这个模式由不同系统的不同输入构成。只要设计合理,那么它就可以作为一个中央知识库,帮助人们创建报表。
数据仓库应该提供多个存储数据的位置,组织和建立数据结构,抽象和优化信息。大型数据仓库能够为这种分析数据的类型提供坚实的分析基础。
在解决数据仓库的安全性方面,有两个特别重要的问题。一是数据仓库必须能够控制数据访问权限;二是,提供业务持续性和灾难恢复。