浅谈数据集市技术在高校信息管理中的应用(2)
作者:佚名; 更新时间:2014-10-15

  3.2建立数据准备区

    数据准备区是数据中间存储区,在这里从数据源中析取数据,将数据转换为常用格式,检查一致性和引用完整性,并装人数据集市数据库。使用独立于数据源的数据准备区将原始数据同数据集市数据隔离开,可以提高管理数据集市的效率,保护数据集市的完整性,并且不影响数据集市执行支持客户端访问等主要功能。本文为数据准备区创建单独的数据库,包含创建数据表、视图、索引,还包含从源数据系统中析取数据的进程,如数据转换服务(DTS)包,以及关系数据库中常用的其它元素。

  3.3清理和转换数据

    对于构建数据集市或OLAP分析、数据挖掘等高级应用,都需要数据的正确性、一致性、完整性。而现有数据存在很多的问题,如:滥用缩写词、惯用语、数据输入错误、重复记录、丢失值等等。所以数据必须进行清理及格式化,并转换为数据集市架构。本文把数据驻留在数据准备区完成清理和转换,并且验证数据的一致性,将数据转换成常用格式以及合并代理键。在实际转换中很多的数据需要执行手工操作协调数据的不一致或解决二义性文本字段输人项。每次需要手工操作时,要试着确定一种方法来消除在以后的数据转换操作中的手工步骤。这样能够修改源数据系统以消除起因,或者能建立自动化进程将未解决的数据留待以后手工异常处理,从而,大批的数据就可以装人数据集市而不会因手工干预而耽搁。典型的数据转换如:将多个名称字段组合成一个字段;将日期字段划分成单独的年、月、日字段;将数据从一个表示法映射到另一个,如从TRUE到1和F人LSE到0;创建并应用维度表记录的代理键。SQL Server 2000中提供Transact一 SQL查询、DTS包、ActiveX脚本等工具可以有效地协助转换数据。

  3.4  OLAP(联机分析处理)

    OLAP是实现对数据高效率访问分析的一种技术。它有很多优点,如:直观的多维数据模型使用户很容易就能选择、浏览和研究数据;分析查询语言为研究复杂的业务数据关系提供了强大功能;对频繁查询的数据预先进行计算,可以非常快地响应特殊查询。数据集市基于多维数据模型,该模型将数据看作数据立方体形式,进行OLAP分析。数据立方体由维和事实定义,允许以多维的形式对数据建模和观察。但是数据立方体由于可视化技术的限制,大多在理论上研究,很少有软件能较好的实现。在Analysis Services使用了多维数据集的概念,代替数据立方体,在表现的形式上采用了嵌套表的形式以利于编程实现。多维数据集仍是把数据组织成多维,每维包含由概念分层定义的多个抽象层,纬度指分析的角度,度量值指分析的对象。利用Analysis Services的多维数据集浏览器,我们可以很方便的实现上卷、下钻、切片和切块、旋转等OLAP操作(图3)。

浅谈数据集市技术在高校信息管理中的应用

  3.5多维数据集角色定义和权限分配

    角色是Analysis Service。保护多维数据集内对象和数据安全的主要方法,它可以在多维数据集的不同粒度级别上定义安全性。基于需要,管理员可以在维度成员级别或数据单元级别上保护数据的安全,利用多维数据集角色定义哪些用户或用户组可以访问和查询多维数据集内的数据,如限制学生只能查阅自己的成绩,不能查阅其他同学的成绩。

  3.6元数据的管理

    元数据是关于数据属性和数据结构的信息,也指用以界定对象(如多维数据集或维度)设计的信息。有了元数据,用户就可以很快找到所需要数据或确认这些数据是否在数据集市中,从而更有效的利用数据集市。Analysis Services可以自动生成元数据,并通过SQL Server2000 Meta Data Services对其进行管理。

  3.7在web上建立OLAP数据透视

    向用户提供数据访问能力的Web应用程序,客户端可以使用Web浏览器,而不必安装、配置和维护特殊的应用程序。我们通过FrontPage组件建立直接在web上的应用。“插人/组件/office数据透视表”,通过Microsoft OLE DB Provider for OLAP Services 8 .0可以创建对应于任何ODBC兼容数据源的。LAP数据透视表视图,通过“MS FrontPage:业务分析模式”结合“数据透视表属性工具箱”建立分析模式,用户可以在Web浏览器上,调整字段列表、数据属性、显示格式,以便以最合适分析角度的方式进行分析[’]。

  3.8数据的更新

    一些数据会不定时的更新,如经费开支,但是这些日常性的变化不需要存人数据集市,我们可以把数据更新的部分存人数据准备区。对于新生人校、学生毕业、财务的统计、教师的晋级等,一般每学期末才会总结,所以,我们的数据集市只需要在每学期末更新和整理一次。

  4结论与展望

    本文利用SQL Server 2000及Analysis Service建立了面向学院级的数据集市。通过运行,系统较好的解决了学院管理中的许多问题,充分显示出数据仓库管理的灵活、便捷和稳定等特点。这种结合高校特点,通过数据集市集成为数据仓库的方法,最终可以发展成为高校管理决策支持的有力工具。

核心期刊快速发表
Copyright@2000-2030 论文期刊网 Corporation All Rights Reserved.
《中华人民共和国信息产业部》备案号:ICP备07016076号;《公安部》备案号:33010402003207
本网站专业、正规提供职称论文发表和写作指导服务,并收录了海量免费论文和数百个经国家新闻出版总署审批过的具有国内统一CN刊号与国际标准ISSN刊号的合作期刊,供诸位正确选择和阅读参考,免费论文版权归原作者所有,谨防侵权。联系邮箱:256081@163.com