数据仓库、数据挖掘和OLAP分析及其应用实例

数据仓库、数据挖掘和OLAP分析及其应用实例

一、数据仓库、数据挖掘和OLAP分析及其应用实例(论文文献综述)

王俊[1](2012)在《数据仓库技术在税收分析系统开发中的应用》文中进行了进一步梳理当前税务部门存在信息系统繁多,数据零散,集中整合度低,不能适应当前的税收决策和数据分析,不能转化成为企业和地方经济服务的有用知识,只有充分发挥数据的分析和挖掘能力,才能达到服务和支撑作用。在信息技术迅速发展与数据仓库深入应用的今天,税务部门应用数据仓库技术解决税收工作中的分析与决策问题,以处理税收工作效率与工作质量的矛盾成为发展趋势。因此,数据仓库技术在我国税收中的研究有重要的应用价值。本课题就是在这种情况产生的。本论文在熟悉税收业务和现有税务管理信息系统的基础上,首先介绍了课题的研究背景、目的、意义及国内外数据仓库技术应用的现状,然后分析了数据仓库、数据挖掘、OLAP等相关技术探讨在税务系统建设税务数据仓库的方法和步骤,设计了税务数据仓库的数据模型和体系结构,描述了数据抽取、转换、装载过程。研究了数据仓库的逻辑设计和物理设计,建立了税务数据仓库系统。最后对OLAP及数据挖掘技术在税收数据分析中的应用进行了研究。通过应用数据仓库技术,对税务系统的内部和外部数据进行综合分析处理,能够反映纳税规模,指导税收业务,服务纳税申报。本课题中构建的数据仓库系统采用了目前最实用的工具和方法,具有较好的可靠性和适应性,数据仓库构建简便,数据分析工具和数据挖掘工具功能丰富,操作简单,具有很好的应用价值。

吴占锋[2](2012)在《面向多维分析即席报表组件的研究与实现》文中研究说明商务智能(BI)是利用数据仓库,联机分析处理(OLAP)和数据挖掘等技将企业中的现有数据转化为知识,帮助企业做出明智的业务经营决策的工具。商务智能在经历十多年的发展历程中,其应用领域已经广泛涉及到通信、保险、金融、商业等行业。即席报表(Ad-Hoc)是BI的核心功能,它能让用户根据需要从数据仓库中获取所关心的数据,进行分析和处理。本文在充分理解Ad-Hoc组件需求分析的基础上以开发BI项目为背景,对面向多维分析的Ad-Hoc组件进行深入的研究与实现。在其研究和实现过程中所涉及到的相关技术文中首先介绍了数据仓库及与数据仓库相关的主要理论,包括数据仓库的定义及特征、数据仓库的体系结构和数据模型。其次介绍了OLAP的基本概念及特征、OLAP相关概念、OLAP基本数据操作和OLAP分类。最后对展现技术GWT和GXT进行简要介绍。这些内容为研究和实现Ad-Hoc组件奠定了理论基础。从使用Ad-Hoc组件不同群体的角度出发,引入了支持拖拽方式生成报表的立方体视图(Cube View)展现模块;为了提高生成Cube View的简便性,引入了Cube View管理模块。以支持图形化方式生成Cube View;为了支持不同的OLAP引擎设计开发了OLAP引擎管理模块,用户可以方便地通过图形化方式添加、修改、删除OLAP引擎。目前对Mondrian、 Analysis Services、SAP DW等引擎都提供了很好的支持。在组件实现方面基于SOA架构,其研发过程遵循了统一软件开发过程(RUP)方法论。本文首先介绍组件的功能,接着对组件进行了架构设计、详细设计以及具体的实现。最后对论文进行了总结,并就该组件进一步完善提出了展望。

高红涛[3](2011)在《河北网通基于数据仓库的帐务决策分析系统的设计与实现》文中研究说明数据仓库技术是基于数学及统计学严谨逻辑思维的并达成“科学的判断、有效的行为”的一个工具。数据仓库技术也是一种达成“数据整合、知识管理”的有效手段。它从不同视角对企业经营各方面的信息进行精确分析,准确判断,为企业的决策者做出正确的决策提供了重要的支撑。典型的数据仓库系统,比如:经营分析系统,决策支持系统等等。也随着数据仓库系统带来的良好效果,各行各业的单位,已经能很好的接受“整合数据,从数据中找知识,运用数据知识、用数据说话”等新的关系到改良生产活动各环节、提高生产效率、发展生产力的理念。本文结合已有的数据仓库技术理论,对河北网通的基于数据仓库的账务决策分析系统项目进行了设计与实施。提出了面向数据仓库的账务决策分析的体系结构及相关主题域,并根据“从一个简明主题开始实施”的原则,采用自底向上的方法进行构建,首先建立部门数据集市,实现区域自治,对相关部门的应用进行分类复制,对每个数据集市进行数据重构,逐步扩展到企业数据仓库(EDW)。重点工作是在账务主题域的数据集市构建过程中实现了客户、账户、用户实体,帐单、欠费、存款、清单、产品、优惠实体等主题域信息,根据不同分析需求实现不同汇总粒度的划分和数据的分割,实现了不同数据源数据的集成等,并针对收益分析构造了多维模型,基于此模型利用固定(预定义)报表、图表、即席查询(Ad-Hoc)、EIS(Executive Information System)、多维动态分析、数据挖掘等展现方式,从不同维度、不同粒度、多种视角形象直观地显示分析数据。重点对计费系统账单数据进行OLAP分析,建立了面向计费系统的财务决策的数据集市。通过该项目的设计与实施,探索出了一种将数据仓库技术与具体应用相结合的有效的方法,以业务支撑系统的数据以及其他相关数据作为基础数据源,采用科学的数据抽取、整理、存储等方法,挖掘数据内部蕴藏的大量有用信息,通过科学的分析,做出可信的预测,从而为市场决策管理者和市场经营工作提供及时、准确、科学的辅助决策依据。本项目的应用为提高公司整体管理效率,确定决策分析方向提供了数据依据。本文的经验可供其它数据仓库项目的实施借鉴,研究成果经进一步完善和扩充可推广到与通信行业相关的各企业应用。

胡琴[4](2009)在《基于数据挖掘的税源分析关键技术研究》文中认为随着税务部门信息化建设水平的不断提高,各级税务部门积累了大量的业务数据,但是这些数据却成了“信息孤岛”,缺乏有效的集成,使得数据库中积累了大量的历史数据,然而不断又有新的数据甚至是与原有数据相重复的数据不断的进入数据库,这既增加了税务工作人员的工作量,又使得纳税户重复填写资料,造成纳税户的不满,这就使得大量的数据得不到运用而只能浪费。如何充分利用这些宝贵的数据,从中总结出税收工作的发展规律,为税收管理、政策制定提供依据,是税收信息化发展过程中面临的一个重大课题。同时,税务管理任务从粗放型管理向精细型管理的转变也必须采用一些先进的分析手段,为管理者和决策者提供统一的应用服务系统。建设税务分析系统对实现税务信息现代化有着重要的意义。然而目前的税务分析系统只局限于数据库的管理,如何分析多年来积累的海量数据为税务决策提供事实依据,至今在税务分析系统中没有实现。针对这一问题,本文以柳州市国税局的数据为研究对象,重点讨论税务数据仓库系统的建设,并与数据挖掘技术相结合,获取税源管理的一般规律,提高税源管理的水平。本文主要研究工作如下:⑴在充分研究税收业务和现有税务管理信息系统的基础上,研究了建设税务数据仓库的方法和步骤,设计了税务数据仓库的数据模型和体系结构。⑵研究各种建立数据仓库时数据预处理中的数据清理、转换和加载的方法和策略,规范了业务的日常操作,实现了在一个数据平台上获取数据。⑶分析研究了数据仓库的逻辑设计和物理设计,建立了税务数据仓库系统。并在已建立的税务数据仓库基础上建立OLAP立方体,系统提供了多角度、多层次查询分析数据的功能,可以实现制作动态报表,减轻了以往人工统计分析的工作量。⑷利用关联规则算法对税务数据仓库中数据进行挖掘,获得与税负率有关的重要参数,找到不符合挖掘出的关联规则的纳税户,对其进行重点监控,得出供税务各级领导分析和决策的信息,从而指导税收工作。针对目前采用的关联规则算法主要使用Apriori算法计算量大,所需时间长的特点,使用改进的FP-growth算法。本研究初步建立了柳州市税务系统的数据仓库,并对其进行了统计分析,挖掘了与税负数据有关的关联规则,同时指出税务数据仓库的下一步工作以及本文的不足之处。

周蓝粢[5](2008)在《基于病案资源的决策支持系统的应用和研究》文中研究表明数据仓库技术、联机分析处理(OLAP)技术和数据挖掘技术可以有效地对海量数据进行管理,并从中发现有价值的知识,以提高信息利用率。利用数据仓库、OLAP技术及数据挖掘技术对病案资源进行科学的统计分析是医院重大决策及医学发展的主要依据。将决策支持技术应用到病案资源统计分析中是医院信息化发展的必然选择。本文对国内外决策支持系统在病案资源统计分析领域的研究作了简洁的综述和评论,分析了现存病案资源统计分析的问题,论证建立病案资源统计分析决策支持系统的必要性,介绍了数据仓库、OLAP和数据挖掘等有关概念和内容,提出了其在医院病情诊疗分析中的应用研究。其核心思想是通过数据仓库来清洗纷繁芜杂的数据,然后利用联机分析系统独特的多维方式对数据进行分析,使用户从不同的维度了解历史及现状,最后利用数据挖掘工具自动地挖掘潜在的模式,找到正确的决策。本系统的决策主题确定为病情诊疗质量分析。经过数据仓库的物理模型和逻辑模型的详细地设计,创建了具有时间、病种、性别、年龄、科室、费用类别、入院病情、诊断对照组、诊断符合情况、治疗结果等十一个维度和具有诊疗人数、住院天数、住院次数、平均住院天数、病种构成比、治愈率、死亡率、诊断符合率、急危重症抢救成功率等九个度量值的病情诊疗质量分析多维数据集。通过数据透视表选项与SQL Server 2005 Analysis Services服务器端连接,多维度、灵活、细化地进行了病种诊疗质量方面的联机分析处理。创建了病情诊断分析人工神经网络挖掘模型和病情治疗方案分析决策树挖掘模型。本系统可完成多维度的病种构成分析及各时期、各科室、常见病种的各项诊疗指标的多维度查询和动态趋势变化的潜在性规律分析,实现对疾病自然规律及病种诊疗质量的分析,从而有利于医院决策者采取相应的管理措施,提高医院的工作效率和质量。

祁贵宝[6](2008)在《内蒙古网通经营分析系统的设计与实现》文中指出近几年,信息资源已成为现代企业科学管理的基础和正确决策的前提。如何及时准确地从海量的信息中获得企业活动所需要的信息,已成为了各大企业急需解决的问题。自电信重组以来,国内电信行业逐渐打破独家垄断的局面,竞争日益激烈。各个运营商只有充分利用自身优势为客户提供商品质的个性化与多元服务,才能使企业在日益激烈的市场竞争中处于有力的地位。因此,为市场决策管理者提供及时、准确、科学的辅助决策依据也是越来越迫切,这就为数据仓库和联机分析技术的建立提供了外在动力;同时电信行业积累的大量业务运营数据也为数据仓库和联机分析技术的使用提供了客观条件。本文在介绍了数据仓库、联机分析处理等理论与相关技术的基础上,分析了将数据仓库技术、联机分析处理技术应用于内蒙古网通经营分析系统中的可行性,结合内蒙古网通公司业务现状,实现了从数据源到数据仓库/集市的数据抽取转化加载设计和基于数据仓库联机处理的多维分析、多维报表的展现等关键子系统设计,完成了企业数据的重新组织,向管理人员提供了一个面向经营分析决策的支持环境,帮助企业快速有效地获得企业活动所需要的信息,并对未来利用数据挖掘和其他的数学技术建立真正的分析型经营分析系统进行技术探讨,尽量实现在现有经营分析系统上的增值应用,并就此提出若干建议。

费赓柢[7](2008)在《关于异构数据源的整合与集成模式的研究 ——采用多服务器实现综合性能优化的OLAP系统》文中指出本论文在对分布式计算理论以及数据仓库的主要应用技术之一—在线分析处理(OLAP)技术深入分析的基础上,设计并实现了采用主从式多复制应用服务器的OLAP系统。采用主从式多复制应用服务器的OLAP系统主要是针对单OLAP服务器系统在稳定性、可扩展性、快速响应和不间断运行上的缺点提出的。新系统采用主从式多服务器技术把数据相同的多个OLAP服务器有机地组成一个系统向客户提供服务。论文首先对数据仓库和OLAP理论作了全面的分析,尤其对数据仓库的组织结构、OLAP的多维特性和数据组织方式进行了深入的研究。在对多维查询语言的深入研究上,提出多维查询的可拆分理论。同时对OLAP的发展趋势作了一定的研究。在研究多服务器系统的基础上,提出多复制服务器系统的概念,并对多复制服务器系统的系统结构和负载分配进行深入的研究。随后重点研究多复制服务器系统的数据更新,提出无阻塞数据更新理论,并提供数据更新和数据协调分别在更新发起点和更新复制点的4个算法。根据前面的研究和理论成果以及课题的目的和相关条件,同时对当前的OLAP系统和分布式技术作了较为深入的分析,得出新系统是采用TCP/IP网络技术和多复制服务器的主从式多复制应用服务器的OLAP系统。接着对新系统按照软件工程的方法进行系统的分析和设计。论文最后对系统进行全方面的优化,主要是在OLAP多维数据库和主从式多服务器两大部分上进行。具体包括数据源、立方体和MDX的优化以及多线程技术的采用和查询智能拆分的开发。

马安胜[8](2007)在《多维数据关联规则挖掘研究及系统实现》文中研究说明为了实现联机分析处理和数据挖掘的紧密结合,我们提出在多维数据模式的基础上同时支持OLAP应用和数据挖掘应用的思路。论文分析研究了多维数据立方的特征及关联规则挖掘Apriori算法,综合了数据仓库技术、联机分析处理技术和关联规则挖掘算法,给出了基于多维数据的关联规则挖掘方法,其中包括维内关联规则挖掘、维间关联关联规则挖掘和混合维关联规则挖掘。这种多维数据关联规则挖掘方法改变了传统关联规则挖掘过程中通过扫描事务数据库计算支持数的方法,而采用了扫描数据立方体来统计频繁项目集的支持数。另外针对数据立方结构以及OLAP操作,算法融入了层次的概念,给出了可选概念层次的多维数据关联规则挖掘算法,通过上钻、下钻选出的更合理的概念层次,从而在选取的概念层次上进行关联规则挖掘。算法中产生关联规则时,又结合了兴趣度、约束的概念,最终挖掘出用户感兴趣的、指定约束的、概念层次合理的、多维的关联规则。研究显示这种基于OLAP的多维关联规则挖掘算法可以准确地确定要调整的维,在挖掘过程中对维层次的高低进行判断,并利用数据立方体的上钻和下钻操作对维层次进行调整,具有较高灵活性及效率。

郭加树[9](2007)在《空间数据仓的构建及应用》文中研究表明现行的石油勘探开发专业数据库管理模式,特别是数据中心管理模式实现了数据的集成共享及数据与应用的分离,但没有解决好数据的分析问题,即空间数据的挖掘问题。本文在分析油气勘探开发业务需求及数据特点的基础上,总结吸纳了数据仓库、三维地质建模、三维GIS、油气勘探开发数据管理技术等技术方法,针对地学数据集成分析问题及空间数据的多尺度性,提出了适合地学数据分析与挖掘的空间数据仓逻辑模型,研究了空间数据仓物理模型及基于该模型的空间OLAP(联机分析与处理)方法。1)基于数据仓库多维分析概念提出了基于空间数据仓的勘探开发数据多维分析理论及空间数据仓的构建模式。2)空间数据仓的研究必须解决空间数据的多尺度问题,已有的多维模型并没有考虑空间以及空间的尺度问题,因此没有尺度空间上的分析、处理和表达能力,不适合空间多维数据集模型。为此,本文将空间的尺度问题与维度进行统一考虑,即尺度也是一种维度,维度也可以看作一种广义上的尺度,提出了基于尺度概念的空间数据仓多维数据集逻辑模型及多尺度下空间聚合的模式。3)为了更好的实现地学空间的多维表达,建立满足地学分析的事实关系,本文提出了以数据的空间关系为依据建立事实表-空间事实表,即建立以空间事实为核心,地学属性为维度的星型或雪花型多维空间数据仓模型。4)提出了表达空间多尺度的八叉树细分体元模型,实现了对地质体与地质场的多尺度表达与空间集成,实现了空间事实的构建,分析了地学分析中常用的维度及以体元为基础的空间事实与维度的关系,以十进制Morton码为基础建立了多级体元编码实现了空间与属性的关联,以空间关系构建起了对象之间联系(维度间的联系),为数据的多维分析奠定了基础。5)研究了基于空间多维模型的邻域分析、空间剖切与虚拟钻取等空间分析方法,距离、体积、表面积等空间度量以及数据集切片、基于空间事实表的数据集细化、OLAP等多维数据分析方法。6)基于以上理论建立了空间数据仓原型,并对东营凹陷地质-地球物理数据进行了空间数据仓建模,说明了方法的有效性和实用性。

薛黎明[10](2007)在《数据挖掘在客户分析中的应用》文中指出随着信息技术的发展与普及,人们产生和收集数据的能力迅速提高,在过去一段时间里,各领域产生了大量的业务数据,但因为缺乏相应的对数据进行高级分析的方法与工具,这些“数据金矿”所蕴藏的财富并没有被充分挖掘出来,被描述为“数据丰富,信息贫乏”。如何从大量的数据中找到真正有用的信息成为人们关注的焦点,数据挖掘技术也正是伴随着这种需求从研究走向应用。 网络论坛的开设为广大网络用户开辟了自由发表言论的空间,网络用户可以自由的在论坛上沟通交流。但随着信息量的急剧增大,传统的对论坛用户管理的方法已很难适应时代发展的需求,因此,如何有效、快速地分析论坛用户的特征及行为模式,进而为论坛管理提供指导,就成为各网站越来越关注的热点。 基于这样一种需求,本文将数据挖掘技术引入论坛用户分析中并做了如下工作。根据论坛的运行管理机制,建立论坛用户模型并设定计算指标,结合论坛历史数据,构建论坛用户数据仓库。利用OLAP技术,实现多维数据浏览。在数据挖掘过程中,根据数据规模,选择不同挖掘方法。针对全局大规模数据,借助Analysis Services工具实现聚类与决策树分析,针对局部小规模数据,实施灵活柔性挖掘。对于数据挖掘中发现的孤立点,结合论坛运行实际情况及查询工具,分析孤立点产生原因。在数据挖掘过程中,合理解释挖掘结果,总结网络论坛发展规律,预测论坛发展趋势。

二、数据仓库、数据挖掘和OLAP分析及其应用实例(论文开题报告)

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

三、数据仓库、数据挖掘和OLAP分析及其应用实例(论文提纲范文)

(1)数据仓库技术在税收分析系统开发中的应用(论文提纲范文)

摘要
ABSTRACT
第1章 引言
    1.1 选题背景及意义
        1.1.1 选题背景
        1.1.2 选题意义
    1.2 项目可行性分析与研究
        1.2.1 项目拟解决问题
        1.2.2 项目可行性分析
    1.3 数据仓库项目的国内外现状
        1.3.1 国外研究现状
        1.3.2 国内研究现状
第2章 数据仓库相关理论及技术
    2.1 数据仓库
        2.1.1 数据仓库概念及特点
        2.1.2 数据仓库体系架构
        2.1.3 数据仓库的数据组织
        2.1.4 数据仓库的实现方式与开发策略
    2.2 联机分析处理(OLAP)技术
        2.2.1 OLAP的定义及特性
        2.2.2 多维数据分析
        2.2.3 OLAP与数据仓库的关系
    2.3 数据挖掘技术
        2.3.1 数据挖掘概述
        2.3.2 数据挖掘常用技术
        2.3.3 数据挖掘应用领域
第3章 基于数据仓库的税收分析系统的设计与实现
    3.1 需求分析
        3.1.1 用户需求分析
        3.1.2 系统需求分析
    3.2 系统设计
        3.2.1 数据仓库系统结构设计
        3.2.2 系统功能设计
        3.2.3 数据仓库模型设计
    3.3 系统实现
        3.3.1 建立与源数据的关联
        3.3.2 创建物理表及存储过程
        3.3.3 创建数据展示
第4章 数据挖掘技术的应用
    4.1 企业信用等级评定模型的设计
        4.1.1 企业信用等级评定业务介绍
        4.1.2 聚类方法
        4.1.3 模型应用
第5章 总结与展望
    5.1 总结
    5.2 展望
致谢
参考文献

(2)面向多维分析即席报表组件的研究与实现(论文提纲范文)

摘要
Abstract
第一章 前言
    1.1 研究背景
    1.2 研究现状
    1.3 研究内容
    1.4 论文组织结构
第二章 相关技术概述
    2.1 数据仓库
        2.1.1 数据仓库基本概念
        2.1.2 数据仓库体系结构
        2.1.3 数据仓库的数据模式
    2.2 联机分析处理(OLAP)
        2.2.1 OLAP的概念和特征
        2.2.2 OLAP相关基本概念
        2.2.3 OLAP多维数据分析操作
        2.2.4 OLAP分类
    2.3 GWT和GXT技术
        2.3.1 GWT概念及特性
        2.3.2 GXT概念及特性
第三章 Ad-Hoc组件需求分析
    3.1 Cube View展现模块
    3.2 CubeVi ew管理模块
    3.3 OLAP引擎管理模块
第四章 Ad-Hoc组件架构设计
    4.1 RUP 4+1视图
    4.2 Ad-Hoc体系结构分析
    4.3 逻辑视图
        4.3.1 CubeView服务
        4.3.2 OLAP引擎服务
        4.3.3 文件夹服务
        4.3.4 树目录加载服务
        4.3.5 OLAP连接
        4.3.6 RDBMS连接
    4.4 开发视图
    4.5 部署视图
    4.6 用例视图
第五章 Ad-Hoc组件详细设计
    5.1 CubeView展现模块
        5.1.1 CubeView展现模块类图
        5.1.2 打开视图用例实现
        5.1.3 拖拽生成报表用例实现
        5.1.4 钻取用例实现
        5.1.5 切片切块用例实现
        5.1.6 导出报表用例实现
        5.1.7 隐藏元数据用例实现
    5.2 CubeView管理模块
        5.2.1 CubeView管理模块类图
        5.2.2 创建视图用例实现
        5.2.3 创建文件夹用例实现
    5.3 OLAP引擎管理模块
        5.3.1 OLAP引擎管理模块类图
        5.3.2 添加引擎用例实现
    5.4 关系数据库与雪花模型设计
        5.4.1 关系数据库设计
        5.4.2 雪花模型设计
第六章 实现示例
    6.1 CubeView展现模块
    6.2 CubeView管理模块
    6.3 OLAP引擎管理模块
第七章 总结与展望
    7.1 总结
    7.2 进一步工作方向
致谢
参考文献
附录A 攻读硕士学位期间发表论文
附录B 即席报表组件核心代码

(3)河北网通基于数据仓库的帐务决策分析系统的设计与实现(论文提纲范文)

摘要
ABSTRACT
第一章 引言
    1.1 研究背景和意义
    1.2 河北网通数据管理的现状
    1.3 本文主要研究内容
    1.4 论文组织结构
第二章 相关理论知识与技术
    2.1 什么是数据仓库
    2.2 操作型数据库与数据仓库的区别
    2.3 创建数据仓库的意义
    2.4 建立数据仓库的基本步骤
    2.5 数据集市、OLAP 与数据挖掘
        2.5.1 数据集市的概念
        2.5.2 数据集市的模型
        2.5.3 元数据管理
        2.5.4 OLAP(联机分析处理)
        2.5.5 数据挖掘
    2.6 本章小结
第三章 需求分析与总体设计
    3.1 数据仓库的体系结构
    3.2 数据仓库的总体设计
    3.3 数据仓库的具体设计过程
        3.3.1 主题域的确定
        3.3.2 粒度的划分
        3.3.3 数据分割
        3.3.4 数据仓库模式设计
        3.3.5 创建数据仓库表和数据准备区
        3.3.6 析取、清理和转换数据
        3.3.7 数据装入数据仓库
        3.3.8 建立分析应用
    3.4 数据仓库的开发过程
        3.4.1 任务和环境的评估
        3.4.2 需求的收集和分析
        3.4.3 构造数据仓库
        3.4.4 创建多维数据集
        3.4.5 建立分析应用
        3.4.6 数据仓库技术的培训
        3.4.7 回顾、总结及再发展
    3.5 本章小结
第四章 详细设计与实现
    4.1 基于数据仓库的账务决策分析系统的设计
        4.1.1 体系结构与设计流程
        4.1.2 确定系统需求
        4.1.3 已有的工作基础
        4.1.4 确定数据库服务器和数据分析工具
        4.1.5 确定主要的主题域
        4.1.6 确定基于数据仓库的账务决策分析的数据组织方法
        4.1.7 确定基于数据仓库的账务决策分析的分析方法
        4.1.8 确定基于数据仓库的账务决策分析的数据展现方法
    4.2 面向计费系统账务决策的数据集市的设计及实施
        4.2.1 设计目标的确定
        4.2.2 确定粒度层次划分
        4.2.3 确定数据分割策略
        4.2.4 数据结构的定义
        4.2.5 数据的获取
    4.3 本章小结
第五章 实验与分析
    5.1 实现数据集市的多维分析展现
        5.1.1 多维处理功能
        5.1.2 多维处理功能的主要具体应用
        5.1.3 不同管理层面展现内容
    5.2 测试实例
    5.3 实施结果的分析
    5.4 本章小结
第六章 结论与展望
    6.1 数据仓库设计和实现中方法总结
    6.2 项目实施的经验总结
致谢
参考文献

(4)基于数据挖掘的税源分析关键技术研究(论文提纲范文)

摘要
ABSTRACT
第一章 绪论
    1.1 研究背景
    1.2 国内外研究现状
        1.2.1 国外研究现状
        1.2.2 国内研究现状
    1.3 论文研究内容及组织
        1.3.1 研究内容
        1.3.2 论文组织结构
第二章 数据仓库技术
    2.1 数据仓库
        2.1.1 数据仓库概念
        2.1.2 数据仓库的特征
    2.2 数据仓库的数据组织和体系结构
        2.2.1 数据组织
        2.2.2 数据仓库的体系结构
    2.3 数据仓库的分析和访问
        2.3.1 OLAP
        2.3.2 数据挖掘技术
    2.4 本章小结
第三章 数据仓库设计与建立
    3.1 总体分析设计阶段
    3.2 数据仓库建模
        3.2.1 概念模型设计
        3.2.2 逻辑模型设计—星型图
        3.2.3 数据仓库物理模型设计
    3.3 数据仓库生成
    3.4 本章小结
第四章 关联规则挖掘算法
    4.1 关联规则的基本概念
    4.2 传统的 Apriori 算法
    4.3 FP-growth 算法
        4.3.1 FP-tree定义
        4.3.2 FP-Growth算法描述
    4.4 改进的 FP-growth 算法
        4.4.1 改进的FP-growth算法
        4.4.2 实验结果与分析
    4.5 本章小结
第五章 系统设计与实现
    5.1 业务需求与研究平台
        5.1.1 业务需求分析
        5.1.2 研究目标
        5.1.3 开发平台选型
    5.2 数据仓库的实现与应用
        5.2.1 税务数据仓库的生成
        5.2.2 数据仓库的应用
    5.3 关联规则挖掘技术在纳税评估中的应用
        5.3.1 数据准备
        5.3.2 利用FP-Growth算法挖掘税负分析数据
    5.4 本章小结
第六章 结论与进一步研究
    6.1 结论
    6.2 进一步研究
参考文献
致谢
作者简介

(5)基于病案资源的决策支持系统的应用和研究(论文提纲范文)

摘要
ABSTRACT
目录
第一章 绪论
    1.1 论文研究的背景
    1.2 论文研究的意义
    1.3 论文的内容
    1.4 论文组织与结构
第二章 病案资源统计分析系统概况
    2.1 病案资源统计分析系统的研究进展
    2.2 建立基于病案资源的决策支持系统的必然性
第三章 决策支持技术介绍
    3.1 数据仓库概述
        3.1.1 数据仓库的概念及其主要特征
        3.1.2 数据仓库相关基本概念
    3.2 联机分析处理
        3.2.1 OLAP的概念和特征
        3.2.2 OLAP相关基本概念
        3.2.3 OLAP多维数据库模式及存储多维数据集
    3.3 数据挖掘
        3.3.1 数据挖掘概念
        3.3.2 数据挖掘任务及功能模式类型
        3.3.3 数据挖掘方法
        3.3.4 数据挖掘过程
    3.4 决策支持系统
        3.4.1 决策支持系统的概念和特点
        3.4.2 决策支持系统的发展
第四章 决策支持系统总体设计方案
    4.1 开发环境
    4.2 总体设计框架
        4.2.1 数据仓库服务器
        4.2.2 OLAP服务器
        4.2.3 客户端
第五章 决策支持系统具体实现
    5.1 数据仓库
        5.1.1 数据仓库设计类型
        5.1.2 数据仓库的结构模型
        5.1.3 数据仓库建立过程
    5.2 联机分析处理
        5.2.1 多维数据库
        5.2.2 Pivot Table
    5.3 数据挖掘
        5.3.1 人工神经网络算法—病情诊断分析
        5.3.2 决策树算法—病情治疗分析
第六章 总结及展望
    6.1 总结
    6.2 展望
参考文献
致谢
攻读硕士学位期间发表论文

(6)内蒙古网通经营分析系统的设计与实现(论文提纲范文)

摘要
Abstract
目录
第一章 引言
    1.1 研究背景
    1.2 国内外研究现状
    1.3 经营分析系统建立的必要性
    1.4 本文的工作
    1.5 本文的组织
第二章 数据仓库技术的基本理论
    2.1 数据仓库的概念
        2.1.1 数据仓库提出的背景
        2.1.2 数据仓库的定义
        2.1.3 数据仓库与传统数据库的区别
        2.1.4 数据仓库的体系结构
    2.2 数据仓库的关键技术
        2.2.1 联机分析处理技术
        2.2.1.1 OLAP中的基本概念
        2.2.2.2 OLAP中的数据操作
        2.2.2.3 OLAP与OLTP的区别
        2.2.2 抽取转化分析技术
        2.2.3 数据分析技术
    2.3 构建数据仓库的方法
    2.4 数据模式
    2.5 主流数据仓库厂商及产品
第三章 系统的总体设计
    3.1 系统需求分析
    3.2 系统的建设原则
    3.3 总体蓝图
    3.4 系统的阶段性目标
    3.5 基于数据仓库系统的体系结构
    3.6 系统的设计目标
    3.7 系统的关键模块结构
        3.7.1 数据抽取子系统
        3.7.2 多维分析子系统
    3.8 系统的处理流程
第四章 数据抽取子系统的设计与实现
    4.1 数据抽取子系统需求分析
    4.2 ETL工具的选取
    4.3 数据抽取子系统总体设计
    4.4 数据抽取子系统模块的设计
    4.5 数据转化模块的设计
    4.6 数据加载模块的设计
    4.7 元数据管理模块的设计
第五章 多维分析子系统的设计与实现
    5.1 多维分析子系统需求分析
    5.2 多维分析子系统总体设计
    5.3 运营管理数据集市的设计
    5.4 多维分析子系统的功能设计
        5.4.1 简单的Web访问方式和操作界面
        5.4.2 快速的响应能力
        5.4.3 良好的系统可扩展性
        5.4.4 基于维度的用户权限控制
        5.4.5 灵活的图形化操作方式
        5.4.6 定制参数的交叉报表
    5.5 多维分析子系统的模块设计
第六章 系统软、硬件设计
    6.1 硬件设备配置
        6.1.1 系统拓扑图
        6.1.2 DW数据仓库服务器
        6.1.3 目标数据库服务器
        6.1.4 数据接口服务器
        6.1.5 WEB服务器集群
        6.1.6 存储设备
    6.2 系统软件及工具配置
        6.2.1 操作系统
        6.2.2 数据库
        6.2.3 工具软件
第七章 工作展望及总结
    7.1 工作展望
    7.2 总结
第八章 主要成果
参考文献
致谢

(7)关于异构数据源的整合与集成模式的研究 ——采用多服务器实现综合性能优化的OLAP系统(论文提纲范文)

目录
摘要
ABSTRACT
第1章 绪论
    1.1 研究背景
    1.2 OLAP的研究现状和发展趋势
    1.3 多服务器系统的研究现状和发展趋势
    1.4 本文的主要研究内容
第2章 数据仓库的OLAP技术
    2.1 数据仓库理论
        2.1.1 数据仓库的定义
        2.1.2 数据仓库的特征
    2.2 数据仓库结构
    2.3 OLAP概述
        2.3.1 OLAP的定义
        2.3.2 OLAP的特征
    2.4 OLAP的结构和数据组织
        2.4.1 OLAP的结构
        2.4.2 OLAP的数据组织方式
    2.5 OLAP查询的可拆分性研究
    2.6 OLAP的发展
        2.6.1 WEB OLAP
        2.6.2 OLAP+数据挖掘
    2.7 本章小结
第3章 多复制服务器系统
    3.1 多复制服务器系统概述
    3.2 多复制服务器系统的组织形式
        3.2.1 集中式服务器集群
        3.2.2 分布式服务器集群
    3.3 多复制服务器系统数据和负载的分配
    3.4 多复制服务器系统数据的无阻塞更新
        3.4.1 多复制服务器的数据更新
        3.4.2 多复制服务器的数据协调
    3.5 本章小结
第4章 多复制服务器OLAP系统的分析
    4.1 当前主要OLAP系统的分析
        4.1.1 Oracle OLAP工具
        4.1.2 Microsoft OLAP工具
        4.1.3 IBM OLAP工具
    4.2 当前分布式应用的分析
        4.2.1 分布式应用的现状
        4.2.2 本课题中多服务器系统的选择
    4.3 多复制服务器OLAP系统设计的目标和功能
    4.4 多复制服务器OLAP系统的物理和逻辑模型
    4.5 本章小结
第5章 多复制服务器OLAP系统的设计和实现
    5.1 系统设计的概述
    5.2 OLAP多维数据库的设计与实现
        5.2.1 OLAP多维数据库的数据来源—数据仓库的设计
        5.2.2 OLAP多维数据库的建立
    5.3 主从式应用服务器系统的设计与实现
        5.3.1 Socket基础通讯模块的设计
        5.3.2 主从式应用服务器系统的设计
    5.4 系统中其它部分的设计
    5.5 本章小结
第6章 系统的优化和实验结果
    6.1 OLAP多维数据库的优化
        6.1.1 OLAP数据源—关系数据库的优化
        6.1.2 维和立方体的优化
        6.1.3 MDX查询和计算的优化
    6.2 主从式多复制服务器的优化
    6.3 OLAP系统实验结果
    6.4 本章小结
结论
致谢
参考文献

(8)多维数据关联规则挖掘研究及系统实现(论文提纲范文)

内容提要
Abstract
第一章 绪论
    1.1 引言
    1.2 研究的目的
        1.2.1 缺乏针对多维数据的关联规则挖掘方案
        1.2.2 缺乏动态选取概念层次的多维关联规则挖掘算法
        1.2.3 用户面对大量的规则而茫然
    1.3 论文的主要工作和组织
第二章 相关理论
    2.1 数据仓库与多维数据
        2.1.1 数据仓库概念
        2.1.2 数据仓库与数据库的区别
        2.1.3 建立数据仓库的目的
        2.1.4 数据仓库目前应用
        2.1.5 数据仓库前景
    2.2 OLAP 联机分析处理
        2.2.1 OLAP 产生背景
        2.2.2 OLAP 及相关概念
        2.2.3 OLAP 的特性
        2.2.4 OLAP 分类
        2.2.5 OLAP 的多维数据分析基本功能
        2.2.6 流行的OLAP 工具
    2.3 联机分析挖掘OLAM
        2.3.1 OLAM 概念
        2.3.2 OLAM 集成原因
        2.3.3 OLAM 体系结构
第三章 数据挖掘基础
    3.1 数据挖掘概论
        3.1.1 数据挖掘的定义
        3.1.2 数据挖掘的目标
        3.1.3 数据挖掘与知识发现
        3.1.4 数据挖掘的过程
    3.2 关联规则基础理论
        3.2.1 关联规则基本概念
        3.2.2 关联规则挖掘的过程
        3.2.3 关联规则挖掘的Apriori 算法
第四章 基于OLAP 的多维关联规则挖掘
    4.1 产生数据立方
    4.2 产生维内频繁项目集
        4.2.1 维内频繁项目集挖掘算法
        4.2.2 维内频繁项目集挖掘基本原理
        4.2.3 维内频繁项目集挖掘举例说明
        4.2.4 维内频繁项目集挖掘图示说明
    4.3 产生维间频繁项目集
        4.3.1 带Apriori 剪枝的维间频繁项目集挖掘算法
        4.3.2 不带Apriori 剪枝的维间频繁项目集挖掘算法
        4.3.3 两种不同的维间挖掘算法性能对比
    4.4 产生混合维频繁项目集
    4.5 从频繁项目集中产生强关联规则
        4.5.1 产生多维强关联规则
        4.5.2 产生基于兴趣度的多维强关联规则
        4.5.3 产生基于兴趣度的约束多维强关联规则
    4.6 挖掘多层关联规则
第五章 系统实现及实验测试
    5.1 主要功能
    5.2 系统使用说明
        5.2.1 系统主界面
        5.2.2 参数设置
        5.2.3 版本说明
        5.2.4 产生维内频繁项目集
        5.2.5 产生维间频繁项目集
    5.3 实验数据集说明及测试结果
        5.3.1 实验数据集说明
        5.3.2 测试结果
第六章 结论及进一步研究方向
    6.1 研究总结
    6.2 进一步的研究方向
参考文献
论文摘要
ABSTRACT
致谢

(9)空间数据仓的构建及应用(论文提纲范文)

中文摘要
英文摘要
创新点摘要
第1章 引言
    1.1 论文的研究背景与选题依据
    1.2 三维地质建模与三维 GIS 研究现状
        1.2.1 三维地质模型的研究现状
        1.2.2 三维 GIS 研究现状
        1.2.3 地质构造三维模型构建的典型方法
    1.3 空间数据仓研究现状
    1.4 课题研究的目标、研究内容及关键问题
        1.4.1 研究目标
        1.4.2 主要研究内容
        1.4.3 关键问题
    1.5 论文工作情况
第2章 空间数据仓的石油勘探应用模式探讨
    2.1 空间数据仓简介
        2.1.1 空间数据仓库的基本概念
        2.1.2 空间数据仓的构成
        2.1.3 空间数据仓的基本特点
    2.2 石油勘探开发业务及数据需求分析
        2.2.1 石油勘探开发数据特点分析
        2.2.2 分析解释评价中常用的图件的特点及数据来源分析
        2.2.3 石油勘探各阶段业务流程分析总结
        2.2.4 油气勘探开发中的数据管理技术
    2.3 面向石油勘探开发的数据仓技术及关键问题
        2.3.1 石油勘探开发中空间数据仓应用的必要性
        2.3.2 基于空间数据仓的数据管理构架
        2.3.3 空间数据仓的构建步骤
        2.3.4 空间数据仓的应用模式
        2.3.5 空间数据仓的构建模式
        2.3.6 与其他数据管理模式的关系
        2.3.7 空间数据仓构建所面对的关键问题
    2.4 小结
第3章 基于尺度的空间数据仓逻辑模型
    3.1 地学空间与地学信息空间
        3.1.1 地学空间及其特征
        3.1.2 地学空间实体
        3.1.3 地学信息空间
        3.1.4 从地学空间到地学信息空间
        3.1.5 地学信息空间表达
    3.2 广义尺度下的地学空间数据及其特征
        3.2.1 广义尺度概念
        3.2.2 广义尺度的内容构成
        3.2.3 地学空间数据表达
        3.2.4 地学空间数据的基本特征
    3.3 基于尺度的空间数据仓模型
        3.3.1 空间多维模式
        3.3.2 基于尺度的空间多维数据集
        3.3.3 空间度量的多尺度聚合
    3.4 小结
第4章 基于尺度的空间数据仓物理模型
    4.1 适于油气勘探分析评价的多维数据集模型
    4.2 多尺度的空间事实表达
        4.2.1 地学空间多尺度表达的要求
        4.2.2 地质体的空间多尺度划分
        4.2.3 地质场空间多尺度划分
        4.2.4 基于体元的多尺度地学空间模型
    4.3 多维分析中的地学维度建模
        4.3.1 多维分析中常用的地学维度
        4.3.2 基于体元关联的地学属性组织
    4.4 地学对象的离散化(体元化)
        4.4.1 地学空间的空间域定义
        4.4.2 地学空间离散化(体元化)
        4.4.3 基于地学空间划分的地学对象的离散化(体元化)
    4.5 小结
第5章 基于空间数据仓的数据分析
    5.1 基于空间多维数据集的地学空间分析
        5.1.1 基于空间多维数据集的空间邻域分析
        5.1.2 基于空间多维数据集的空间剖切及钻取分析
        5.1.3 地学分析中常见的空间度量
    5.2 基于空间多维数据集的多维分析
        5.2.1 数据集切片
        5.2.2 基于空间事实表的数据集细化
        5.2.3 数据集多维查询
        5.2.4 基于多维数据集的联机分析(OLAP)
    5.3 小结
第6章 空间数据仓原型的设计实现
    6.1 原型系统的设计目标与技术难点
    6.2 原型系统的设计
        6.2.1 原型系统的构架
        6.2.2 原型系统的功能模块
    6.3 技术难点解决方案
    6.4 软件平台及参考的计算机软件标准
    6.5 原型系统简介
    6.6 小结
第7章 东营凹陷区域数据的空间数据仓建模
    7.1 东营凹陷勘探数据基本情况
    7.2 多尺度空间多维数据集的构建
    7.3 基于空间多维数据集的分析
        7.3.1 数据集多维查询分析
        7.3.2 空间联机分析(空间 OLAP)
    7.4 小结
第8章 结论与建议
    8.1 主要研究工作及创新性成果
    8.2 下一步研究的建议
参考文献
致谢
个人简历、在学期间的研究成果

(10)数据挖掘在客户分析中的应用(论文提纲范文)

摘要
Abstract
第1章 绪论
    1.1 研究背景
    1.2 研究现状及问题分析
        1.2.1 研究现状
        1.2.2 问题分析
    1.3 本文的研究内容和意义
    1.4 本文的组织安排
第2章 数据仓库与数据挖掘理论基础
    2.1 数据仓库技术
        2.1.1 数据仓库的概念与特征
        2.1.2 数据仓库的工作过程
    2.2 数据挖掘技术
        2.2.1 数据挖掘的概念
        2.2.2 数据挖掘的过程
        2.2.3 数据挖掘的方法和工具
        2.2.4 数据挖掘的应用
    2.3 小结
第3章 基于网络论坛的数据仓库的构建
    3.1 研究对象
        3.1.1 自然背景
        3.1.2 技术背景
    3.2 问题建模
        3.2.1 问题描述
        3.2.2 计算指标
    3.3 构建数据仓库
        3.3.1 OLAP技术
        3.3.2 数据预处理
        3.3.3 创建维度
        3.3.4 创建数据立方体
    3.4 本章小结
第4章 基于网络论坛的数据挖掘
    4.1 数据汇总
        4.1.1 用户组别分析
        4.1.2 用户注册时间分析
        4.1.3 用户使用时间分析
        4.1.4 目前活跃用户分析
        4.1.5 目前使用论坛用户分析
        4.1.6 主题版块分析
        4.1.7 主题发出时间分析
        4.1.8 主题被关注情况分析
        4.1.9 主题质量分析
    4.2 针对全局数据的数据挖掘
        4.2.1 挖掘模型与工具
        4.2.2 基于论坛的聚类分析
        4.2.3 基于论坛的决策树分析
    4.3 基于局部数据的数据挖掘
        4.3.1 模糊聚类
        4.3.2 FCM改进及应用
        4.3.3 关联规则及应用
    4.4 孤立点分析
    4.5 本章小结
第5章 结论
参考文献
攻读学位期间公开发表论文
致谢
研究生履历

四、数据仓库、数据挖掘和OLAP分析及其应用实例(论文参考文献)

  • [1]数据仓库技术在税收分析系统开发中的应用[D]. 王俊. 南昌大学, 2012(05)
  • [2]面向多维分析即席报表组件的研究与实现[D]. 吴占锋. 昆明理工大学, 2012(12)
  • [3]河北网通基于数据仓库的帐务决策分析系统的设计与实现[D]. 高红涛. 电子科技大学, 2011(04)
  • [4]基于数据挖掘的税源分析关键技术研究[D]. 胡琴. 西北农林科技大学, 2009(S2)
  • [5]基于病案资源的决策支持系统的应用和研究[D]. 周蓝粢. 中南大学, 2008(01)
  • [6]内蒙古网通经营分析系统的设计与实现[D]. 祁贵宝. 内蒙古大学, 2008(02)
  • [7]关于异构数据源的整合与集成模式的研究 ——采用多服务器实现综合性能优化的OLAP系统[D]. 费赓柢. 江南大学, 2008(03)
  • [8]多维数据关联规则挖掘研究及系统实现[D]. 马安胜. 吉林大学, 2007(05)
  • [9]空间数据仓的构建及应用[D]. 郭加树. 中国石油大学, 2007(03)
  • [10]数据挖掘在客户分析中的应用[D]. 薛黎明. 大连海事大学, 2007(02)

标签:;  ;  ;  ;  ;  

数据仓库、数据挖掘和OLAP分析及其应用实例
下载Doc文档

猜你喜欢