一、Web数据挖掘系统的设计及关键技术研究(论文文献综述)
刘奕[1](2020)在《5G网络技术对提升4G网络性能的研究》文中进行了进一步梳理随着互联网的快速发展,越来越多的设备接入到移动网络,新的服务与应用层出不穷,对移动网络的容量、传输速率、延时等提出了更高的要求。5G技术的出现,使得满足这些要求成为了可能。而在5G全面实施之前,提高现有网络的性能及用户感知成为亟需解决的问题。本文从5G应用场景及目标入手,介绍了现网改善网络性能的处理办法,并针对当前5G关键技术 Massive MIMO 技术、MEC 技术、超密集组网、极简载波技术等作用开展探讨,为5G技术对4G 网络质量提升给以了有效参考。
简圣光[2](2019)在《融入Web数据挖掘的校企人才对接平台的研究和实现》文中提出过去几十年,Web数据随着互联网的迅猛发展不断激增,如何有效地从这些难以计数的Web数据之中挖掘隐藏的、有价值的信息并加以利用,已成为当前数据挖掘领域的研究热点。另一方面,据调研,仅有10%的大学生第一次就业时找到了完全适合自己的工作。这反映了当前高校大学生对所学知识与工作内容的契合度没有充分的了解。而企业也长期存在精准定位招聘人才难,招聘成本高、周期长、效果差,留住人才难、人才沟通难等问题。针对上述问题,本文提出两个Web数据挖掘算法,并通过实际调研,从当前学生和企业的普遍痛点入手,以茶歇文化为媒介,设计搭建了一个用于高校与企业的人才对接的系统平台。同时将两个Web数据挖掘算法融入其中,以持续改善用户使用体验。论文主要工作有:(1)提出一种新的基于图模型的岗位信息文档关键词提取算法以挖掘当前热门的关键词。该算法使用传统的TextRank提取出来的关键词构造顶点,以时间和点击量两个因素计算边权重,最后进行随机游走不断迭代提取出关键词。(2)提出一种改进的AprioriAll算法从Web日志中挖掘用户的偏好路径。该算法减少了数据库的扫描次数,并通过先验地剪除不满足最小支持度的侯选项集的方法仅生成有效的候选项集。实验表明,相比原算法,改进后的AprioriAll算法具有更低的时空复杂度,挖掘性能得到了提升。(3)使用Spring Boot+Mybatis+Vue.js全栈技术完整地实现了一个校企人才对接系统平台,并利用上述算法实现了岗位关键词提取和用户偏好路径挖掘模块。最后对系统进行了功能和性能测试,结果表明Web数据挖掘算法提升了校企人才对接的效率。
冯扬文[3](2018)在《大数据视角下的国际集装箱海运运价预测研究》文中研究表明自2008年金融危机以来,中国对世界经济增长的贡献率一直保持在30%左右,早在2010年中国就成为世界第二大经济体,2013年成为世界第一大货物贸易国①,2017年我国进出口贸易总额为27.79万亿元。国际航运服务于国际贸易,而国际贸易中90%的物流由国际海运来完成。20世纪70年代开始流行的集装箱技术让洲际运输成本进一步大幅度降低,为全球贸易提供了更加便利的条件②,近年来国际集装箱航运市场运价波动剧烈,不可预见性增强,而国际集装箱海运业是一个需要巨大投入的资本密集型行业,运价的剧烈波动给航运企业,贸易商以及行业整体带来了巨大的风险,运价波动趋势研究和运价预测一直是国际集装箱航运业关注的热点,国际集装箱海运运价预测的研究在提高行业成本管理水平、降低行业违约率、提高国际海运运输组织的执行效率以及政府决策量化参考等方面有着积极的作用。本文从情报预测是情报学重要的应用领域为起始,以研究国际集装箱海运运价预测的理论和方法为目标,概括出“国际集装箱海运运价预测研究”这一命题,在情报学知识发现框架指导下,沿着情报学对于信息的“源”、“流”、“用”的研究思路,结合当前的“大数据时代”,在概要阐述研究意义、国内外研究现状的基础上,构建了研究内容的框架体系;研究内容包括国际集装箱海运运价预测总体框架、国际集装箱海运运价信息集成模型和方法、国际集装箱海运运价数据特征处理方法、国际集装箱海运运价预测模型以及在大数据环境下进行国际集装箱海运运价预测实证分析等内容。国际集装箱海运运价预测总体框架部分,讨论了大数据视角下的国际集装箱海运运价预测的总体流程和框架。认为总体流程主要分为运价信息收集、运价信息处理和集成、探索性数据分析和运价数据特征处理、运价预测模型提出、运价预测模型运算和评估、运价预测模型的使用六个部分,其中运价预测模型的提出、模型的运算、模型的评估是整个研究的难点和重点,而运价信息的处理和集成、运价数据特征处理是运价预测实际操作中具体工作量较大的一个部分。国际集装箱运价信息集成模型和方法部分,主要解决异源异构运价数据的集成问题。认为随着互联网、电子商务和信息技术的发展,国际集装箱海运运价信息越来越呈现出数字化、集中化和实时性强等特点,这为使用数据挖掘技术进行运价预测提供了现实基础,但需要研究信息集成方法来解决运价信息的异构问题;探讨运价预测的要求及运价信息现状后,提出了基于数据仓库的运价信息集成模型、Web运价信息及增量信息获取和集成方法,设计知识库和规则库,运用信息集成模型对异源异构运价信息进行了集成。运价数据特征处理含数据处理和维度衍生两个部分,讨论的技术和方法是为了保证运价数据符合数据挖掘算法的要求和提高运价预测的准确程度。数据处理主要包括对于异常和无效、历史拉链断链等运价数据处理的流程和方法,关键信息与原始运价数据整合方法、特殊特征属性转换方法等的研究;围绕基本运价数据的维度衍生策略主要包括横向、纵向、历史变化、指数日期等维度衍生的方法,以及预测目标维度的衍生策略。基于数据挖掘方法的运价预测模型部分探讨了国际集装箱海运运价预测的总体框架,针对预测运价即期走势(分类问题)和涨跌幅(回归问题)这两个目标讨论了预测模型和结果评价指标体系。并尝试对传统的数据挖掘算法进行优化,讨论了自适应网格搜索策略,以优化算法的超参数调优方法;针对国际集装箱海运运价数据具有明显的时间序列特征,探索了基于时间序列的留出法(THO),以优化预测结果评价策略,降低泛化误差;讨论基于梯度提升决策树(GBDT)算法的并行计算及预排序后的损失函数迭代运算优化策略,提高GBDT算法在大数据环境下的运算效率。运价预测实证研究部分,面对海量的国际集装箱海运真实运价数据,结合运价预测模型未来的大数据应用环境,按照本文讨论的流程、方法、模型和优化策略,设计和构建基于大数据技术的信息化平台,进行国际集装箱海运运价的即期走势和涨跌幅预测。数据来源有三个渠道,一为某市国际集装箱海运订舱电子商务平台(物贸汇)的历史运价数据,二为某大型国际货运代理企业业务系统的运价数据,三为采集自国内较为知名的国际集装箱海运订舱业务网站(叁陆伍网络等)的Web运价数据,数据总量约为960万条。实证研究表明,本文探索的国际集装箱海运运价预测的流程、模型和方法等内容,成功地探索出从运价信息采集、分析和集成、运价信息处理到运价预测的实现路径,且预测效果明显优于传统时间序列方法的预测结果。文章的最后总结了本文的研究与不足,并对下一步的研究进行了展望。
张凤伟[4](2018)在《基于Web和专利统计分析的用户需求获取与预测方法研究》文中提出用户需求获取和预测对下游产品设计起着重要作用,是产品创新设计成功与否的关键。用户需求的全面提取和准确预测,能有效避免设计资源、时间的浪费,缩短产品开发周期,为产品详细设计阶段提供可靠的指导。本文主要以Web评论数据为初始数据,利用SAS软件Web数据进行处理分析,获取用户显性需求;深入研究用户显性需求与马斯洛需求层次之间的潜在关系,得出用户需求等级;结合专利知识挖掘用户隐形需求,依据需求等级和需求进化定律预测用户新需求。通过上述关键问题的研究,最终形成基于Web评论数据和专利知识获取并预测用户需求的方法模型。论文的主要工作包括以下几个方面:1.利用自然语言处理技术对采集的Web产品评论数据进行文本分析;利用SAS软件基于特征提取技术并结合构建的网络产品评论停用词表,获取用户显性需求。2.通过SAS软件采用结构方程模型(SEM)过程分析显性需求与马斯洛需求层次之间的潜在关系;根据数据分析结果确定用户需求权重,并分析对各需求层次影响最为关键的用户显性需求。3.以用户显性需求或相近表述为关键词,进行相关专利检索,并提取专利知识单元;通过专利知识单元与需求的转化模型,结合用户需求等级以及需求进化定律挖掘用户隐性需求;依据Kano属性以及需求权重从产品功能、性能以及外观三个方面对用户需求分类,最终形成用于产品创新设计的用户需求,供设计人员参考。4.以儿童用双轮智能平衡车为例,依据用户需求获取和预测方法完成产品功能、性能以及外观三个方面的用户需求获取及预测,对产品前端设计提供有价值的参考,验证了此方法的可行性和有效性。
王军[5](2018)在《基于Hadoop/Hive与WebGIS气象数据挖掘系统的研究》文中研究指明随着监测设备和观测手段的逐步提升,人类日常接收的气象数据呈几何式的增长,传统的存储技术已经无法满足海量数据的存储需求。海量数据蕴含着大量有用的信息,对气象数据进行挖掘对人类生产和生活有着举足轻的作用,因而将数据挖掘技术应用到气象领域显的尤为重要。Hadoop作为一种新兴技术,为海量数据的存储和处理提供了新的思路。其中,Hadoop平台下HDFS能够对海量信息进行存储,MapReduce编程模型则使得Hadoop拥有强大的计算能力,而Hive数据仓库能够实现对海量数据的管理,Mahout数据库为科研人员提供了大量的数据挖掘算法,并且运行在Hadoop之上,加快了数据挖掘算法的运行效率。因此,本文首先构建了基于Hive的气象数据仓库,实现了对气象数据的有效管理,创建了基于WebGIS的气象数据挖掘系统,并基于该系统对GSOD数据进行挖掘。本文的研究成果如下:(1)设计并建立一种基于Hive的气象数据仓库。对数据表分别以时间和国家两个字段进行二维分区,实现了对气象数据的降维,加速了数据仓库的查询效率。基于分区表的结构下,再以站点编号作为分桶字段进行分桶操作,减少了跨表查询过程中笛卡尔积的计算,缩短了跨表查询所用的时间。将气象数据组织成SEQUENCEFILE存储格式,改善了 Hive在处理大量小文件的不足。最后通过实验,验证了本气象数据仓库的优越性。(2)基于WebGIS框架,采用Hive和Mahout技术,创造性地将三个技术结合,建立了基于WebGIS的气象数据仓库。对数据挖掘接口、空间插值接口进行设计和实现,最终实现了整个系统的搭建;(3)基于WebGIS气象数据挖掘系统,对全球平均气温变化情况进行分析。研究对比了 1937-2016年前后40年气温的变化情况,并通过皮尔逊检验、M-K检验对全球、南北半球以及中国的年均气温时间序列进行分析。研究发现:后40年全球平均气温较前40年有所上升;全球、南北半球以及中国的年均气温序列表现出了相似的增长趋势;(4)本文提出了一种基于聚类结果的决策树分类模型。使用WebGIS气象数据挖掘系统对全球各站点积温和降水进行层次聚类分析,在结合决策树模型获取聚类集之间的分类规则,最后得到不同等级的水热组合情况。
王思佳[6](2016)在《面向web的文本地理信息挖掘技术研究》文中研究指明地理信息在民用、商用、国防等方面都有着重要的应用,而地理信息的获取却受到多方面限制。目前,互联网中存在着大量的地理信息,通过网络获取地理信息,突破传统地理信息获取手段的限制,已经成为地理信息获取的一种重要手段。但网络数据海量、数据类型繁杂,导致从网络获取地理信息十分困难。为解决这一问题,本文对地理信息的获取及地理信息的分类展开了研究。本文提出一种结合地理信息本体库的主题网络爬虫算法,通过构建地理信息本体库,对网页内容相关度进行评估;同时结合网页链接过滤、网页链接权威度评估,对网页进行网络地理信息的筛选。实验结果表明,本文提出的算法能够有效地过滤与地理信息不相关网页,并提高了地理信息网页获取的准确度。本文针对地理信息分类提出了一种融合距离阈值的最近邻分类算法,该算法依据类别的重心与待分类样本的空间距离,通过对比设定的距离阈值对分类样本进行类别划分。实验结果表明,本文提出的算法能够有效地对地理信息进行分类,分类准确度较高。同时利用Apriori算法实现了对地理信息关联规则的挖掘。最后,利用提出的主题网络爬虫算法、最近邻分类算法,实现了面向web的文本地理信息挖掘系统。该系统将网页文本与地理信息本体库中的本体进行对比,评估网页相关度。筛选并获取地理信息相关度高的网页文本,进行预处理并提取网页文本特征,利用网页文本特征集将网页文本转换为空间向量并进行分类处理。通过对比基础地理信息关键词、提取文本摘要对所需地名地点进行信息抽取。利用Apriori算法实现对地理信息的关联规则提取。系统测试结果表明,本文设计的Web地理信息挖掘系统,实现了 web文本获取、web文本分类、文本信息抽取及地理信息关联规则挖掘的功能。
桑志超[7](2014)在《电子商务环境下的Web数据挖掘系统研究》文中研究指明网络技术的发展使我国电子商务有了很大的进步,网络市场竞争加剧,如何适应市场需求的变化、调整及优化服务方式和管理策略成为企业面临的问题。企业制定决策都要依据访问及交易数据,商家解决这些困境就要具有很强的信息处理、利用能力,进行Web数据挖掘是商家解决电子商务发展中问题的有效途径。本文进行电子商务环境下的Web数据挖掘系统的研究,主要工作内容如下。首先总结目前电子商务中进行Web挖掘的国内外研究现状并对其进行分析,提出该课题的研究内容及意义。分析我国电子商务的发展现状及趋势以及面对的挑战,同时研究Web数据挖掘技术的相关内容,并总结Web数据挖掘在网络交易活动中的应用。其次深入研究Web服务技术、移动Agent技术、软件架构理论及与实际电子商务操作相关的电子商务系统N层体系架构。在此基础之上,提出了一种基于移动Agent和Web服务技术的Web挖掘系统架构。最后进行电子商务环境下Web数据挖掘原型系统的实现来验证架构的性能,研究基于J2EE平台与.NET平台的系统实现技术并进行选择,分析电子商务挖掘系统的逻辑部署,提出系统的模块设计方案,并进行原型系统的实例运行。本文的最终目的是在分析目前电子商务活动中Web挖掘应用现状的基础上,对现有的Web挖掘系统的架构进行改善,提出一种具有更好的跨平台性和更高效的Web挖掘系统架构。
张喆[8](2011)在《电子商务公司Web数据挖掘研究》文中指出本文通过对电子商务企业Web数据挖掘和数据仓库的研究,探讨一种灵活、低成本的数据挖掘体系的构建模式。通过相关资料收集、工作经验的总结,分析国外成熟的自顶向下构建数据挖掘体系的过程,研究近来出现的自底向上构建数据挖掘体系的理论,结合目前国内电子商务公司的需求和Web数据挖掘的不足,特别是分析实际工作中的数据挖掘相关的经验。指出了数据仓库和数据挖掘所需要的服务器环境;提出了项目模块和公共外键的概念,并以这两个概念为核心设计了全新的“自底向上”的数据仓库构建模式;围绕目前电子商务公司关心的核心数据提出了三种数据挖掘模式:个性化网页定制系统、数据库巡检系统、未注册用户行为分析系统,并且这三种系统设计的思想都是以本文设计的数据仓库为基础的。本文设计的灵活、低成本的自底向上的Web数据挖掘系统是可行的、适合电子商务公司的,有利于电子商务公司分析自身经营情况和运营情况。
尚蓉蓉[9](2011)在《面向校园网日志分析的Web数据挖掘技术研究》文中指出随着互联网发展的日趋成熟,人们淹没在充斥着各种各样信息的世界中,面对着纷繁复杂的信息世界却无法有效的选择、吸收和消化信息,陷入了所谓的“信息过载”。无处不在的信息资源的普遍性又增加了人们从大量繁杂信息中寻找自己感兴趣的数据和信息的难度,用户无法有效的选择可以高效搜索自己所需信息资源的方法和工具,又会陷入“信息迷失”现象中。此外,目前检索网上信息的主要手段还是利用搜索引擎来检索,由于大部分搜索引擎都不具有主动性搜索的特点,与用户的交互极少甚至没有,忽略了用户的兴趣偏好和用户需求的差异,因此,基于搜索引擎的普遍检索无法有效的解决“信息过载”和“信息迷失”现象。随着信息技术水平的不断发展和成熟,从海量数据中抽取潜在的、用户感兴趣的知识成为数据挖掘领域中一个非常重要和有意义的研究课题。Web数据挖掘是将数据挖掘和万维网这两个领域中的多种技术和方法结合起来的热门研究课题。一般来说,Web挖掘的研究领域包括Web内容挖掘、结构挖掘和使用挖掘。本文系统的阐述了从数据挖掘、Web数据挖掘到Web日志挖掘的整个过程,Web数据挖掘的预处理、Web日志模式发现以及Web日志模式分析等技术过程,在简要的论述Web日志挖掘的概念、研究内容、关键技术和目前国内外研究状况的基础上,针对我校网站的访问日志,采用数据挖掘技术进行数据分析,重点研究了Web日志挖掘的数据预处理的改进,在理论改进的基础上提出了具体的实验方案,并设计了基于校园网日志分析的Web数据挖掘系统,从而找出用户访问规律和内容喜好,为改进校园网的网站结构和内容提供了决策支持和依据,并通过实验验证了本研究所设计的Web数据挖掘系统的有效性和可行性。论文所做的主要工作是:首先介绍了本文所做研究的现状及趋势,国内外目前对Web日志挖掘研究的情况,然后阐述了数据挖掘和Web数据挖掘以及Web日志挖掘的基本概念和相互之间的联系。接下来分析了Web日志挖掘过程中的数据预处理技术,基于对传统数据预处理阶段中各项任务的完成方法和利用技术进行详尽的分析,然后提出了更新的数据与处理技术,即Frame页面过滤技术,并采用基于ID3算法的技术改进Frame页面过滤技术,最后利用实际的网站模型进行了验证,实验结果表明本文研究的算法在不破坏数据预处理精确度的前提下有效的提高了数据与处理的效率。
李广水[10](2010)在《基于服务的森林资源调查数据挖掘系统的研究》文中认为森林资源调查是林业工作的重要方面,而随着数字化林业的发展,林业基础调查数据的积累呈现快速增长的趋势,如何从海量数据中提取有价值的信息正是林业资源调查数据挖掘所应对的主要问题。在Internet的全球发展战略的影响下,基于WEB服务的应用集成已成为当前及未来信息系统的一个主要趋势,本研究探讨了WEB服务下森林资源调查数据挖掘系统的设计及实现。首先对近年来常用的数据挖掘算法在森林资源调查中的应用进行了归纳总结,概括了不同的挖掘算法在相关领域的应用特点及场景要求,随后对相关技术进行了介绍,在分析了基于WEB服务的数据挖掘模式及其特点的基础上,依据.Net平台分别在不同的模式下开发了数据挖掘的WEB服务:实现属性相关分析的本地数据挖掘和改进的Aprior算法对远程数据的频繁项集的查找,着重研究了针对大数据集的访问、网络资源占用、代码的可伸缩性等方面的系统设计。在此基础上,针对九曲水林场实验区构建了基于小班林分因子调查数据的决策树判定系统,并提出了特征数据集的品质这一概念,在属性约简过程中依此进行了约简阈值的设定,并基于.Net和WSBPEL进行了系统设计;针对决策树构建过程中易于出现数据碎片、子树重复等问题,进一步提出了基于分形维构建特征数据集的方法,分析了依据分形维数和信息增益对冗余属性的删除以及特征集的信息损失对决策树构建的影响;本部分的最后,依据实验数据比较分析了两种决策树归纳的特点。作为服务于大面积区域调查的一个重要数据来源,遥感数据在森林资源调查中的应用占据着越来越重要的位置,为此,基于WCS标准,分别研究了面向服务的遥感数据挖掘模式及其基于工作流的分布式系统架构,并采用.Net体系及WSBPEL流程建模语言,具体设计了一个遥感影像纹理关联规则的挖掘系统。基于此,提出了基于频繁项集的遥感图像特征抽取,该方法首先依据项集的频繁度及空间分布筛选候选频繁项集,再定义每一个频繁项集的空间表达能力值构建特征集。仿真在遥感图像上进行测试检验,针对EM算法对初始设置比较敏感的特点,采用了对同一特征集指定不同聚类数目并比较对数似然值确定最终聚类结果的方法。试验结果表明,本文提出的频繁集对研究区的林区具有较好的判别之后,在分析了支持向量算法的特点及协同训练理论的基础上,依据遥感影像的纹理特征,提出了基于纹理特征值及像素灰度值构建的两个训练集上协同训练支持向量机的算法CTSVMTRS,并具体设计了分布式CTSVMTRS系统。论文主要分析了如何针对一般森林资源调查的事务数据和遥感数据构建基于WEB服务上的数据挖掘系统,从对一些经典算法的系统设计过程中探讨了具体实现过程中的关键技术及算法改进策略,并对相关的设计进行了实验分析,仿真主要从两个方面进行:WEB系统的可行性及改进算法的有效性,实验结果证明了相关的观念,也表明了本研究在林业信息化应用集成方面具有一定的参考价值。
二、Web数据挖掘系统的设计及关键技术研究(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、Web数据挖掘系统的设计及关键技术研究(论文提纲范文)
(1)5G网络技术对提升4G网络性能的研究(论文提纲范文)
引言 |
1 4G网络现处理办法 |
2 4G网络可应用的5G关键技术 |
2.1 Msssive MIMO技术 |
2.2 极简载波技术 |
2.3 超密集组网 |
2.4 MEC技术 |
3 总结 |
(2)融入Web数据挖掘的校企人才对接平台的研究和实现(论文提纲范文)
摘要 |
abstract |
第1章 绪论 |
1.1 研究背景与意义 |
1.2 国内外研究现状 |
1.2.1 Web数据挖掘 |
1.2.2 关键词提取 |
1.3 论文主要研究内容 |
1.4 论文章节安排 |
1.5 本章小结 |
第2章 相关理论介绍 |
2.1 Web数据挖掘 |
2.1.1 Web数据挖掘定义 |
2.1.2 Web挖掘分类 |
2.1.3 Web数据挖掘的目的 |
2.2 超图概述 |
2.3 Spring Boot+Mybatis+Vue.js全栈技术 |
2.3.1 Spring Boot、Mybatis、Vue.js简介 |
2.3.2 Spring Boot+Mybatis+Vue.js全栈技术简介 |
2.4 本章小结 |
第3章 基于超图的岗位信息关键词提取算法 |
3.1 引言 |
3.2 关键词提取流程 |
3.3 数据预处理 |
3.3.1 数据清洗 |
3.3.2 词性标注 |
3.4 候选词集的初筛 |
3.4.1 单字筛除 |
3.4.2 停用词筛除 |
3.5 TextRank算法 |
3.6 基于超图的岗位信息提取关键词提取算法 |
3.6.1 构造超图 |
3.6.2 顶点权重计算 |
3.6.3 超边权重计算 |
3.6.4 随机游走 |
3.7 实验与分析 |
3.7.1 实验环境 |
3.7.2 实验结果与分析 |
3.8 本章小结 |
第4章 基于改进的AprioriAll用户偏好路径挖掘算法 |
4.1 引言 |
4.2 日志数据格式说明 |
4.3 数据预处理 |
4.3.1 数据清洗 |
4.3.2 常规预处理 |
4.4 改进的数据挖掘算法 |
4.5 基于改进的AprioriAll用户频繁路径挖掘流程 |
4.6 实验与分析 |
4.6.1 实验数据与实验环境 |
4.6.2 实验方法 |
4.6.3 实验结果与分析 |
4.7 本章小结 |
第5章 系统设计与实现 |
5.1 系统总体设计 |
5.2 系统功能概述 |
5.3 系统架构设计概述 |
5.4 基于超图的岗位信息关键词提取模块实现 |
5.4.1 岗位信息数据库设计 |
5.4.2 数据预处理模块实现 |
5.4.3 算法实现模块 |
5.5 Web日志挖掘子模块实现 |
5.5.1 数据预处理模块的实现 |
5.5.2 Web日志挖掘实现模块 |
5.6 业务系统实现和测试 |
5.6.1 业务系统实现举例 |
5.6.2 业务系统软件测试 |
5.7 本章小结 |
第6章 总结和展望 |
6.1 课题主要成果总结 |
6.2 后续工作与展望 |
参考文献 |
致谢 |
在学期间发表的学术论文与研究成果 |
(3)大数据视角下的国际集装箱海运运价预测研究(论文提纲范文)
摘要 |
Abstract |
1 绪论 |
1.1 研究的背景及意义 |
1.1.1 命题提出 |
1.1.2 研究意义 |
1.2 国内外研究现状综述 |
1.2.1 信息集成 |
1.2.2 数据挖掘 |
1.2.3 大数据 |
1.2.4 海运运价预测 |
1.3 研究的目标和关键问题 |
1.3.1 研究目标 |
1.3.2 拟解决的关键问题 |
1.4 研究的思路和方法 |
1.4.1 研究思路 |
1.4.2 研究方法 |
1.5 研究的内容和创新点 |
1.5.1 研究内容 |
1.5.2 本文的特色与创新之处 |
2 相关概念和理论 |
2.1 信息集成 |
2.1.1 联邦数据库 |
2.1.2 数据仓库 |
2.1.3 Wrapper-Mediator |
2.2 数据处理 |
2.2.1 数据质量分析 |
2.2.2 归一化处理 |
2.2.3 相关性分析 |
2.3 数据挖掘 |
2.3.1 评估方法 |
2.3.2 数据挖掘方法 |
2.3.3 超参数调优方法 |
2.3.4 评价指标 |
2.4 大数据技术 |
2.4.1 MPI |
2.4.2 Hadoop体系 |
2.4.3 Spak |
2.5 本章小结 |
3 国际集装箱海运运价预测总体框架 |
3.1 总体流程 |
3.1.1 运价信息处理和集成 |
3.1.2 运价数据特征处理和EDA |
3.1.3 运价预测模型提出 |
3.1.4 运价预测模型计算和评估 |
3.1.5 运价预测模型使用 |
3.2 总体架构 |
3.2.1 信息集成 |
3.2.2 存储管理 |
3.2.3 数据挖掘 |
3.3 本章小结 |
4 国际集装箱海运运价信息集成模型和方法 |
4.1 运价数据来源分析 |
4.1.1 国际海运电商平台 |
4.1.2 业务操作系统 |
4.1.3 常用办公软件 |
4.1.4 政府或职能部门的系统 |
4.2 运价数据特征分析 |
4.2.1 海量、实时和真实 |
4.2.2 易于存储、传输和处理 |
4.2.3 普遍存在异构性 |
4.3 运价数据集成目标研究 |
4.4 基于数据仓库的运价信息集成模型 |
4.5 实现运价信息集成的关键技术 |
4.5.1 定义数据仓库模型 |
4.5.2 集成异构信息 |
4.5.3 处理增量信息 |
4.5.4 设计基于语义的知识库和规则库 |
4.6 运价信息初步集成方法 |
4.6.1 运价基本数据初步处理方法 |
4.6.2 异源异构运价数据集成方法 |
4.7 运价信息合并 |
4.7.1 相关性分析 |
4.7.2 数据整合并去重 |
4.8 本章小结 |
5 运价数据特征处理方法 |
5.1 有效运价信息生成方法 |
5.1.1 运价信息筛选方法 |
5.1.2 无效数据处理逻辑和方法 |
5.1.3 异常值处理的逻辑和方法 |
5.2 异源运价值处理 |
5.3 历史拉链断链数据处理 |
5.4 关键特征属性补充 |
5.4.1 港口基本属性分析 |
5.4.2 离散型特征值处理方法 |
5.4.3 关键信息替换方法 |
5.4.4 基于基础信息的关键属性拓展 |
5.4.5 预测目标选择方法 |
5.5 运价信息的维度衍生 |
5.5.1 横向同期指标 |
5.5.2 纵向历史指标 |
5.5.3 历史变化指标 |
5.5.4 运价预测总体目标维度衍生 |
5.5.5 重要特征属性衍生策略 |
5.5.6 补充属性设计 |
5.6 特征转换 |
5.6.1 One-Hot Encoding |
5.6.2 归一化处理 |
5.7 本章小结 |
6 基于数据挖掘方法的运价预测模型 |
6.1 运价预测模型的基本框架 |
6.2 运价预测模型设计 |
6.2.1 模型的输入和输出 |
6.2.2 运价数据特征属性分析 |
6.2.3 数据挖掘方法选取分析 |
6.2.4 运价预测结果评价指标研究 |
6.3 实现运价预测的算法和评价策略优化 |
6.3.1 自适应网格搜索策略设计 |
6.3.2 基于时间序列的留出法(THO)设计 |
6.3.3 基于GBDT的算法优化策略设计 |
6.4 本章小结 |
7 运价预测系统设计及实验 |
7.1 运价数据准备 |
7.2 数据集成和数据特征处理 |
7.2.1 预测目标选择 |
7.2.2 关键信息补全 |
7.3 运价数据EDA分析 |
7.3.1 运价数据分布性分析 |
7.3.2 运价波动趋势统计 |
7.4 运价预测系统设计及实现 |
7.4.1 运价预测系统方案设计 |
7.4.2 基于大数据技术的系统架构 |
7.4.3 运价信息集成结果 |
7.4.4 运价预测结果 |
7.5 本章小结 |
8 总结和展望 |
8.1 研究总结 |
8.2 研究展望 |
参考文献 |
科研及发表论文情况 |
致谢 |
(4)基于Web和专利统计分析的用户需求获取与预测方法研究(论文提纲范文)
摘要 |
abstract |
第一章 绪论 |
1.1 引言 |
1.2 研究背景、问题的提出及意义 |
1.2.1 研究背景 |
1.2.2 研究问题的提出 |
1.3 国内外研究现状 |
1.3.1 Web数据挖掘 |
1.3.2 产品评论文本挖掘 |
1.3.3 专利知识信息抽取研究 |
1.4 用户需求获取及预测方法研究现状 |
1.4.1 用户需求获取 |
1.4.2 用户需求分析 |
1.4.3 用户需求预测 |
1.4.4 研究意义 |
1.5 论文主要内容及创新点 |
1.5.1 主要内容 |
1.5.2 论文体系架构 |
第二章 基于Web数据获取用户显性需求 |
2.1 引言 |
2.2 Web产品评论数据采集 |
2.3 基于特征提取技术获取产品特征 |
2.3.1 产品特征提取技术 |
2.3.2 产品特征提取 |
2.4 用户显性需求获取及其流程确定 |
第三章 用户显性需求层次分析与权重计算 |
3.1 引言 |
3.2 基于SAS/VARCLUS过程的用户显性需求聚类分析 |
3.3 用户显性需求与马斯洛需求层次之间的潜在关系分析 |
3.3.1 马斯洛需求层次理论以及SAS/CALIS理论概述 |
3.3.2 构建用户显性需求与马斯洛需求层次之间的路径图 |
3.3.3 基于CALIS过程分析用户显性需求等级 |
3.4 需求权重计算 |
3.5 基于SAS的用户显性需求分析流程 |
第四章 用户需求预测及Kano属性分类 |
4.1 引言 |
4.2 基于专利知识单元的用户隐性需求挖掘 |
4.2.1 基于Web用户显性需求建立目标产品专利知识库 |
4.2.2 基于目标专利库的专利知识单元提取 |
4.2.3 基于专利知识单元的用户隐性需求挖掘 |
4.3 用户需求进化方向预测及分类 |
4.3.1 基于需求进化定律新需求预测模型 |
4.3.2 用户需求分类 |
第五章 用户需求获取及预测方法和实例应用 |
5.1 引言 |
5.2 用户需求获取及预测模型 |
5.3 双轮智能平衡车用户显性需求获取 |
5.3.1 确定目标产品 |
5.3.2 Web产品评论数据采集及文本分词处理 |
5.3.3 目标产品特征提取及有效性判断 |
5.3.4 用户显性需求获取 |
5.4 用户显性需求与马斯洛需求层次之间潜在关系分析 |
5.4.1 用户显性需求变量聚类分析 |
5.4.2 构建结构方程路径图并进行合理性分析 |
5.5 用户隐性需求分析 |
5.5.1 选择目标专利库以及提取专利知识单元 |
5.5.2 用户隐性需求挖掘 |
5.5.3 用户需求分类 |
第六章 结论与展望 |
6.1 主要结论 |
6.2 论文创新点 |
6.3 未来展望 |
参考文献 |
攻读学位期间取得的相关科研成果 |
致谢 |
(5)基于Hadoop/Hive与WebGIS气象数据挖掘系统的研究(论文提纲范文)
摘要 |
Abstract |
第一章 绪论 |
1.0 研究背景和意义 |
1.1 国内外研究现状 |
1.2 论文的主要工作 |
1.3 论文的组织结构 |
第二章 理论与技术 |
2.1 数据仓库 |
2.2 数据挖掘 |
2.3 数据挖掘常用的方法 |
2.4 Hadoop |
2.4.1 HDFS分布式文件系统 |
2.4.2 MapReduce编程模型 |
2.4.3 Hive |
2.4.4 Mahout |
2.5 本章小结 |
第三章 基于Hive的气象数据仓库的设计与测试 |
3.1 数据预处理 |
3.1.1 数据源及其格式 |
3.1.2 数据预处理的流程 |
3.1.3 数据处理的MapReduce编程模型的实现 |
3.2 Hadoop/Hive部署和配置 |
3.2.1 部署Hadoop |
3.2.2 配置Hive |
3.3 Hive气象数据仓库的建立 |
3.3.1 气象数据仓库整体架构设计 |
3.3.2 气象数据仓库ETL过程 |
3.3.3 数据存储格式的选择 |
3.3.4 气象数据仓库表结构的设计 |
3.3.5 气象数据仓库的具体实现 |
3.4 实验测试与结果分析 |
3.4.1 实验环境配置 |
3.4.2 传统数据库和Hive数据仓库效率对比 |
3.4.3 不同表结构下Hive数据仓库性能 |
3.5 本章小结 |
第四章 基于WebGIS的气象数据挖掘系统的设计 |
4.1 WebGIS简介 |
4.2 系统架构的设计 |
4.3 系统的具体实现 |
4.3.1 系统框架的选择 |
4.3.2 数据挖掘接口的设计 |
4.3.3 插值接口的实现 |
4.3.4 Mahout调用Hive的实现 |
4.3.5 系统界面展示 |
4.4 本章小结 |
第五章 全球年均气温变化的时间序列分析 |
5.1 全球年均气温变化的特点 |
5.1.1 全球年均气温变化的年代差异 |
5.1.2 全球年均气温变化的整体趋势 |
5.2 南北半球年均气温时间序列分析 |
5.2.1 南北半球年均气温时间序列总体特征 |
5.2.2 南北半球年均气温时间序列的相关性检验 |
5.2.3 南北半球年均气温时间序列突变性检验 |
5.3 中国年均气温时间序列分析 |
5.3.1 中国年均气温时间序列总体特征 |
5.3.2 中国年均气温时间序列的相关性检验 |
5.3.3 中国年均气温时间序列突变检验 |
5.4 年均气温时间序列的可靠性验证 |
5.4.1 全球年均气温时间序列的检验 |
5.4.2 中国年均气温时间序列的检验 |
5.5 本章小结 |
第六章 基于聚类与决策树算法的积温和降水组合分布的分析 |
6.1 积温和降水组合的分析 |
6.2 积温 |
6.3 积温和降水的聚类过程 |
6.4 基于决策树算法模型的获取 |
6.5 基于决策树模型规则的提取及积温和降水等级的划分 |
6.5.1 决策树模型规则的获取 |
6.5.2 由积温和降水组合决定的水热等级的划分 |
6.5.3 数据格式的转换 |
6.6 全球水热的分布特征 |
6.6.1 各气候带水热等级分布情况 |
6.6.2 气候类型对水热组合的影响 |
6.6.3 洋流对水热组合的影响 |
6.6.4 季风对水热组合的影响 |
6.7 本章小结 |
第七章 结论与展望 |
7.1 结论 |
7.2 创新点 |
7.3 展望 |
参考文献 |
致谢 |
作者简介 |
(6)面向web的文本地理信息挖掘技术研究(论文提纲范文)
摘要 |
Abstract |
第1章 绪论 |
1.1 研究背景及意义 |
1.2 国内外研究现状 |
1.3 课题内容及论文结构 |
第2章 基础理论及关键技术 |
2.1 Web文本地理信息获取技术 |
2.1.1 主题网络爬虫技术 |
2.1.2 地理信息本体库 |
2.2 Web地理信息数据挖掘技术 |
2.2.1 Web数据挖掘技术 |
2.2.2 Web文本挖掘算法 |
2.3 本章小结 |
第3章 Web文本获取技术 |
3.1 传统网络爬虫算法 |
3.2 主题网络爬虫算法 |
3.2.1 地理信息本体库的建立 |
3.2.2 网页链接过滤 |
3.2.3 结合地理信息本体库的主题网络爬虫算法 |
3.3 实验与分析 |
3.3.1 实验内容 |
3.3.2 实验结果 |
3.3.3 实验分析 |
3.4 算法评估 |
3.5 本章小结 |
第4章 Web文本挖掘技术 |
4.1 传统的K最近邻分类算法 |
4.2 融合距离阈值的最近邻分类算法 |
4.3 地理信息关联规则挖掘技术 |
4.4 实验与分析 |
4.4.1 实验内容 |
4.4.2 实验结果 |
4.4.3 实验分析 |
4.5 算法评估 |
4.6 本章小结 |
第5章 Web地理信息挖掘系统的设计与实现 |
5.1 总体设计 |
5.2 地理信息本体库模块 |
5.3 Web地理信息获取模块 |
5.4 Web地理信息挖掘模块 |
5.5 系统测试 |
5.5.1 测试环境 |
5.5.2 测试内容 |
5.5.3 测试结果 |
5.5.4 测试结论 |
5.6 本章小结 |
结论 |
参考文献 |
攻读硕士学位期间发表的论文和取得的科研成果 |
致谢 |
(7)电子商务环境下的Web数据挖掘系统研究(论文提纲范文)
摘要 |
Abstract |
第1章 绪论 |
1.1 课题研究的背景 |
1.2 国内外研究现状及分析 |
1.2.1 国内外研究现状 |
1.2.2 对现状的分析 |
1.3 课题研究的内容和意义 |
1.3.1 课题研究的内容 |
1.3.2 课题研究的意义 |
第2章 Web 挖掘的定义、分类、流程及其在电子商务中的应用 |
2.1 我国电子商务的发展及数据挖掘面临的挑战 |
2.2 Web 数据挖掘 |
2.2.1 数据挖掘 |
2.2.2 Web 数据挖掘的定义 |
2.3 Web 数据挖掘的分类 |
2.3.1 Web 内容挖掘 |
2.3.2 Web 结构挖掘 |
2.3.3 Web 使用挖掘 |
2.4 Web 数据挖掘的流程 |
2.4.1 数据源的收集 |
2.4.2 数据的预处理 |
2.4.3 数据的挖掘阶段 |
2.5 Web 数据挖掘在电子商务中的应用 |
2.5.1 电子商务中 Web 数据挖掘的资源 |
2.5.2 电子商务系统中 Web 数据挖掘的过程 |
2.5.3 将 Web 数据挖掘应用于电子商务的优势 |
2.6 本章小结 |
第3章 Web 服务技术、移动 Agent 技术、软件架构 |
3.1 Web 服务技术及其技术应用 |
3.1.1 Web 服务的定义及体系架构 |
3.1.2 Web 服务实现的主要技术 |
3.1.3 Web 服务合成技术 |
3.2 移动 Agent 技术及其应用环境分析 |
3.2.1 移动 Agent 技术的定义 |
3.2.2 移动 Agent 系统的组成 |
3.2.3 移动 Agent 的优势及其应用 |
3.3 软件架构 |
3.3.1 软件架构的定义 |
3.3.2 软件架构的作用 |
3.3.3 电子商务系统的 N 层体系架构 |
3.4 本章小结 |
第4章 基于移动 Agent 和 Web 服务的 Web 挖掘架构设计 |
4.1 移动 Agent 技术在 Web 服务中的应用 |
4.2 数据挖掘引擎设计 |
4.3 Web 数据挖掘系统总体架构设计 |
4.4 本章小结 |
第5章 电子商务环境下 Web 数据挖掘原型系统的实现 |
5.1 电子商务系统的实现技术 |
5.1.1 基于 J2EE 平台的实现技术 |
5.1.2 基于.NET 平台的实现技术 |
5.1.3 J2EE 平台与.NET 平台的直观比较 |
5.2 Web 数据挖掘流程与电子商务流程的融合 |
5.3 电子商务挖掘系统的功能模块设计 |
5.4 Web 数据挖掘原型系统的实现 |
5.4.1 开发工具介绍 |
5.4.2 数据挖掘原型系统的总体结构 |
5.4.3 数据库连接 |
5.4.4 参数文件格式 |
5.4.5 数据预处理 |
5.4.6 控制中心模块 |
5.4.7 管理算法模块 |
5.5 原型系统的实例运行 |
5.6 本章小结 |
结论 |
致谢 |
参考文献 |
作者简介 |
攻读硕士学位期间发表的论文和科研成果 |
(8)电子商务公司Web数据挖掘研究(论文提纲范文)
致谢 |
中文摘要 |
ABSTRACT |
序 |
1 引言 |
1.1 WEB数据挖掘的研究背景 |
1.2 研究目的和意义 |
1.3 论文结构安排 |
2 电子商务公司相关的WEB数据挖掘理论概述 |
2.1 自动化运维 |
2.2 数据仓库理论 |
2.2.1 起源和体系结构 |
2.2.2 定义 |
2.2.3 设计过程 |
2.2.4 数据仓库模型 |
2.3 WEB数据挖掘基本理论 |
2.3.1 定义 |
2.3.2 分类 |
2.3.3 常见术语 |
3 电子商务公WEB数据挖掘现状 |
3.1 WEB数据挖掘蓬勃发展 |
3.1.1 搜索引擎 |
3.1.2 第三方评估机构 |
3.1.3 自主Web数据挖掘 |
3.2 存在问题 |
3.2.1 非正常目的使用数据挖掘 |
3.2.2 大量使用第三方机构 |
3.2.3 项目阶段不明晰 |
3.2.4 数据仓库的缺失 |
3.2.5 数据挖掘不全面 |
4 电子商务公司WEB数据挖掘变革方案 |
4.1 方案的目标及原则 |
4.2 打破常规思路 |
4.2.1 数据仓库使用的误区 |
4.2.2 数据仓库使用的新思路 |
4.2.3 数据仓库数据的选择 |
4.3 适合WEB数据挖掘的数据管理体系建立 |
4.3.1 机器一体化管理 |
4.3.2 数据库数据管理 |
4.3.3 日志管理 |
4.4 适合WEB数据挖掘的数据仓库设计 |
4.4.1 自底向上数据仓库的构想 |
4.4.2 自底向上数据仓库构建方法 |
4.4.3 自底向上数据仓库构建案例 |
4.4.4 传统方法设计一个数据集市 |
4.4.5 两种方法比较 |
4.4.6 数据加载 |
4.5 WEB数据挖掘应用模式的设计 |
4.5.1 个性化网页定制 |
4.5.2 数据库巡检系统 |
4.5.3 未注册用户行为分析 |
5 低成本、高灵活性的WEB数据挖掘实施及评估 |
5.1 实施目标 |
5.1.1 建立完善的数据管理体系 |
5.1.2 建立可用、灵活、低成本数据仓库 |
5.1.3 实施新设计的挖掘模式 |
5.2 重点和难点分析 |
5.2.1 重点分析 |
5.2.2 难点分析 |
5.3 险分析与控制 |
5.3.1 机器一体化管理风险和控制 |
5.3.2 第一个项目模块风险和控制 |
5.4 实施效果评价 |
5.4.1 机器一体化管理 |
5.4.2 模块化数据仓库建立 |
5.4.3 挖掘模式的适用性、实用性 |
5.5 进度计划 |
5.5.1 数据管理体系 |
5.5.2 可用、灵活、低成本数据仓库 |
5.5.3 新设计的挖掘模式 |
6 结论 |
6.1 论文的研究工作 |
6.2 论文的结论、成果 |
6.3 未来研究展望 |
参考文献 |
附录A |
附录B |
附录C |
作者简历 |
学位论文数据集 |
(9)面向校园网日志分析的Web数据挖掘技术研究(论文提纲范文)
摘要 |
Abstract |
目录 |
第一章 绪论 |
1.1 研究背景及意义 |
1.2 国内外研究现状 |
1.2.1 国外研究状况 |
1.2.2 国内研究现状 |
1.3 本文主要研究内容和意义 |
1.3.1 本文主要工作 |
1.3.2 本文工作意义 |
1.4 本文篇章结构 |
第二章 WEB 数据挖掘研究 |
2.1 数据挖掘理论 |
2.1.1 数据挖掘的概念 |
2.1.2 数据挖掘的功能 |
2.1.3 数据挖掘常用算法 |
2.2 WEB 数据挖掘理论 |
2.2.1 WEB 数据挖掘概念 |
2.2.2 WEB 数据挖掘的分类 |
2.2.3 WEB 挖掘发展 |
2.3 WEB 日志挖掘理论 |
2.3.1 WEB 日志挖掘概念 |
2.3.2 WEB 日志挖掘实现过程 |
第三章 WEB 数据挖掘相关技术研究 |
3.1 数据获取 |
3.2 数据预处理 |
3.2.1 数据清理 |
3.2.2 用户识别 |
3.2.3 会话识别 |
3.2.4 路径补充 |
3.2.5 事物识别 |
3.3 模式发现 |
3.4 模式分析 |
3.5 本章小结 |
第四章 WEB 数据挖掘预处理的改进 |
4.1 数据获取与数据分析 |
4.2 预处理中的 FRAME页面过滤技术 |
4.3 基于 ID3 算法的 FRAME页面过滤 |
4.4 预处理中改进的会话识别算法 |
4.4.1 优化访问时间阈值的会话识别 |
4.4.2 实验结果与分析 |
4.5 本章小结 |
第五章 校园网日志挖掘系统的设计与实现 |
5.1 系统原型设计 |
5.1.1 系统总体设计 |
5.1.2 系统模块功能 |
5.2 模式发现模块设计与实现 |
5.2.1 多元预测模型 |
5.2.2 模型构造与预测算法 |
5.2.3 实验结果与分析 |
5.3 系统实现运行 |
5.4 校园网网站改进意见 |
5.5 本章小结 |
第六章 结论和未来研究展望 |
6.1 全文总结 |
6.2 研究展望 |
致谢 |
参考文献 |
(10)基于服务的森林资源调查数据挖掘系统的研究(论文提纲范文)
摘要 |
Abstract |
前言 |
0.1 立题依据及研究的目的和意义 |
0.2 研究内容 |
0.3 研究方法和技术路线 |
第一章 数据挖掘在森林资源调查中的现状及发展趋势 |
1.1 基于数据库或数据仓库的数据挖掘系统 |
1.2 不同挖掘算法在森林资源调查中的应用 |
1.2.1 C4.5或C5决策树 |
1.2.2 贝叶斯分类 |
1.2.3 回归统计分析 |
1.2.4 聚类分析 |
1.2.5 其它分析方法 |
1.2.6 多方法的结合使用 |
1.3 存在的不足 |
1.4 构建森林资源调查数据分析服务平台 |
第二章 相关技术介绍 |
2.1 SOA及其发展 |
2.2 WEB服务及相关规范 |
2.2.1 WEB服务 |
2.2.2 XML语言 |
2.2.3 SOAP,WSDL,UDDI |
2.2.4 WEB服务调用 |
2.3 .Net平台 |
2.3.1 .Net特点 |
2.3.2 与组件的互操作性 |
2.3.3 .Net对数据的访问 |
2.3.4 .Net对WEB服务的支持 |
2.4 WSBPEL建模语言 |
第三章 基于WEB服务数据挖掘的设计及其关键实现技术 |
3.1 .Net操纵WEB数据库的特点 |
3.2 基于WEB服务的数据挖掘结构设计 |
3.3 对WEB数据库本地的数据挖掘服务 |
3.4 远程WEB数据库的数据挖掘服务 |
3.4.1 关联规则 |
3.4.2 系统实现 |
3.5 仿真实验及分析 |
第四章 九曲水林场的决策树分类系统 |
4.1 研究区概况及研究数据特征 |
4.1.1 九曲水林场概况 |
4.1.2 研究数据 |
4.2 决策树构建的一般原理 |
4.3 基于.Net的WEB服务决策树判定系统的实现 |
4.3.1 对小班调查数据进行属性约减 |
4.3.2 对远程数据集进行决策树归纳 |
4.3.3 利用WSBPEL进行服务集成 |
4.4 实际应用 |
第五章 基于分形维的决策树构建 |
5.1 相关研究 |
5.2 利用分形理论构建特征数据集 |
5.2.1 相关属性分组 |
5.2.2 生成特征数据集 |
5.3 实际应用 |
5.4 实验分析 |
第六章 基于WEB服务的遥感影像关联规则的挖掘 |
6.1 相关研究 |
6.1.1 对遥感影像的数据挖掘 |
6.1.2 面向服务的遥感影像处理 |
6.1.3 WEB服务下遥感数据挖掘的系统设计 |
6.2 遥感影像关联规则挖掘 |
6.2.1 遥感影像纹理关联规则挖掘原理 |
6.2.2 构建WEB服务下的遥感影像纹理关联规则挖掘系统 |
6.3 实际应用及结果分析 |
6.3.1 试验素材及实验设计 |
6.3.2 实验及结果分析 |
第七章 基于频繁特征集判定有林区域比例 |
7.1 基于频繁项的特征抽取 |
7.1.1 找出候选频繁项集 |
7.1.2 定义候选频繁项集的相关属性 |
7.2 实验设计 |
7.2.1 基于EM的聚类设计 |
7.2.2 试验素材及过程 |
7.3 结果分析 |
第八章 分布式协同训练支持向量机对遥感影像的分类 |
8.1 支持向量机及其在遥感中的应用 |
8.1.1 支持向量机 |
8.1.2 支持向量在遥感中的应用 |
8.2 协同训练向量机 |
8.2.1 半监督理论及应用研究 |
8.2.2 协同训练支持向量机对遥感影像的分类 |
8.3 分布式协同训练向量机系统 |
8.3.1 系统设计 |
8.3.2 系统实现 |
8.4 实验及结果分析 |
8.4.1 CTSVMTRS算法对遥感影像的分类 |
8.4.2 基于WEB服务的协同训练 |
第九章 结论与展望 |
9.1 结论 |
9.2 主要创新点 |
9.3 展望 |
参考文献 |
博士在读期间的主要科研成果 |
详细摘要 |
四、Web数据挖掘系统的设计及关键技术研究(论文参考文献)
- [1]5G网络技术对提升4G网络性能的研究[J]. 刘奕. 数码世界, 2020(04)
- [2]融入Web数据挖掘的校企人才对接平台的研究和实现[D]. 简圣光. 华侨大学, 2019(01)
- [3]大数据视角下的国际集装箱海运运价预测研究[D]. 冯扬文. 华中师范大学, 2018(05)
- [4]基于Web和专利统计分析的用户需求获取与预测方法研究[D]. 张凤伟. 河北工业大学, 2018(07)
- [5]基于Hadoop/Hive与WebGIS气象数据挖掘系统的研究[D]. 王军. 南京信息工程大学, 2018(01)
- [6]面向web的文本地理信息挖掘技术研究[D]. 王思佳. 哈尔滨工程大学, 2016(04)
- [7]电子商务环境下的Web数据挖掘系统研究[D]. 桑志超. 河北工程大学, 2014(03)
- [8]电子商务公司Web数据挖掘研究[D]. 张喆. 北京交通大学, 2011(10)
- [9]面向校园网日志分析的Web数据挖掘技术研究[D]. 尚蓉蓉. 西安电子科技大学, 2011(04)
- [10]基于服务的森林资源调查数据挖掘系统的研究[D]. 李广水. 南京林业大学, 2010(02)