一、一种利用数据融合来提高局部性和减少伪共享的方法(论文文献综述)
王帝[1](2021)在《连退生产过程产品质量预测及操作优化》文中进行了进一步梳理在钢铁生产中,钢生产过程是一个具有复杂工序、多种控制变量结合的大型工业流程。连续退火工艺作为带钢生产过程中的关键工艺,对带钢质量起到了决定性的作用。但是由于退火工艺自身的局限性,使得原有的带钢质量检测方法已经不能够满足日益增长的生产需要。此外企业为了进一步提高生产效率和生产质量,针对不同钢材的产品的操作优化也逐渐受到了关注。因此,有必要对连续退火工艺中的产品质量进行预测以及操作优化。本文针对这两个问题,做了以下几个方面研究。针对连续退火过程质量预测,依据对连续退火数据高维度、强耦合等特性的分析,本文将等距特征映射降维算法与集成思想相结合,利用集成模型的特点对不同样本的降维结果进行拟合,并选择支持向量机作为子学习机,提出了一种基于高维数据特性集成建模方法,该方法充分考虑不同样本的特性,使得建模更加精确。此外针对模型中设备、环境以及带钢特性变化带来的模型精度下降,本文在增量支持向量学习机的基础上,对基于降维过程的增量学习进行了研究,利用支持向量集与新增样本集合并降维,并通过基于距离的策略进行筛选,来完成模型的更新。该方法通过实验验证,适应于连续退火生产变化。在质量预测的基础上,本文通过对冷轧连续退火生产工艺和生产过程操作优化的研究,建立了以最小化带钢硬度偏差、最小化机组能源消耗、最大化机组产能为目标的连退生产过程多目标操作优化模型,同时为了能够使算法能够更早的寻找到最优解,需要使初始种群具有较高的质量,设计了一种基于正态分布的启发式来生成初始种群。最后利用差分进化算法DE(Differential Evolution)对模型进行了求解,取得了较原始生产数据更好的效果,能够对生产过程起到指导作用。由于连续退火优化操作变量多、优化复杂,连续退火多目标操作优化模型的求解具有较高难度,为了提高优化算法的寻优能力,本文提出了一种改进变异混合多目标优化算法。通过引入跳基因突变算子来增强NSGA-Ⅱ(Non-dominated sorting genetic algorithm-Ⅱ)的全局搜索能力,利用改进的变异算子来增强DE算法的局部细化搜索能力。并在两种算法集成后,通过贪婪算法对混合解集进行筛选,以及在最优解附近进行混沌搜索,最终得到最优解集。经过测试函数验证,改进后的算法具有良好的寻优效率。最后将该算法应用于连续退火多目标优化模型,求解结果较DE算法有了较大的提高,在保证预测精度的同时,提高生产效率和减少能源消耗。
孟飒[2](2021)在《大规模云计算系统的可靠性建模及优化研究》文中进行了进一步梳理近年来,大规模云计算系统不断成为大数据、物联网、人工智能等应用的重要支撑平台,随着其规模和复杂性的急剧增加,各种硬件和软件故障质变为常态现象,多类型的故障需要及时发现和修复。同时,复杂性不断增加的云计算系统架构对可靠性带来的影响不断凸显(如评估困难、运维低效等),并受到学术界和产业界的广泛关注。如何量化复杂的云计算系统可靠性特征并加以保障和有效提升已经成为了制约云计算产业持续发展的关键问题。在现有的云计算系统可靠性研究中,可靠性往往被作为单一指标进行研究,而忽略了规模、性能、服务质量、能耗等指标和可靠性之间的关联影响,这不仅不利于准确把握可靠性降低对大规模云计算系统带来的严重影响,更不利于在全面兼顾所有指标的基础上进行合理的可靠性优化工作。同时,大规模云计算系统覆盖的故障类型更加广泛,这使得可靠性和其他指标(如能耗)的关联分析更加困难,需要更加准确有效的建模分析方法和更为灵活的优化技术途径来实现关联优化的可靠性保障功能。在实际的应用中,大规模云计算系统需要提供全方面多层次的服务,大量用户的接入、多样化的应用程序、并行的计算能力需求、常态多类型故障都对云计算系统的系统可靠性、服务可靠性、作业可靠性提出了严峻的挑战。而不同于传统的IT系统,大规模云计算系统具有逻辑虚拟化、资源动态整合、应用灵活迁移等不同的技术特点,这使得云计算系统具有更加复杂的故障关联现象和更加灵活的容错技术。在这种情况下,传统的可靠性评估模型或分析技术已经难以直接应用在大规模云计算系统下,相应地,在对大规模云计算系统进行可靠性优化的过程中,必须充分地考虑这些不同的系统结构、技术特征、以及功能指标对可靠性的评估优化带来的重要影响。本文以大规模云计算系统为研究对象,以大规模云计算系统的可靠性建模与优化问题为研究内容,以基于成本约束的多指标关联建模与优化、面向云服务的可靠性建模与优化和基于容错技术的大数据作业可靠性建模为研究重点,分别从系统、服务、应用三个相互关联的角度研究了大规模云计算系统的可靠性建模及优化问题。相关的研究工作覆盖了大规模云计算系统的系统结构、故障类型、容错技术和应用特点等方面,为全面评估大规模云计算系统的可靠性关联特征和持续优化工作提供了新的视角。本文的主要研究工作由以下几部分构成:(1)针对大规模云计算系统的可靠性-能耗的关联建模分析,提出了一套基于成本约束的可靠性-能耗关联优化的策略。相关工作综合运用了故障树建模和优化备用策略的相关技术,考虑了物理节点与虚拟机的共因故障,实现了可靠性与能耗两方面的优化。首先,基于可靠性关联模型提出了成本约束的设计方法,提出了成本约束的可靠性保障框架RAF-CC,集成了基于热备用、冷备用虚拟机的故障树分析方法;随后,提出了可靠性-能耗关联优化的资源调度算法JORE-RSA,通过虚拟机迁移动态保障整个系统的可靠性;最后,在系统实时运行中,利用成本约束寻找优化的云基础设施物理节点数目,提出了最小化物理节点占用算法MPN,进一步优化能效成本。(2)针对大规模云计算系统新兴的云服务模式,在面向多用户、多服务类型的情况下,将云服务过程合理地划分为请求处理阶段和请求执行阶段。在请求处理阶段,利用排队论分析了请求超时和请求溢出故障,而在请求执行阶段,利用kout-of-n系统的建模方法全面分析了热备份下的系统服务过程。基于可靠性的分析,进一步实现了请求处理阶段的动态优化调度技术和请求执行阶段的故障自修复技术。动态优化调度技术基于请求到达率的强度变化,自主触发动态调度机制,而被触发的调度行为不仅维持服务可靠性在指定的水平之上,还避免不必要的资源浪费;故障自修复技术基于服务虚拟机的运行状态监控,自主进行异常检测,在发现可能出现的故障时触发快速地修复行为,并根据修复后的可靠性变化情况进行自我学习提升,不断提高修复行为对可靠性的保障效果,最终使得大规模云计算系统可以在复杂且动态多变的服务环境下,有效维持其服务可靠性。(3)在大数据处理的重要应用场景下,系统地进行了面向不同大数据作业类型和不同容错技术的可靠性建模研究。首先,针对具有阶段性任务的大数据作业,提出了一种采用检查点容错机制的可执行性模型。该模型以大数据作业为单位,细致地分析了作业执行过程中的随机硬件故障、软件故障和恢复行动;采用了马尔可夫随机过程、拉普拉斯-斯蒂尔切斯变换等数学方法实现了可执行性的量化评估。其次,针对具有并行计算需求的大数据作业,采用了冗余执行的容错技术,并针对实时冗余并行计算的复杂拓扑结构难以分析的难题,提出了一种将整体执行树划分为多个最小作业生成树并进行分析的通用方法,该方法在多个最小作业生成树其元素相互覆盖的复杂情况下有效抽取出影响这些最小作业生成树运行的关键元素集,并最终利用结合贝叶斯理论和容斥原理获得整个大数据作业的可靠性评估。
靖旭阳[3](2020)在《基于数据压缩及融合的高效网络安全分析》文中指出网络安全分析根据网络主机基数、网络流和网络行为等安全参数,分析网络通信的变化趋势,进而判断网络的安全性,是维护和保障网络空间安全的重要技术。然而,随着网络规模的不断扩大,海量安全参数导致网络安全分析面临效率低、准确性差、资源消耗大的问题。近年来,数据压缩融合方法已被广泛应用在网络安全分析中,通过按需压缩和融合数据,减少存储及分析数据所需的资源消耗,具有时间和空间上的优势,是克服海量安全参数给网络安全分析带来新挑战的有效途径。然而,将数据压缩融合方法用于处理分析海量安全参数时仍然存在若干关于数据采集、存储、溯源以及分析的问题。第一,数据压缩融合模型在重构异常地址时误报高、计算开销大。第二,现有的数据压缩融合模型不支持分布式并行的主机基数采集和分析。第三,数据压缩融合模型难以有效平衡内存使用和超级主机识别准确性之间的关系。第四,基于数据压缩融合模型的异常检测方法不支持独立于协议的自适应异常行为分析。第五,现有安全参数分析方法不能克服训练数据短缺、易受数据异构特征的影响。因此,为了提高网络安全分析的准确性和效率,需要设计新型数据压缩及融合方法,以确保网络安全分析技术具有高效地处理和分析海量安全参数的能力。本博士论文针对以上网络安全分析中的现存问题,提出了一系列解决方案。具体贡献如下:(1)针对压缩融合模型的可逆问题以及海量安全参数给网络异常行为检测带来的问题,本文首先提出了具有低计算复杂度的二维可逆压缩融合模型。基于此模型,针对目前较为流行的分布式拒绝服务攻击和放大攻击,本文设计了两个独立于网络协议的自适应的异常行为检测方案。方案一基于新型多图表累计和算法,动态地监控能反映分布式拒绝服务攻击的流量特征的变化。方案二通过监控请求数据和响应数据之间的不平衡关系准确检测放大攻击,无需采集多个流量特征,实现了高效的异常检测。(2)针对海量安全参数给主机基数分析带来的问题,基于贡献1提出的二维可逆压缩融合模型,创新性地提出了三维可逆压缩融合模型,支持对主机基数的分布式并行分析。此模型具有以下特点:多维性,即并行监控多类别主机基数,进而可同时识别多种超级主机;融合性,即可进行分布式安全参数采集,确保主机基数采集的完整性;可逆性,即可准确地重构超级主机地址。(3)针对海量安全参数给数据存储带来的问题,基于贡献2提出的数据压缩融合模型,提出了可扩展的可逆压缩融合模型,同时实现了内存高效和准确的主机基数分析。此模型可以根据主机基数的分布情况动态地扩展压缩融合模型占用的内存大小,保证在监控低基数主机时的高效内存利用和监控高基数主机时的高度准确性。基于此模型,根据超级主机的特点,提出了准确快速的超级主机识别方法。(4)针对海量安全参数特征的异构特性和训练数据短缺的问题,提出了一种基于数据融合的距离学习方法,用以提高数据分析模型的准确性。该方法根据携带数据局部信息的新型群组约束形式学习能充分反映数据特征的距离函数。其中,利用半正定优化学习线性距离函数,借助深度学习的优势实现能处理非线性数据的非线性距离函数。提出的方法可以在有限的先验知识条件下挖掘更多的背景知识,充分利用了先验知识中的权重信息,提高了安全参数分析的准确性。
陈俊仕[4](2020)在《国产申威众核处理器上分子生物学应用的算法设计和性能优化方法研究》文中进行了进一步梳理蛋白质等生物大分子及其复合物是原子水平的精致机器,也是药物作用的靶标。通过以原子分辨率模拟结构演化并结合统计热力学理论,可以重建分子动力学变化的时间过程,解析其驱动机制,为生物功能阐释和预测以及药物设计提供依据。利用当代超级计算机的计算能力,可能把完成一个分子模拟项目的计算时间从长达数周甚至数月缩短到数天甚至数小时,对分子模拟在生物学基础问题研究和药物设计等领域的应用可产生巨大推动作用。“神威·太湖之光”是我国曾经四次位列国际Top500排名第一的超级计算机,采用了完全自主设计的第二代申威众核处理器。相比同时代的商用多核处理器,申威众核处理器具有更大规模的多级并行计算单元和独特的片上存储结构,擅长处理规则且易于并行的计算密集型任务。与其他的商用众核处理器相比,申威众核平台上缺少像GPU/CUDA那样成熟完善的针对自身处理器架构设计的并行编程模型和运行时环境,使得其上的并行算法设计和性能优化面临许多挑战性问题,迫切需要在重大应用问题的驱动下,发展其上的算法设计和优化实现方法。本文选取了三个不同工作负载的分子生物学应用,针对申威处理器的体系结构特征,开展了其核心算法的并行算法设计和性能优化方法的研究工作。该类应用属于典型的稀疏计算问题,具有间接且离散的内存访问模式。如何克服严峻的访存带宽限制,充分利用片上大规模的计算单元,发挥片上核间寄存器通信的独特设计优势,从而提高应用的计算效率,是本文要着力解决的关键技术问题。本文的研究工作和成果主要包括以下三个方面:1.提出了基于寄存器通信实现的从核共享写缓冲并行计算方法和相应的优化手段,克服了申威众核处理器片上存储资源的访问限制和空间限制。申威从核加速阵列上的每个计算核拥有一个空间有限的私有本地内存。计算核之间可以通过一种基于片上互连网络的寄存器通信机制进行高效数据交换。基于这一硬件特性,本文提出将部分计算核作为其它核的共享写缓冲的并行计算方法,用于解决分子动力学模拟中核心算法因片上存储空间受限和作用力写冲突带来的访存开销过大的问题。另外,针对寄存器通信的特点和限制,本文还提出了计算核和共享写缓冲核之间的数据通信优化方法。实验结果表明,从核阵列加速的计算核心获得了相对主核最高30多倍的性能加速比,片外访存、核间数据通信和负载不均衡引起的时间开销均降低到了合理范围。2.设计和实现了申威众核架构上面向高效分子动力学模拟的分块任务划分和多级并行化算法,解决了计算过程中访存带宽利用率低和写冲突带来的并行效率低的问题。分子动力学模拟核心算法在申威众核处理器架构上的高效并行化,受到计算过程中随机内存访问和写冲突的极大限制。针对这一问题,本文提出面向申威众核架构的超簇邻居列表,通过增大计算任务的粒度,充分发挥从核DMA的访存带宽,最大化从核计算核心的计算访存比。另外,由于申威从核上锁的开销过大,多数据缓冲是用于避免写冲突较为可行的方法。然而,随之引入的数据归约开销限制了从核阵列的性能加速效果。本文提出的多级并行计算方法,利用从核间的寄存器通信,实现了这一矛盾的折中与平衡。实验结果表明,优化后的核心计算代码获得了相对主核约200多倍的性能加速,且达到20%的浮点计算效率。3.设计和实现了神威太湖之光系统上高通量分子对接模拟的大规模并行计算方法,该算法能够实现千万核系统规模下基于分子对接模拟的药物虚拟筛选的高效并行。现有的分子对接模拟应用大都面向传统的通用多核处理器搭建的高性能计算平台,无法发挥众核计算系统强大的计算能力。本文首先提出单个分子对接过程在申威众核处理器上的一系列并行优化方法。由于现行算法中的数据结构不适用于申威众核架构,本文对关键数据结构进行了的结构调整,包括消除关键数据结构的冗余项,压缩非键原子对,设计冗余的能量网格和软件Cache。另外,通过循环展开和向量化,充分挖掘计算核心的指令级和数据级并行度。现行分子对接算法采用单级主从并行模式。大规模部署时,任务调度节点面临巨大的I/O和通信压力,极大限制了算法的可扩展性。针对这一问题,本文提出了多级主从并行模式,以及调度节点间轻量级的I/O任务划分方法和异步的通信接口。实验结果表明,优化后的分子对接模拟能够实现神威太湖之光千万核系统规模下的高效并行计算和快速药物分子虚拟筛选。人类已知的适合于药物虚拟筛选的有机化合物将近4千多万个。该平台将完成如此计算规模的药物筛选任务的时间从一天缩短为一个小时。本文提出的一系列并行算法设计和优化方法已应用于神威太湖之光上的分子动力学模拟和药物虚拟筛选软件,解决了这些软件在申威众核平台上高效并行所面临的一系列挑战,实现了核心算法在众核处理器上接近线性的加速效果。这些并行算法的设计思路和优化方法可为其它稀疏计算问题在申威处理器上的高效实现提供重要的借鉴;同时,对下一代申威众核处理器架构的改进和软件生态建设也具有重要的参考价值。
张鹏飞[5](2018)在《云端融合的同步定位与地图构建高效算法关键技术研究》文中认为同步定位与地图构建(SLAM)是移动机器人实现自主行为的前提和基础,其解决方案具有高度数据密集和计算密集的特点。在传统机器人架构中,SLAM的实现完全依赖机器人板载计算机自带的计算和存储资源,导致其效能严重受限。近年来。“云端融合”这一新兴计算模式的兴趣,使得作为“端”的机器人有可能利用“云”的计算资源,而“云”上的大量数据及数据共享能力也有助于提高“端”在SLAM过程中的效能。这一思路催生了“云机器人”等新兴机器人计算范型的出现。但是,由于机器人应用具有与物理世界紧密结合、对计算时效性高度敏感的特点,简单地将“云”和“端”连接在一起是远远不足的。在大规模复杂任务场景中,现有工作面临巨大挑战,突出表现为:(1)现有计算迁移方法的适应性在动态规模化场景中呈现诸多问题。它们中大多面向某一类具体的SLAM算法,受到任务规模或传感器输入类型的限制。而通用方法在动态环境也面临鲁棒性无法满足服务质量的难题,在网络不稳定或云平台服务质量下降时,任务处理能力遭遇显着降级;(2)在开放和多变的环境中,由于可用的地图数据难以满足任务对环境的感知要求,基于视觉的SLAM方法的SLAM子优化过程常常出现性能和精度下降。虽然云平台赋予了SLAM任务共享多机器人地图数据能力,但是在现有的初步探索中,基于云平台的方法难以高效利用共享数据,同时缺乏和这些本地子优化过程融合的有效途径。本文基于“云端融合”这一新兴计算模式,围绕“如何赋予现有的SLAM算法与云平台进行高效协同的能力”这一问题,针对上述挑战展开初步探索。本文的主要工作包括:(1)提出了面向服务质量的SLAM计算任务透明迁移机制计算迁移是实现”云端融合“同步定位和地图构建的重要环节。针对现有的机器人应用程序难以有效地部署到云平台中的难题,本文提出了透明的服务化封装机制,其目的是赋予机器人应用程序透明地迁移计算模块到云平台的能力,并能够和本地机器人进行实时通信,而无需进行代码修改。为了满足机器人应用所需的服务质量和稳定性,在此基础上在云平台和机器人端设计了协同的服务质量保障机制,以应对机器人和云之间网络故障等性能抖动。(2)面向多机器人协同SLAM的多层次通信迁移方法多机器人协同SLAM应用中,实体之间密集的数据交换成为新的性能瓶颈。针对此问题,本文首先对多机器人点对点通信为基础的软件架构的计算和通信模型进行形式化,并对本地原生和计算迁移性能对比观察和分析,进而从中抽象出三种消息的通信瓶颈模式,并对于每种不同的通信瓶颈模式,依次提出不同层次的优化机制通过这些方法,所依托的框架达到动态优化网络拓扑上的数据传输路径,和透明地减少机器人和云平台之间冗余的消息的目的,从而对协同SLAM任务的通信效率和整体性能带来显着提升。(3)利用云端融合的大规模机器人协同SLAM方法为了有效利用”云端融合“模式下”云“的计算能力、提高多机器人协同SLAM的可伸缩性,本文进一步提出了利用云平台多主机并行处理SLAM任务的方法。为了应对多机器人大规模协同SLAM的实时性和精度要求,本文在云平台的通信和一致性方面分别提出了相应的并行优化方法。在通信优化上,提出的Multicut算法将机器人在集群内部分组和面向不同消息类型的高带宽低延迟通信模式;在一致性方面,为了满足不同类型数据的共享和延迟要求,提出基于血统的一致性维护方法。所提出方法在充分利用分布式集群的并行处理能力的前提下,对协同SLAM的可扩展性的提升取得显着效果。(4)云共享的先验地图知识与SLAM的高效融合为了高效利用“云端融合”模式中“云”的数据共享能力,本文以SLAM中回环检测和重定位为研究对象,分别提出了地图共享与现有SLAM算法高效融合的方法。基于回环检测中出现的空间位姿关系模式,本文提出了基于空间临近关系的可嵌入的回环检测优化算法,旨在改善具有内存约束的SLAM方法中检测回环的过程中匹配过少的问题;同时,在基于关键帧的SLAM算法中,也相应提出了基于云平台共享的的重定位候选帧扩展方法,以提升现有的重定位方法的定位速度。以上融合方法,在提高了子过程处理能力的同时,保持了现有SLAM框架的低内存占用和后端位姿优化图限制大小的性质,同时避免引入额外的性能开销,达到了优化的效果。上述工作最终物化以Cloudroid/Cloudroid Swarm任务协作框架和基于云平台的算法具体实现:前者以所提出的计算迁移和协同迁移方法为基础的任务迁移平台,后者为高效利用云平台辅助SLAM任务提供了具体的优化策略。本文成果已在所描述的大量的实际物理场景中的SLAM实验和以ORB-SLAM,RTAB-Map和RGBDSLAM等典型SLAM方法为代表的测试用例中得到验证。
曾全站[6](2017)在《基于多核处理器的并行3D-FFT研究》文中研究指明随着计算任务量的增加,单核处理器已不能满足用户需求,主要原因是功耗问题限制了单核处理器不断提高性能的途径。而多核处理器的问世,为多任务、大数据难题提供了解决方案。3D-FFT是科学与工程研究中最重要的算法之一,在计算机视觉和模式识别,视频电话和核磁共振成像算法中,都有着至关重要的作用。如何在多核处理器上更快速的进行3D-FFT计算,是科学研究中首要面临的难题。本文针对并行3D-FFT在多核处理上的应用,从数据预处理,数据计算和数据转置三个方面对3D-FFT算法进行研究。在数据预处理阶段,为避免出现有的核满载,有的核空转现象,采用负载均衡算法让每个核心平均处理任务。同时,为了避免计算阶段数据在核心之间不必要的迁移,提出线程与CPU亲和性算法,让数据在指定的CPU核心运行。为解决共享内存多核处理器伪共享难题,提出缓存行填充算法,使得属于不同核心的数据被分在独立的缓存行内。在2核心与8核心下测试算法缓存命中率,实验表明,缓存行填充以及线程与CPU亲和性算法,2核心下,一级数据缓存未命中率平均降低了0.2%,三级缓存未命中率平均降低了0.2%,8核心下分别降低了0.2%与0.1%。在数据计算阶段,以多列FFT算法为基础,使用多线程并行化处理。对于FFT每次计算,使用经典六步快速傅里叶变换算法把数据划分成更小的数据量进行计算,加快处理速度。对位反转处理过程,采用两端反转策略进行优化,一次处理四个数据点,使算法时间复杂度降为原来的一半。在数据转置阶段,提出全局转置优化算法,减少参与核间通信数据点的总数,从而加快全局转置速度。与现有全局转置算法相比,通信时间平均减少0.05秒,约提高9.5%。并使用多核模拟器Sniper Simulator对其功耗进行统计,在8个计算核心下,全局转置优化算法与现有转置算法,核间功耗,核与内存功耗以及一级数据缓存功率消耗均值分别约为20W和22W,7.2W和7.5W以及16.9W和17.1W。为进一步体现算法性能优越性,与已有的FFTW和Open MP多线程进行比较。在8核心下,与FFTW和Open MP缓存未命中率相比,3D-FFT全局转置优化算法缓存未命中率几乎为0。与FFTW计算三维离散傅里叶变换的库函数相比,在2核心下,3D-FFT全局转置优化算法算法性能是其1.59倍,8核心下是4.93倍。若对FFTW库函数使用OpenMP开辟多个线程进行加速,3D-FFT全局转置优化算法性能表现在2核心与8核心下分别是多线程Open MP的1.07倍与1.48倍。
刘玉[7](2013)在《基于性能监测硬件支持的片上缓存资源管理技术》文中研究指明如何高效利用片上高速缓存是多核处理器研究的一个重要课题。现有的片上高速缓存管理机制是软件透明的,不能实时感知程序数据集的局部性特征,以及来自多个线程不同的访存请求。一方面,当多个线程同时在多核处理器上运行时,现有的缓存管理策略不仅不能保证每个任务的运行性能,还会导致共享缓存的多个任务之间发生不可预测的缓存竞争,形成相互干扰,降低系统的吞吐量。另一方面,由于软件不能控制缓存空间的分配,仅靠硬件进行管理,使得程序对高速缓存的利用效率不高,尤其对于单线程程序,不能利用多核处理器丰富的片上缓存资源来获得性能加速。针对以上问题,本文研究如何利用硬件性能监测单元来实时监测程序运行时的访存特征信息,实现对多线程运行时的共享缓存竞争管理,以及对单线程程序运行时的缓存空间分配,从而提高多任务系统的吞吐量和性能稳定性,并为单线程程序执行提供高效的缓存控制手段。本文的研究内容和主要工作成果包括以下几个方面:(1)研究了能够实时感知程序运行时访存特征的性能监测机制,提出了基于性能监测单元而实现的低代价访存性能监测方案LWM。IWM可以为用户层提供程序运行时访存性能信息的功能,以及为缓存管理器提供系统级的资源使用信息,减少了访存性能监测的代价。在实现过程中,我们在每个任务结构体中加入性能事件成员、提供事件配置的系统调用接口,并且对计数器溢出和上下文切换过程中出现的错误计数进行了处理。此外,我们还优化了性能计数器的分时复用机制,提高了多事件监测过程中的事件监测精度以及性能计数器的利用率。(2)研究了多个任务对共享缓存资源的竞争问题,提出了访存负载概念并设计了访存负载平衡调度算法,提高了多任务系统吞吐量和程序的性能稳定性。本文提出了一种访存负载平衡调度技术来解决多任务共享缓存竞争问题。访存负载平衡调度算法参照了操作系统计算负载平衡调度算法的设计,可以作为操作系统负载平衡系统的扩展。由于本文将访存负载平衡调度实现为一个用户层的负载调度系统,所以不需要对操作系统内核进行改动。通过与其它调度算法进行实验比较后,证明本文提出的访存负载平衡调度算法在程序加权加速,以及提升系统整体吞吐量方面都有较大改进,降低了多任务对共享缓存的竞争强度,减少了系统整体的片外访存请求数量。得益于算法的稳定性能,访存负载平衡调度降低了程序多次运行之间的性能差异性,可以为操作系统实现公平可靠的任务调度算法提供支持。(3)研究了单线程程序运行于多核处理器平台时的缓存空间利用率不高的问题,提出了一种新型缓存控制机制VSCP,提高了单线程程序的缓存利用率并加速了程序执行。本文提出的新型缓存控制方法VSCP可以有效提升单线程程序对多核处理器片上缓存空间的利用率,VSCP联合了整个系统上的缓存资源并为程序员提供显式的缓存控制接口,物理分布的缓存空间被虚拟化成用户可控的集中式缓存。与通过程序并行化来最大化计算资源的使用不同,VSCP试图去最大化缓存资源的利用率。VSCP保持单线程程序一段时间内只使用一个处理器核的状态,减少多核同时工作的功耗。另外,在片上缓存不能存放一个程序的所有工作集时,可以利用VSCP选择部分具有强局部性的数据集驻留缓存以确保这些数据不被替换或污染,降低缓存缺失率并最终加速程序。通过对本课题的研究,我们得到了以下重要认识:(1)访存性能对于单个程序以及系统整体性能都非常重要,在“存储墙”现象日益严重的背景下,对于提升单个程序以及系统整体性能来说,降低缓存缺失率比减少执行指令数都要更加有效。(2)现有的缓存管理策略(包括操作系统任务调度和缓存替换策略的实现)都无法感知到线程间缓存竞争与共享关系的存在,导致低效的缓存管理。缓存资源管理必须实现线程感知的策略,否则无法为系统性能、公平性和服务质量等指标提供支持。(3)解决多核处理器缓存资源管理最终还是需要软硬件协同配合才能完成,这需要对程序运行时和缓存管理器之间的接口进行重新设计,包括建立更好的性能监测基础设施(软、硬件)以便观察系统内部运行时情况,以及细粒度的缓存资源分配机制,这些问题的解决需要操作系统设计者、硬件架构师和程序开发人员的共同努力。本文针对缓存资源管理而提出的关键问题解决方案,都是基于真实硬件平台进行设计实现的,是相对实际的解决方法,并且这些实现方案具有一般通用性,可以为未来处理器体系结构上的缓存资源管理机制的实现提供参考。
潘良勇[8](2012)在《无线传感网络下的数据融合技术研究》文中研究说明无线传感网络是由部署在监测区域内大量廉价低功耗的无线通信节点组成的自组织的网络系统,用来协作感知采集和处理网络覆盖区域内的信息,并发送给监测者。数据融合可以有效地将数据进行融合处理,减少冗余信息的传递,从而大大降低网络的能量消耗,增加网络的生命时间。针对基本算法存在的精度不足等问题,本文做了以下分析研究工作:针对几种基本的数据融合算法进行了分析验证,包括递推估计数据融合、自适应加权数据融合、算术平均数据融合以及分簇数据融合算法。在分析比较过程中,发现存在的精度不足的问题,在此基础上提出一种改进的分簇算法,加了数据预处理过程,并且通过Matlab仿真实验,发现改进后的分簇算法在精度方面的效果更好,减少了冗余数据的传输,也降低了数据传输的能耗。针对粮食存储过程中存在的测量效率低、精度不高等弊端,介绍了一种基于无线传感网络的粮仓监控系统方案。通过各类传感器对仓库内的温度湿度虫害等数据信息进行采集,经过处理后由GPRS传给远程监测中心。上位机实现数据的查询,并能对超标参数报警。保证粮食品质与质量,降低劳动强度,实现粮仓监测的实时性与智能化的要求。同时,在汇聚节点处对各传感节点采集的数据进行数据融合,减少网络传输数据量以及传输能耗。本文给出了硬件设计的一些方案,包括传感节点的设计,汇聚节点的设计以及传感器模块的选型等;其中重点介绍了汇聚节点的硬件设计。在软件设计方面给出了节点的程序流程图,包括主程序流程、网络协调器流程等,并采用SQLscrver2005和Visual C++设计监测平台。最终可实现一整套的可靠的监测方案,来对整个粮仓的环境进行监测。
吴俊杰,杨学军,刘光辉,唐玉华[9](2010)在《面向OpenMP和OpenTM应用的并行数据重用理论》文中进行了进一步梳理将经典的数据重用理论扩充到并行领域,分别提出了面向OpenMP和OpenTM应用的并行数据重用理论.针对重用在线程、事务中的关系,系统地讨论了并行应用中重用的分类、判定和求解方法.同时,应用这一理论研究了OpenTM循环的优化技术,以降低事务被回退的风险.最后,使用并行数据重用理论分析和统计了SPEComp2001中的数据重用.并行数据重用理论可以用于指导面向多核存储共享结构的并行程序分析和编译优化技术研究.
赵永刚,付立东,邓福岐[10](2009)在《二维非线性对流扩散方程求解程序的测试与优化》文中研究说明在IA-64架构Itanium2处理器上,应用gprof和pfmon对二维非线性对流扩散方程求解程序源代码进行了性能测试。在分析给定程序的数据结构,子过程调用关系,重点子程序中循环体的迭代空间、数据空间、访问轨迹,输入输出数据量大小和程序结构等的基础上,应用子过程合并、循环变换、分支消除、循环顺序逆转、数组一维结构化为二维结构、输入参数给定等方法,改善了数据访问的时空局部性,程序性能有15%的提高。
二、一种利用数据融合来提高局部性和减少伪共享的方法(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、一种利用数据融合来提高局部性和减少伪共享的方法(论文提纲范文)
(1)连退生产过程产品质量预测及操作优化(论文提纲范文)
摘要 |
abstract |
第一章 绪论 |
1.1 选题的背景及意义 |
1.2 连续退火工艺流程 |
1.3 生产中存在的问题 |
1.4 研究现状 |
1.4.1 带钢硬度检测方法 |
1.4.2 操作优化方法 |
1.5 本文研究内容 |
第二章 基于HDFI-SVR模型的连续退火产品质量预测 |
2.1 算法基础 |
2.1.1 等距特征映射降维算法 |
2.1.2 支持向量机回归 |
2.2 基于高维数据特性集成的带钢硬度预测建模 |
2.2.1 HDFI-SVR算法结构 |
2.2.2 HDFI-SVR算法流程 |
2.3 HDFI-SVR模型验证 |
2.3.1 基于不同数据集的模型对比 |
2.3.2 基于连退数据的模型对比 |
2.4 本章小结 |
第三章 基于ISOMAP-ISVR模型的增量预测 |
3.1 增量学习概述 |
3.2 基于ISOMAP的SVR增量学习算法研究 |
3.3 增量学习模型实验 |
3.3.1 真实数据集 |
3.3.2 连续退火数据集 |
3.4 本章小结 |
第四章 连退生产过程多目标操作优化建模 |
4.1 模型建立基础 |
4.1.1 模型建立思路 |
4.1.2 影响带钢质量因素分析 |
4.2 连退生产过程多目标操作优化建模 |
4.2.1 多目标优化问题 |
4.2.2 建模分析 |
4.3 基于差分进化算法的模型求解 |
4.3.1 多目标优化问题求解 |
4.3.2 差分进化算法基本原理 |
4.3.3 模型初始解设计 |
4.3.4 模型求解结果 |
4.4 本章小结 |
第五章 基于改进优化算法的连续退火多目标优化模型求解 |
5.1 NSGA-Ⅱ算法基本原理 |
5.2 一种改进变异混合多目标优化算法 |
5.2.1 跳变基因 |
5.2.2 改进DE变异算子 |
5.2.3 基于贪婪策略的种群合并 |
5.2.4 基于混沌的最优解搜索 |
5.3 算法性能分析 |
5.3.1 测试函数 |
5.3.2 评价指标 |
5.3.3 参数设置 |
5.3.4 实验结果分析 |
5.4 连退生产过程多目标操作优化模型求解 |
5.5 本章小结 |
第六章 总结与展望 |
参考文献 |
发表论文和参加科研情况 |
致谢 |
(2)大规模云计算系统的可靠性建模及优化研究(论文提纲范文)
摘要 |
abstract |
第一章 绪论 |
1.1 研究背景 |
1.1.1 大规模云计算系统概述 |
1.1.2 云计算可靠性概述 |
1.2 关键技术与研究现状 |
1.2.1 关键技术 |
1.2.2 研究现状 |
1.3 问题分析 |
1.4 研究内容与创新点 |
1.5 论文组织结构 |
第二章 基于成本约束的多指标关联建模与优化 |
2.1 引言 |
2.2 基于可靠性的关联建模分析 |
2.3 可靠性提升中的成本约束设计 |
2.4 基于关联优化的可靠性保障技术 |
2.4.1 成本约束的可靠性保障框架 |
2.4.2 可靠性-能耗关联优化的虚拟机迁移算法 |
2.4.3 满足成本约束的物理节点调度算法 |
2.5 实验与分析 |
2.5.1 面向SLA的可靠性保障的实验与分析 |
2.5.2 成本约束下能耗模型的实现方法 |
2.5.3 JORE-RSA的模拟和评估 |
2.6 本章小结 |
第三章 面向云服务的可靠性建模与优化 |
3.1 引言 |
3.2 基于服务过程的云服务可靠性模型 |
3.2.1 服务请求处理阶段的可靠性模型 |
3.2.2 服务执行阶段的可靠性模型 |
3.3 云服务可靠性保障的动态优化技术 |
3.3.1 服务请求到达率驱动的动态调度技术 |
3.3.2 基于服务状态监控的故障自修复技术 |
3.4 实验与分析 |
3.4.1 服务请求处理阶段的实验与分析 |
3.4.2 服务执行阶段的实验与分析 |
3.5 本章小结 |
第四章 基于容错技术的大数据作业可靠性建模 |
4.1 引言 |
4.2 基于检查点容错技术的大数据作业可执行性模型 |
4.2.1 云计算系统下的检查点技术特征 |
4.2.2 基于检查点的可执行性关联模型 |
4.2.3 大数据作业可执行指标递归求解 |
4.3 基于实时冗余技术的并行大数据作业可靠性模型 |
4.3.1 云计算系统下的实时冗余并行计算 |
4.3.2 最小作业生成树的定义和表示方法 |
4.3.3 基于贝叶斯理论的可靠性评估方法 |
4.4 实验与分析 |
4.4.1 检查点技术下的可执行性评估实验与分析 |
4.4.2 实时冗余计算下的可靠性评估实验与分析 |
4.5 本章小结 |
第五章 全文总结与展望 |
5.1 全文总结 |
5.2 后续工作展望 |
致谢 |
参考文献 |
攻读博士学位期间取得的成果 |
(3)基于数据压缩及融合的高效网络安全分析(论文提纲范文)
摘要 |
ABSTRACT |
符号对照表 |
缩略语对照表 |
第一章 绪论 |
1.1 研究背景 |
1.2 研究问题 |
1.2.1 数据压缩融合的高效可逆性 |
1.2.2 数据压缩融合的分布式并行处理 |
1.2.3 数据压缩融合的内存高效性 |
1.2.4 独立于协议的自适应异常行为检测 |
1.2.5 有限先验知识下安全参数分析的精确性 |
1.3 研究目标 |
1.4 研究内容 |
1.4.1 研究内容一:基于二维可逆压缩融合模型的异常行为检测 |
1.4.2 研究内容二:基于三维可逆压缩融合模型的超级主机识别 |
1.4.3 研究内容三:基于可扩展可逆压缩融合模型的超级主机识别 |
1.4.4 研究内容四:基于距离学习的数据融合分析 |
1.5 研究贡献 |
1.6 章节安排 |
第二章 研究现状与基础知识 |
2.1 研究现状分析 |
2.1.1 异常行为检测 |
2.1.2 主机基数分析 |
2.1.3 基于距离的安全参数分析 |
2.2 基础知识 |
2.2.1 概要数据结构 |
2.2.2 布鲁姆过滤器 |
2.2.3 主机基数 |
2.2.4 距离学习 |
2.2.5 豪斯多夫距离 |
2.2.6 中介中心性 |
2.3 本章小结 |
第三章 基于二维可逆压缩融合模型的异常行为检测 |
3.1 概述 |
3.1.1 动机 |
3.1.2 贡献 |
3.2 基于中国剩余定理的可逆概要数据据结构 |
3.3 独立于协议的自适应DDoS攻击检测 |
3.3.1 安全参数采集 |
3.3.2 DDoS攻击检测 |
3.3.3 性能分析 |
3.4 独立于协议的自适应放大攻击检测 |
3.4.1 安全参数采集 |
3.4.2 放大攻击检测 |
3.4.3 性能分析 |
3.5 本章总结 |
第四章 基于三维可逆压缩融合模型的超级主机识别 |
4.1 概述 |
4.1.1 动机 |
4.1.2 贡献 |
4.2 SuperSketch |
4.2.1 更新操作 |
4.2.2 估计操作 |
4.2.3 融合操作 |
4.2.4 可逆计算操作 |
4.2.5 SuperSketch估计操作的理论分析 |
4.3 基于SuperSketch的超级主机识别 |
4.3.1 超级主机识别 |
4.3.2 异常归因 |
4.4 实验与性能评估 |
4.4.1 实验设置 |
4.4.2 性能评估 |
4.5 总结 |
第五章 基于可扩展可逆压缩融合模型的超级主机识别 |
5.1 概述 |
5.1.1 动机 |
5.1.2 贡献 |
5.2 ExtendedSketch |
5.2.1 ExtendedSketch的结构 |
5.2.2 基于ExtendedSketch的超级主机识别 |
5.3 ExtendedSketch的理论分析 |
5.3.1 复杂度分析 |
5.3.2 估计操作的误差分析 |
5.4 实验与性能评估 |
5.4.1 实验设置 |
5.4.2 性能评估 |
5.5 总结 |
第六章 基于距离学习的数据融合分析 |
6.1 概述 |
6.1.1 动机 |
6.1.2 贡献 |
6.2 群组约束 |
6.3 基于群组的距离学习 |
6.3.1 学习目标 |
6.3.2 线性学习方法 |
6.3.3 非线性学习方法 |
6.4 性能评估 |
6.4.1 实验设置 |
6.4.2 参数测试 |
6.4.3 仿真数据集上的性能测试 |
6.4.4 UCI数据集上的性能测试 |
6.4.5 USPS数据集上的性能测试 |
6.4.6 网络流量数据集上的性能测试 |
6.4.7 进一步讨论 |
6.5 总结 |
第七章 总结与展望 |
7.1 工作总结 |
7.2 展望与计划 |
参考文献 |
致谢 |
作者简介 |
(4)国产申威众核处理器上分子生物学应用的算法设计和性能优化方法研究(论文提纲范文)
摘要 |
ABSTRACT |
第1章 绪论 |
1.1 研究背景 |
1.1.1 分子生物学应用提出的计算挑战 |
1.1.2 基于申威众核处理器的高性能计算系统 |
1.1.3 申威众核并行计算面临的技术挑战 |
1.2 本文主要研究内容 |
1.3 论文组织结构 |
第2章 相关研究工作 |
2.1 分子动力学模拟 |
2.1.1 非键相互作用 |
2.2 商用多核众核计算平台上分子力学模拟相关工作 |
2.2.1 提高数据局部性 |
2.2.2 避免写冲突 |
2.2.3 开发SIMD数据并行 |
2.3 申威众核平台上分子动力学模拟相关工作 |
2.3.1 LAMMPS |
2.3.2 NAMD |
2.3.3 GROMACS |
2.4 中威众核平台上其它应用并行优化相关工作 |
2.4.1 Stencil计算问题 |
2.4.2 稀疏矩阵向量乘法 |
2.5 本章小结 |
第3章 基于片上数据通信的非键作用力并行计算 |
3.1 引言 |
3.2 背景介绍 |
3.2.1 基于Charm++混合并行策略 |
3.2.2 数学模型和数值方法 |
3.2.3 数据访问特征分析 |
3.3 基于片上数据通信的并行算法设计 |
3.3.1 按行划分的任务并行方案 |
3.3.2 基于寄存器通信的数据缓存方案 |
3.4 实现与优化 |
3.4.1 计算核与存储核间数据通信优化 |
3.4.2 查找表数据缓存的设计 |
3.4.3 共享只读数据的访存优化 |
3.4.4 向量化优化 |
3.5 实验和分析 |
3.5.1 实验设置 |
3.5.2 众核加速性能分析 |
3.5.3 时间分布分析 |
3.6 相关工作 |
3.6.1 申威众核平台上非键作用力计算的相关工作 |
3.6.2 其它硬件平台上NAMD的相关工作 |
3.7 本章小结 |
3.7.1 对未来架构设计的讨论 |
第4章 基于超簇的高效分子动力学并行算法设计 |
4.1 引言 |
4.2 背景介绍 |
4.2.1 数学模型和数值方法 |
4.2.2 基于原子簇的邻居列表搜索算法 |
4.2.3 非键作用力计算核心以及并行化面临的挑战 |
4.3 基于超簇邻居列表的从核阵列协同并行方案 |
4.3.1 基于超簇的邻居列表以提高计算访存比 |
4.3.2 基于核间数据通信的并行方案 |
4.4 从核间数据通信优化 |
4.5 向量化方案以及核心代码指令重排 |
4.5.1 面向申威众核的向量化计算方案 |
4.5.2 从核处理器流水线与指令重排 |
4.6 实验评估和分析 |
4.6.1 实验设置 |
4.6.2 单个核组加速性能分析 |
4.6.3 时间分布分析 |
4.7 相关工作 |
4.8 本章小结 |
4.8.1 对未来架构设计的讨论 |
第5章 高通量分子对接模拟的并行计算方案 |
5.1 引言 |
5.2 应用描述 |
5.2.1 分子对接算法概述 |
5.2.2 数值方法 |
5.3 实现和优化 |
5.3.1 主核数据布局优化 |
5.3.2 从核任务映射与并行 |
5.3.3 充分利用从核片上存储,提高从核阵列访存效率 |
5.3.4 循环展开与向量化 |
5.3.5 提高多节点计算效率的多级并行化方法 |
5.4 实验与分析 |
5.4.1 软硬件配置和测试集 |
5.4.2 单核组加速 |
5.4.3 时间分布 |
5.4.4 多节点可扩展性 |
5.5 相关工作 |
5.6 本章小结 |
5.6.1 对未来架构设计的讨论 |
第6章 结果与展望 |
6.1 研究工作与成果 |
6.2 主要创新 |
6.3 下一步研究工作 |
参考文献 |
致谢 |
在读期间发表的学术论文与取得的研究成果 |
在读期间参与的科研项目 |
(5)云端融合的同步定位与地图构建高效算法关键技术研究(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 研究背景和意义 |
1.1.1 SLAM问题及其面临的挑战 |
1.1.2 云端融合技术对SLAM效能的提升 |
1.2 SLAM问题模型及其求解 |
1.2.1 SLAM问题模型 |
1.2.2 SLAM求解方法 |
1.2.3 多机器人协同SLAM |
1.3 本文主要工作 |
1.3.1 本文研究内容 |
1.3.2 主要贡献和工作评估方式 |
1.4 本文研究内容及章节安排 |
第二章 机器人SLAM效能扩增技术相关研究 |
2.1 引言 |
2.2 云端融合提升机器人效能的研究 |
2.2.1 云端融合和云机器人 |
2.2.2 面向机器人的云平台支持 |
2.2.3 云平台提升机器人任务执行效能 |
2.3 基于云端融合的SLAM计算迁移和知识共享相关研究 |
2.3.1 DAvin Ci:利用Hadoop加速Fast SLAM算法 |
2.3.2 面向三维地图重建的C~2TAM |
2.4 多机器人协同SLAM效能提升相关研究 |
2.4.1 多机器人SLAM的通信及其优化 |
2.4.2 多机器人SLAM的建图方式及其优化 |
2.4.3 基于云端融合的多机器人协同SLAM |
2.5 SLAM相关子过程的效能扩增相关研究 |
2.5.1 回环检测 |
2.5.2 重定位和“绑架”问题 |
2.6 小结 |
第三章 面向QoS的 SLAM计算透明迁移方法的研究 |
3.1 引言 |
3.2 Cloudroid关键机制设计 |
3.2.1 ROS平台和其编程模型 |
3.2.2 服务结构的自动生成机制 |
3.2.3 端到端的可感知QoS的机制设计 |
3.3 总体架构和实现 |
3.3.1 总体结构 |
3.3.2 实现和优化细节 |
3.4 性能验证与分析 |
3.4.1 验证平台的简介 |
3.4.2 测试应用的性能对比分析 |
3.4.3 在SLAMBench公开基准套件的性能测试 |
3.4.4 CPU和内存利用率的测试 |
3.4.5 Cloudroid在 QoS维护的有效性测试 |
3.5 Cloudroid在真实物理环境中的性能测试 |
3.5.1 室内场景的建图实验 |
3.5.2 室内多机器人场景的建图实验 |
3.6 小结 |
第四章 基于云端融合的多机器人协同SLAM通信迁移方法研究 |
4.1 引言 |
4.2 通信迁移和协同迁移的相关研究 |
4.3 多机器人SLAM应用的通信效率建模和实验验证 |
4.3.1 基于Actor的计算模型和计算迁移模型 |
4.3.2 分布式多机器人架构和通信模型 |
4.3.3 计算迁移对通信负载的影响分析 |
4.3.4 基于公开数据集的多机器人协同SLAM的观察分析 |
4.4 通信迁移的关键机制设计 |
4.4.1 端到端的通信链路感知方法 |
4.4.2 基于云平台中继的消息去重机制 |
4.4.3 基于全局通信视图的拓扑优化 |
4.4.4 Cloudroid Swarm实现 |
4.5 基于协同SLAM相关应用的验证与分析 |
4.5.1 CGSLAM协同SLAM应用的对比实验和分析 |
4.5.2 基于协同SLAM的其他任务的测试和分析 |
4.6 小结 |
第五章 基于云端融合的大规模机器人协同SLAM方法 |
5.1 引言 |
5.2 协同分组算法和地图共享一致性机制 |
5.2.1 基于费用流的机器人分组算法 |
5.2.2 SLAM的低延迟数据一致共享模型 |
5.3 总体架构设计和实现 |
5.4 实验验证和分析 |
5.4.1 实验环境和软硬件配置 |
5.4.2 云平台内部计算和通信效果分析 |
5.4.3 在不同尺度环境场景中的公开数据集测试 |
5.4.4 室外多无人机场景建图验证和分析 |
5.5 小结 |
第六章 基于云端地图知识融合的SLAM效能扩增方法的研究 |
6.1 引言 |
6.2 PoseDB:利用共享地图知识提升回环检测速度的方法 |
6.2.1 问题描述 |
6.2.2 通过内存实验观测 |
6.2.3 PoseDB中的主要算法 |
6.2.4 PoseDB系统结构 |
6.2.5 实验验证和分析 |
6.3 共享云平台提升稀疏SLAM重定位速度的方法 |
6.3.1 相关的预备知识 |
6.3.2 方法和设计 |
6.3.3 系统实现 |
6.3.4 实验验证和分析 |
6.4 小结 |
第七章 结论 |
致谢 |
参考文献 |
作者在学期间取得的学术成果 |
(6)基于多核处理器的并行3D-FFT研究(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 课题研究的背景和意义 |
1.1.1 多核处理器的研究背景 |
1.1.2 FFT并行研究背景 |
1.2 国内外研究现状 |
1.3 主要研究内容 |
1.4 论文结构 |
第二章 3D-FFT算法 2D分解与计算 |
2.1 共享内存多核处理器 |
2.2 3D-FFT算法 |
2.3 2D分解并行 3D-FFT算法 |
2.4 FFT计算 |
2.4.1 位反转 |
2.4.2 蝶形运算 |
2.5 算法复杂度分析 |
2.6 本章小结 |
第三章 基于缓存的 3D-FFT的任务划分算法 |
3.1 基于线程亲和的任务划分 |
3.2 缓存行填充算法 |
3.2.1 问题描述 |
3.2.2 缓存行填充算法 |
3.3 实验与分析 |
3.3.1 环境描述 |
3.3.2 测试与分析 |
3.4 算法复杂度分析 |
3.5 本章小结 |
第四章 面向多核的 3D-FFT全局转置算法 |
4.1 问题的描述 |
4.2 全局转置算法 |
4.2.1 第一次全局转置 |
4.2.2 第二次全局转置 |
4.2.3 不同任务分解方案全局转置 |
4.3 全局转置通信代价分析 |
4.4 3D-FFT算法多级并行策略 |
4.4.1 3D-FFT计算并行策略 |
4.4.2 3D-FFT通信并行策略 |
4.4.3 3D-FFT计算通信重叠性 |
4.5 算法复杂度分析 |
4.5.1 全局转置算法复杂度分析 |
4.5.2 3D-FFT算法复杂度分析 |
4.6 本章小结 |
第五章 实验测试与性能评价 |
5.1 目标评价参数 |
5.2 SNIPER SIMULATOR简介 |
5.3 3D-FFT全局转置优化算法算法性能 |
5.3.1 3D-FFT全局转置优化算法在多计算核心下算法性能表现 |
5.3.2 3D-FFT全局转置优化算法在不同任务分解方案下算法性能表现 |
5.3.3 3D-FFT全局转置优化算法与现有全局转置算法算法性能比较 |
5.4 3D-FFT全局转置优化算法功率消耗 |
5.4.1 3D-FFT全局转置优化算法在多计算核心下功耗 |
5.4.2 全局转置优化算法不同任务分解方案下功耗 |
5.4.3 全局转置优化算法与现有全局转置算法功耗对比 |
5.5 3D-FFT与其它方法对比 |
5.5.1 算法性能 |
5.5.2 缓存命中率 |
5.6 本章小结 |
结论 |
参考文献 |
致谢 |
(7)基于性能监测硬件支持的片上缓存资源管理技术(论文提纲范文)
摘要 |
ABSTRACT |
图目录 |
表目录 |
第1章 绪论 |
1.1 研究背景 |
1.1.1 多核处理器结构特征 |
1.1.2 片上缓存结构 |
1.2 片上缓存资源管理的关键技术问题 |
1.2.1 任务运行时信息收集 |
1.2.2 多个线程之间的缓存干扰问题 |
1.2.3 单线程内部数据的缓存管理 |
1.3 论文研究目标和主要工作 |
1.4 论文结构 |
第2章 多核处理器缓存资源管理相关工作 |
2.1 缓存划分技术 |
2.1.1 预测线程可占用的缓存空间 |
2.1.2 缓存分配策略 |
2.1.3 缓存划分机制 |
2.2 利用线程调度管理缓存资源 |
2.2.1 缓存竞争感知的线程调度 |
2.2.2 缓存共享感知的线程调度 |
2.2.3 面向片上共享资源的线程调度 |
2.2.4 线程调度小结 |
2.3 本章小结 |
第3章 LWM:低代价的程序运行时性能监测机制 |
3.1 背景和相关工作 |
3.1.1 处理器性能监测单元 |
3.1.2 处理器性能监测单元工作方式 |
3.1.3 性能监测工具概述 |
3.1.4 性能监测单元小结 |
3.2 用户级低代价性能监测机制 |
3.2.1 LWM实现框架 |
3.2.2 用户层读取性能计数器 |
3.2.3 配置性能监测单元 |
3.2.4 性能计数器分时复用 |
3.2.5 性能计数器溢出处理 |
3.2.6 内核扩展 |
3.2.7 工具封装 |
3.3 实验评测与分析 |
3.3.1 LWM正确性验证 |
3.3.2 监测耗时分析 |
3.4 本章小结 |
第4章 MLB:实现访存负载平衡的线程调度机制 |
4.1 CMP系统任务调度 |
4.1.1 用户级任务调度的可行性 |
4.1.2 用户层任务调度需要解决的问题 |
4.1.3 任务调度框架描述 |
4.2 访存负载平衡调度算法组件 |
4.2.1 调度算法评价指标 |
4.2.2 性能预测手段 |
4.2.3 线程调度决策 |
4.2.4 算法描述 |
4.3 实验评测与分析 |
4.3.1 测试平台与程序 |
4.3.2 实验结果分析 |
4.3.3 调度算法特征分析 |
4.3.4 调度周期对系统性能的影响 |
4.3.5 调度算法性能稳定性分析 |
4.4 本章小结 |
第5章 VSCP:虚拟共享缓存空间划分机制 |
5.1 引言 |
5.2 缓存控制技术概述 |
5.2.1 片上存储层次结构以及访存延时 |
5.2.2 利用软件缓存划分提高数据缓存效率 |
5.2.3 利用数据分散技术联合分布的片上缓存空间 |
5.3 VSCP技术 |
5.3.1 矩阵相乘示例 |
5.3.2 VSCP系统实现 |
5.4 实验结果与分析 |
5.4.1 测试程序 |
5.4.2 测试平台 |
5.4.3 程序性能提升 |
5.5 程序缓存缺失率降低与性能提升关系分析 |
5.5.1 程序缓存缺失率和性能之间的关系 |
5.5.2 VSCP实现代价分析 |
5.6 本章小结 |
第6章 全文总结 |
6.1 研究工作与成果 |
6.2 主要创新 |
6.3 进一步的研究工作 |
参考文献 |
致谢 |
在读期间发表的学术论文与取得的研究成果 |
在读期间参与的科研项目 |
(8)无线传感网络下的数据融合技术研究(论文提纲范文)
摘要 |
ABSTRACT |
目录 |
第1章 绪论 |
1.1 研究背景与研究意义 |
1.2 国内外发展现状 |
1.3 论文研究内容和工作 |
第2章 无线传感器网络概述 |
2.1 无线传感网络的体系结构 |
2.1.1 无线传感网络的系统结构 |
2.1.2 无线传感网络的节点构成 |
2.1.3 无线传感网络体系结构的设计要素与原则 |
2.2 无线传感网络的关键技术 |
2.3 无线传感网络的特点与应用 |
2.4 无线传感网络的网内信息处理研究现状与挑战 |
2.5 本章小结 |
第3章 无线传感网络数据融合技术分析 |
3.1 数据融合的概念及意义 |
3.2 数据融合的结构与模型 |
3.2.1 数据融合的功能模型 |
3.2.2 数据融合的结构 |
3.3 融合方法的类型 |
3.4 数据融合基本算法 |
3.4.1 递推估计数据融合 |
3.4.2 自适应加权数据融合 |
3.4.3 算术平均数据融合 |
3.4.4 几种数据融合方法的比较情况 |
3.5 本章小结 |
第4章 基于分簇的簇内数据融合算法 |
4.1 分簇算法描述 |
4.1.1 能量消耗模型 |
4.1.2 分簇算法的描述 |
4.2 簇内数据融合算法 |
4.2.1 算法分析 |
4.2.2 融合计算过程与仿真 |
4.2.3 小结 |
4.3 改进的融合算法 |
4.3.1 算法分析 |
4.3.2 改进算法的计算与仿真 |
4.3.3 小结 |
4.4 本章小结 |
第5章 基于粮仓环境监测的应用 |
5.1 引言 |
5.2 系统需求分析与总体架构 |
5.3 监测系统硬件构成 |
5.3.1 系统设计层次结构 |
5.3.2 ZigBee协议概述 |
5.3.3 传感器网络节点设计 |
5.3.4 汇聚节点设计 |
5.3.5 多功能传感器模块 |
5.4 监测系统软件设计 |
5.4.1 整体设计 |
5.4.2 主程序流程 |
5.4.3 节点程序流程 |
5.4.4 网络协调器程序流程 |
5.4.5 监测平台的设计 |
5.5 基于数据融合的设计方案 |
5.6 本章小结 |
第6章 总结与展望 |
6.1 总结 |
6.2 展望 |
参考文献 |
致谢 |
四、一种利用数据融合来提高局部性和减少伪共享的方法(论文参考文献)
- [1]连退生产过程产品质量预测及操作优化[D]. 王帝. 天津工业大学, 2021(01)
- [2]大规模云计算系统的可靠性建模及优化研究[D]. 孟飒. 电子科技大学, 2021(01)
- [3]基于数据压缩及融合的高效网络安全分析[D]. 靖旭阳. 西安电子科技大学, 2020(02)
- [4]国产申威众核处理器上分子生物学应用的算法设计和性能优化方法研究[D]. 陈俊仕. 中国科学技术大学, 2020(06)
- [5]云端融合的同步定位与地图构建高效算法关键技术研究[D]. 张鹏飞. 国防科技大学, 2018(01)
- [6]基于多核处理器的并行3D-FFT研究[D]. 曾全站. 哈尔滨工业大学, 2017(02)
- [7]基于性能监测硬件支持的片上缓存资源管理技术[D]. 刘玉. 中国科学技术大学, 2013(10)
- [8]无线传感网络下的数据融合技术研究[D]. 潘良勇. 武汉理工大学, 2012(10)
- [9]面向OpenMP和OpenTM应用的并行数据重用理论[J]. 吴俊杰,杨学军,刘光辉,唐玉华. 软件学报, 2010(12)
- [10]二维非线性对流扩散方程求解程序的测试与优化[J]. 赵永刚,付立东,邓福岐. 计算机技术与发展, 2009(07)