一、一种基于用户需求的基准测试方法(论文文献综述)
周文迪[1](2021)在《面向C程序的软件功耗评估方法研究与应用》文中研究表明近年来,随着物联网以及人工智能的飞速发展,计算机的计算性能和信息处理能力得到了极大提升。然而计算机硬件设备的运算速度越快,运行的应用程序越复杂,设备消耗的电量也越大。由于受到计算机硬件设备大小和芯片制作工艺的约束,降低计算机硬件功耗变得越来越困难,所以从软件层面降低功耗的办法受到了普遍关注。而软件功耗评估作为软件功耗优化研究的基础,更是成为了重点研究对象。现有软件功耗评估方法大多集中于软件功耗的建模与优化上,研究者通过建立相应的软件功耗模型来评估软件功耗,进而为软件功耗的优化指明方向。软件功耗的建模分析方法往往是针对具体的应用软件,然而在系统软件的功耗特性方面并没有统一的评价标准。并且现有研究大都处于理论层面,实际应用与评估工具较少。C语言作为一种当前主流的程序设计语言,凭借其灵活以及性能优势,在嵌入式软件、数据存储、操作系统等方面得到了广泛应用。因此本文以有效评估软件功耗为目标,以C程序为例,分别对系统软件功耗和应用软件功耗的评估方法进行了研究。对于系统软件功耗的评估,本文通过对C程序具体语句的测量,在分析其功耗特性和现有基准技术的基础上提出了一套系统软件功耗的评估基准CEC(C Energy Consumption)-Bench Mark。对于应用软件功耗的评估,本文对软件功耗评估工具HMSim进行了改进,优化了其功耗评估算法和用户交互方式,设计实现了评估工具B-HMSim。最后,对提出的评估基准CEC-Benchmark和评估工具B-HMSim进行了实验验证。总的来说,本文的创新主要有以下几个方面:1.对C程序不同类型语句的软件功耗进行实际测量,分析总结了C程序语句的功耗特性,并提出了C程序语句的软件功耗优化策略。2.设计了评估基准CEC-Benchmark和综合评价指标R,系统的综合评价指标R越小,说明在该系统软件下执行C程序耗能越小。3.参考算法级建模分析方法,从时间和空间两个维度对C程序软件功耗产生的原因进行分析,提出了一种函数软件功耗的评估方法,并在HMSim的基础上设计实现了评估工具B-HMSim。功耗目前已经成为软件评估的重要指标,本文设计的CEC-Benchmark和B-HMSim可以有效的帮助嵌入式软件开发人员对软件功耗进行评估与优化。CEC-Benchmark能够有效评估系统软件的功耗特性,综合评价指标R可以有效的帮助嵌入式开发者选择和优化系统软件。在设计C程序应用软件时,开发者可以利用B-HMSim来评估其功能函数的功耗,进而对算法和程序进行优化,减少软件的能量消耗。
杨林[2](2021)在《基于改进灰狼算法的共享单车停车点选址研究》文中提出进入21世纪以来,互联网经济与共享经济的飞跃发展为共享单车系统的发展注入新的活力。共享单车为解决城市公共交通“最后一公里”问题做出了重大贡献,极大提升了城市公共交通服务水平,成为城市公共交通系统中不可或缺的一部分。伴随着共享单车的“野蛮生长”,乱停乱放问题日益突出,给城市管理带来巨大麻烦,严重影响了市容风貌,违背了共享单车服务大众出行的本质。因此,针对共享单车停车点选址问题的研究显得极具研究价值。首先,在共享单车停车点选址模型上,本文将用户骑行整个过程分为起始点寻车、骑行过程、停车步行至目的地三个阶段。在考虑需求分配、步行意愿半径、可支配单车数量、停放点容量限制等因素下,以用户骑行出行总时长最小化和单车运营商总成本最小化为优化目标,建立了基于用户骑行出行的共享单车停车点选址模型。其次,在求解模型的仿生学算法设计上,本文针对标准灰狼算法存在的种群多样性差、易陷入局部最优、后期收敛速度慢的缺陷,借鉴改进Tent混沌序列、螺旋函数、模拟退火算法、遗传算法和高斯扰动策略,提出一种改进的灰狼算法,并使用8种不同类型的基准测试函数同标准灰狼算法、遗传算法和粒子群算法在相同环境下进行性能测试。结果表明,改进灰狼算法较标准灰狼算法、遗传算法和粒子群算法,收敛速度更快,寻优精度更高,性能更优越。最后,本文选取了一个算例,在设定好模型参数和基础数据后,利用改进灰狼算法求解并分析了整个共享单车停车点选址规划过程,验证了基于用户骑行出行的共享单车停车点选址模型的可行性和有效性。
李昭[3](2021)在《面向云系统性能优化的学习增强设计研究》文中研究说明学习增强系统设计是指在传统的云系统架构中引入机器学习(machinelearn-ing/ML)或深度学习(deep learning/DL)框架形成的新的系统框架,旨在传统方法的基础上进一步的提升云系统的性能和自适应性。具体而言,伴随着互联网服务的快速发展,用户服务质量要求的不断提升,云服务商服务的业务、承载的数据流也更加多样。复杂多变的系统环境为性能优化如动态参数调整、路由调度优化、增强负载平衡等问题提出了新的挑战,即便在相同的框架下,针对不同的业务和数据流,其系统状态和优化方案也不尽相同。传统的优化解决方案通常需要对具体的业务场景有非常专业的知识,导致在迁移性、扩展性和自适应性上仍然有一定的局限性。近年来,随着人工智能研究的快速迭代,机器学习和深度学习技术展现出了优异的抽象建模能力,为系统状态建模和系统性能优化方案提供了新的思路。通过观察收集系统行为和数据流信息,对系统行为、系统数据流进行抽象拟合,从而更好的实现系统性能优化。然而,由于ML/DL模型具有天然的不确定性,而系统有着极高的可用性要求,直接简单的收集历史数据,将模型套用在系统场景中并不能有效的解决性能优化问题,且难以部署在真实的生产环境中。本文旨在设计实现适用于系统性能优化目的学习增强系统工具链。为了使系统优化任务场景和人工智能的数据收集、模型推理、训练组合与测试更好的协同,我们开展了一系列的研究。我们首先从真实系统需求出发,探究数据采集策略,设计具体的优化方案;之后,我们提出了通用性更强的模型自动组合建模策略;最后,为了帮助开发者理解模型行为并对目标模型进行测试,我们设计了基于误差分布的黑盒模型测试工具。本文主要研究包含了下述四个部分:(1)面向系统参数优化的学习增强设计。端到端的参数优化是经典的系统性能优化任务之一,通过对框架中的开放参数进行配置调整,从而实现对关键系统性能指标的优化。然而,参数调整需要等待系统启动并稳定后才能收集到有效数据,而且性能指标(例如吞吐、延时等)容易受到外因影响而产生噪音导致度量不准确。为了解决采样耗时长、采样性能评估有噪音的问题,我们提出了 Metis——一个基于贝叶斯优化的鲁棒性强的参数优化服务。我们设计了噪音点检测和组合型采样方法,从而在有噪音环境下能够主动采集到有效信息。我们在真实的BingAds的IDHash缓存的尾端延迟优化任务中对本文所述方法进行验证,结果证明,在相同采样数量下,我们的方法相比于其他采样法给出了尾端延迟更低的参数组合方案。(2)面向优先级调度的学习增强设计。端到端的实时调度任务是我们在传统系统任务中的另一项探索。实时调度任务的性能评估包含了调度算法开销和后端任务执行开销。因此,在具体调度时需要考虑二者的协同以获取最优效果。为此,我们实现了基于深度学习的序列调度工具LearnedRanker,利用输出权重作为调度优先级并设计模型结构的自动调整以最优化端到端的延迟。另外,为了最大化调度模型性能,我们实现了基于梯度的主动数据生成和剪枝压缩技术。我们在基于正则表达式的规则检验任务中进行序列优化,以提升规则检验速度。在两个真实的规则检验集合(CRS和Snort)和三个常见的规则检验框架(PCRE,RE2和HyperScan)中将我们的序列优化算法作为插件验证LearnedRanker性能,结果表明我们的方法相比于静态算法和传统调度方法,能够大幅缩减整体时延。(3)学习增强系统设计与运维。尽管机器学习和深度学习为优化系统设计和性能提升提供了新的可能性,传统系统优化领域的探索告诉我们仅仅依赖现有的ML/DL算法并不能真正的实现学习增强的范式转变。为此,我们报告了在微软的研究和解决生产环境下部署学习增强系统所积累的经验,并提出了 AutoSys框架,AutoSys框架将学习增强系统的开发过程进行统一。它解决了一些常见的设计问题,包括ad-hoc或非确定性作业、由于模型不确定性导致的系统故障以及可扩展问题等。此外,我们通过一个真实的生产系统WebSearch来展示应用AutoSys的优势。最后,我们分享了这几年来在设计和使用学习增强系统过程中所产生的难以预料的影响以及我们获取的经验教训。(4)基于误差分布的性能预测模型测试工具。在新的系统、框架、版本上线前都需要经过反复的测试以确保系统的稳定和安全。而学习增强系统中的学习参数构成的模型几乎是一个黑盒子,复杂、难以理解且具有天然的不确定性。潜在的错误决策会造成性能下降、阻塞甚至系统崩溃。这一问题阻碍了学习增强系统在真实生产环境的部署。传统的模型测试通过对抗生成或随机扰动的方式生成使模型决策错误的样本。而孤立的样本点集合不能反映出模型在整个数据空间的整体水平,容易产生测试结果覆盖不足的问题。因此,我们提出了 Tapio,一个基于误差分布拟合的测试工具,通过最小化最大不确定性区域面积的方法来快速拟合全局误差分布。由此将已训练模型的全局表现水平展现给开发者,帮助开发者对模型进行微调或学习框架进行约束,以实现学习增强系统可靠性提升,推动其在真实场景下的部署。我们在RocksDB和Azure VM两个不同的场景下,对其性能预测模型进行测试。我们验证了 Tapio可以有效的帮助RocksDB的写吞吐性能提升,Azure VM的预测准确率提升。
郝萌[4](2020)在《高性能并行程序性能预测和能效优化》文中进行了进一步梳理随着高性能计算的发展,HPC系统的规模和复杂度大幅度增加,其计算能力从P级向E级发展。这就为并行程序的移植和优化带来了极大的挑战。并行程序向大规模HPC系统移植时通常面临着执行效率低、可扩展性差的问题,难以充分利用硬件系统的计算资源。这会造成HPC系统计算资源和电力资源的浪费,增加运行成本。此外,由于电力成本和供电系统的限制,功率也已成为大规模HPC系统尤其是未来E级系统的关键设计约束。这就需要针对并行程序构建性能预测模型,发掘程序的性能和扩展性瓶颈,并在功率约束下根据系统和应用程序的特征提出相应的协同优化方法,进而提高HPC系统能效。本文针对HPC系统并行程序性能预测和能效优化问题,开展了一系列研究工作,具体包括以下几个方面:首先,为了在HPC程序大规模移植之前,在目标系统的小规模原型系统或子集上实现程序可扩展性预测,本文提出了一种基于编译级中间代码的HPC程序可扩展性预测方法。该方法将编译技术与细粒度的回归分析相结合,对HPC程序的计算和通讯进行分开建模。为了降低建模的成本,本文在计算预测模块提出了混合基本块插桩和代码删减算法,在通讯预测模块采用了细粒度的回归建模方法。整个过程不需要领域专家的指导,实现了性能建模的自动化。在Taub集群和天河二号超级计算机上的利用真实HPC应用程序进行实验。结果表明,对于不同的应用程序,该方法所实现的预测误差在0.35%到11.61%之间,平均误差为4.28%。与传统基于回归的预测方法相比,该方法在预测应用程序在大规模环境下的性能时具有更高的准确性。其次,为了在HPC程序大规模移植之后,在目标系统上实现程序的多参数性能预测,本文提出了多参数性能建模与预测方法。该方法以基本块频率为特征,采用机器学习算法自动构建具有较高泛化能力的多参数性能模型。为了减少预测开销,本文提出了一些特征过滤策略来减少训练阶段的特征数量,并为每个目标程序构建了名为BBF collector的串行程序,以便在预测阶段快速收集特征值。在天河二号超级计算机上利用真实的并行应用程序进行测试。结果表明,相比于其他基于输入参数的性能建模方法,本文所提出的以基本块频率作为特征的方法具有更好的预测效果,其平均预测误差为6.33%,平均预测开销小于原程序执行开销的0.13%。然后,为了便于对HPC程序跨平台移植性能进行评估,本文提出了一种面向HPC应用的通用基准测试程序自动构建方法,该方法以原始程序的跟踪日志作为输入,自动生成能够完全反映原始程序计算、通讯和I/O特征的高保真基准测试程序。在Taub集群和天河二号超级计算机上利用真实的并行应用进行实验。结果表明,所生成的基准测试程序能够准确地保持原始并行应用的性能特征,可以准确预测原始应用程序的性能。此外,可以按比例减少循环的迭代次数来缩减基准测试程序的执行时间,从而减少预测开销。该方法在性能预测上比原程序执行速度提高了10倍,且平均预测误差小于10%。最后,为了对功率约束系统中功率分配策略和HPC程序能效进行优化,本文将功率上限与非核频率缩放相结合,提出了一种在功率约束系统上预测并行应用的帕累托最优功率上限配置方法。该方法首先利用精心设计的微基准测试程序和少量已有的基准测试程序建立训练集,然后采用多目标机器学习算法,将单目标堆叠方法与极限梯度提升相结合,建立性能和能量的多目标模型。这些模型可用于预测最佳处理器和内存功率上限配置,帮助计算节点执行细粒度的功率上限分配。当确定最佳功率上限配置时,利用非核心频率缩放进一步优化系统能耗。与参考功率上限配置相比,该方法可以将系统所需的功率上限降低31.35%,平均能耗降低12.32%,平均性能损失仅为2.43%。
曹坤[5](2020)在《边缘计算服务品质优化技术研究》文中研究表明随着物联网技术的迅猛发展和广泛应用,接入网络的物理设备(例如手机、平板、智能手表)数量激增,同时各种新兴的诸如虚拟现实、增强现实、在线手机游戏等低响应延迟需求的物联网应用不断涌现。传统网络以云服务器为计算平台,所有数据都需通过网络传输到云服务器进行处理,在万物互联时代无法满足物联网应用的低响应延迟需求。为了弥补云计算平台的不足,边缘计算这一新兴的计算范式便应运而生,其主要思想是将服务部署到更接近终端用户的边缘网络,实现计算、存储和通信等资源的有效利用。服务品质驱动的资源管理是边缘计算领域的研究热点之一,它通过使用各种服务品质需求来指导边缘计算系统的资源配置策略,使得系统各部件可以相互配合以满足部件作用域内的具体设计需求。然而,当前服务品质驱动的资源管理机制忽视了终端设备的移动性和复用性,带来用户间响应延迟差异过大而影响服务体验、任务冗余执行而缩短系统生命周期、终端设备资源不能共享而降低应用计算精度等问题。因此,本文从终端设备的移动性和复用性两大特性出发,研究如何通过高效的资源配置管理,优化用户响应延迟、系统生命周期、应用计算精度这三个评价边缘计算系统服务品质的典型指标。具体来说:1.本文结合终端设备的移动性,设计了一种既能降低边缘计算系统中用户的平均响应延迟,又能保障跨域用户间响应延迟公平性的边缘服务器部署方案。该方案包括静态和动态响应延迟优化两个阶段。针对静态响应延迟优化,本文首先采用整数线性规划技术对边缘服务器的放置、基站-边缘/云服务器的映射进行建模,然后使用整数线性规划求解器对问题进行求解。为了适应终端设备的移动性,需要在系统运行时动态地调整基站到边缘/云服务器的映射关系。因此,针对动态响应延迟优化,本文首先采用合作博弈论对基站到边缘/云服务器的重映射进行建模,然后利用纳什讨价还价方法对基站重映射问题进行求解。本文还开发了适应终端设备移动性的响应延迟验证平台,进行了大量仿真实验以验证提出的响应延迟优化技术的有效性。2.本文结合终端设备的移动性,设计了一种静态和动态任务调度相结合的高能效任务调度机制,以平衡电池供电的终端设备间的能耗,延长边缘计算系统的生命周期。针对静态任务调度,本文首先采用混合整数线性规划技术,对边缘计算系统生命周期优化问题进行建模,然后使用混合整数线性规划求解器对所研究的问题进行求解。为了适应终端设备的移动性,需要在系统运行时动态地调整由静态调度方案产生的任务调度表。因此,针对动态生命周期优化,本文设计了一种基于交叉熵的任务调度策略,可以根据终端设备的能量状态动态地调整任务的执行顺序。本文还开发了适应终端设备移动性的系统生命周期验证平台,在该平台上进行了大量仿真实验以验证提出的技术在延长系统生命周期方面的有效性。3.本文结合终端设备的复用性,设计了一种能够自动适应可再生能量不稳定性的高能效应用调度机制,能够最大化边缘计算应用的平均计算精度和单个边缘计算应用的计算精度。本文提出的应用调度机制包含生成“本地”应用调度方案、生成“本地-远程”应用调度方案两个阶段。在产生“本地”应用调度方案阶段,本文设计了一种应用层和部件层的能量分配方案,可以最大化应用在本地终端设备上执行时的计算精度。在产生“本地-远程”应用调度方案阶段,本文设计了一种简单有效的计算卸载技术,将部分应用卸载到远程的边缘服务器上执行以适应可再生能量供应的不稳定性。本文还开发了适应终端设备复用性的应用计算精度验证平台,在该平台上进行了大量仿真实验以验证提出的技术在提高应用计算精度方面的有效性。
曹相[6](2020)在《高精度GNSS接收机计量检测关键技术研究及系统研制》文中认为计量关系到科技进步和产品质量效益,在GNSS产品计量方面,随着各种GNSS接收机定位终端市场比重的快速增长,其规范性和合格率检测是需要开展的重要工作。随着新兴行业(如无人车、自动驾驶技术、无人机等)的发展,对高精度GNSS产品的精度、可靠性、实时性、动态性、连续性等指标检测提出了更高的要求。当前对GNSS产品的检测主要采用基线场法,常规静态基线场检测方法的弊端是不能准确地评定GNSS终端各状态下的技术指标;此外,相对于静态场景,GNSS动态定位的瞬时性和空间变化特征显着,定位误差内部产生机制与外部环境影响更加复杂。如何有效评价动态条件下的GNSS定位性能一直是国际上研究的难点和热点问题。GNSS定位终端静态和动态工作能力的准确检测是保证GNSS行业健康发展的迫切需求。基于上述需求,本文围绕高精度GNSS定位终端动态检测系统的建立问题展开了研究。主要涉及GNSS定位模型研究、空间检测基准的构建、网络RTK静态检测参考标准方法的研究、GNSS终端动态检测技术及系统建设、GNSS动态检测规范研制几个部分。通过相关定位模型和系统建设等方面的改进和创新研究,建立了综合多系统GNSS数据、CORS技术和INS技术的GNSS定位终端动态检测系统,提升了检测的可靠性和稳定性。论文的主要工作如下:1、系统研究了多频多模GNSS融合定位模型相对于单系统GNSS,多系统数据能够提高模型强度,进而提升定位精度和稳定性。本文分别对多系统GNSS系统内差分模型(松组合模型)和系统间差分模型(紧组合模型)进行了研究,并利用实测数据对两种模型定位性能进行验证。在松组合定位模型方面,阐述了多系统GNSS伪距单点定位模型和差分相对定位模型。实验验证结果表明,相对于GPS单系统定位,多系统GNSS定位精度显着提高。其中平面方向定位精度提高58.4%,高程方向定位精度提高46.7%。在紧组合定位模型方面,针对GPS/BDS伪距紧组合定位模型,提出了BDS-3/GPS/GALILEO三系统实时估计系统间偏差(DISB)参数的紧组合定位模型。验证结果表明伪距DISB参数稳定,在紧组合定位中可以提前校正。对紧组合模型在不同观测卫星数模拟环境的定位结果显示,紧组合模型能有效提高定位精度,在观测卫星数少的情况下效果尤其明显。当观测卫星数在5颗时,精度提升幅度达到25%以上。2、构建了GNSS/INS融合的高精度空间检测基准阐述了多系统GNSS的CORS基准建立方法和虚拟观测值的生成算法。分别从CORS系统建立目标、各子系统的建立方法和测试方法等部分说明用于动态基准获取的CORS系统构建过程。建成国内首个计量检测行业多系统多频CORS系统,是国内首个为GNSS定位终端提供基准数据的检测基站。对CORS系统性能测试表明,在数据连接方面,系统24小时可用性为100%,数据丢包率小于0.01%,流动站接入初始化时间小于30s,通讯平均数据延迟小于10ms。在定位精度方面,测试点内符合定位偏差最大值为2.96cm,平均值最大值为1.50cm,内符合中误差最大值为1.65cm。外符合定位偏差最大值为3.54cm,平均值最大值为2.40cm,中误差最大值为2.60cm。提出了INS增强GNSS技术的动态高精度空间检测基准构建方法。分别包含INS结合GNSS技术高精度基准建立过程中误差来源、误差测定和误差溯源问题,详细阐述了INS增强GNSS的基准建立方法。用户终端定位测试表明,融合系统定位内符合精度N、E、U三方向分别为0.36cm,0.51cm,1.12cm,外符合精度N、E、U三方向分别为0.80cm,0.97cm,1.51cm。3、提出了网络RTK接收机静态检测标准方法通过分析传统基线法检测接收机的弊端,建立了完善的网络RTK接收机检测参数指标体系。一方面从单点、浮点、固定解三阶段对接收机各指标进行量化,综合评定网络差分接收机的技术指标。另一方面,通过搭建零基线测试环境,采用单差滤波模型方法固定单差模糊度,通过对固定残差的粗差分析及精度统计,实现待检接收机的粗差检测及观测值精度评定。4、研制了高精度GNSS车载动态导航计量检测系统并起草了检测规范在INS增强的GNSS基准建立基础上,通过CORS和高精度车载动态导航检测系统的无缝对接,集成一个车载检测基准系统、监控显示系统、GNSS信号转发系统、待检设备测量单元、供电系统、通讯系统于一体的计量检测系统。该计量检测系统稳定性强、可靠度高,可实时输出位置、姿态、速度、差分龄期、卫星观测能力等检测信息。测试分析结果表明:该系统各功能满足要求,在位置精度方面,测试结果为平面0.4cm,高程0.8cm;在姿态精度方面,俯仰角、横滚角、航向角分别为0.002°,0.002°以及0.008°;在速度精度方面,测试结果为水平0.2cm/s,高程0.3cm/s;达到毫米级定位精度。并通过实验分析了卫星失锁10s和60s时的定位精度、姿态精度和速度精度的指标,验证了该系统的可靠性。面向高精度GNSS设备动态检测的需求,在研制高精度GNSS车载动态计量检测系统的基础上,起草了“高精度北斗/GPS定位终端动态检测规范(备案稿)”,该规范规定了车载高精度卫星导航动态检测系统对全球卫星导航系统(GNSS)终端设备的动态性能的检测项目、检测方法、评价标准等,为国内卫星导航定位终端动态定位计量检测的标准化和规范化提供了参考。
胡小康[7](2020)在《云数据中心性能与安全关键问题研究》文中提出随着云计算的广泛部署和应用,传统的互联网数据中心正在向云数据中心演变。性能和安全是长期伴随云数据中心的重要议题,本论文以云数据中心的性能与安全为主线,紧跟学术界和工业界发展趋势,从系统虚拟化、异构加速器、敏感数据安全这三个重要又相互联系的性能和安全研究方向展开,总结亟需解决的三个关键科学问题并加以研究,分别为I/O虚拟化事件通路,云数据中心异构计算I/O协同交互,以及云环境租户私钥保护与使用。系统虚拟化的研究重点在于I/O虚拟化,I/O虚拟化的主要性能瓶颈在于事件通路:虚拟机监控器(VMM)的频繁介入造成大量昂贵的VM-Exit。本论文首先研究I/O虚拟化事件通路这一性能关键问题,构建高效虚拟I/O事件通路。早期软件解决方案的缺陷促使了硬件辅助Posted-Interrupt(PI)技术的诞生,提供无Exit的虚拟中断递交和完成。尽管如此,PI距离最优虚拟I/O事件通路仍存在挑战:其一,PI仅作用于中断路径,但虚拟机I/O请求也会引发大量VM-Exit;其二,基于PI的虚拟中断递交仍可能会受虚拟CPU调度影响,造成I/O处理延迟。以构建最优虚拟I/O事件通路为目标,本文基于PI提出高效低延迟虚拟I/O事件系统ES2,同时提升虚拟机与其设备之间的双向I/O事件递交。ES2首先引入混合I/O处理机制高效传递虚拟机的I/O请求,此混合机制在已有的基于Exit的通知模式和新添加的无Exit的轮询模式之间适时切换,同时攫取两种模式的优点,并提供通用的感知模式切换和专用的乐观模式切换两种算法。其次,ES2使用智能中断重定向策略优化PI递交,将虚拟中断重定向至最合适的虚拟CPU从而有效提升虚拟机的I/O响应性,在挑选最合适的中断目的虚拟CPU时,如果存在多个备选则优先考虑缓存亲和性确保I/O处理性能,并对需要定位最先运行虚拟CPU的情形提供了精确递交策略。综合性实验表明ES2可以有效减少I/O相关VM-Exit,在吞吐量和I/O延迟两方面大幅提高I/O虚拟化性能,并且具备良好的性能可扩展性。I/O虚拟化的发展促进了异构加速器(新型I/O设备)上云,成为云数据中心提升算力的有力解决方案,当前的研究重点在于如何提升系统/应用加速性能,其关键不仅仅在于加速器本身,I/O协同交互(即卸载I/O)同样非常重要。本论文接着研究云数据中心异构计算I/O协同交互这一性能关键问题,使得CPU和加速器之间可以紧密协同,有效提升加速性能。本文选择广泛部署的事件驱动型Web负载作为研究对象,首先剖析直接引入异构加速器(直接卸载模式)存在的性能瓶颈,即卸载I/O中的频繁阻塞;然后分析并对比基于Intel QAT设备的两种新型高性能卸载模式,即SSL/TLS异步卸载模式(异步并发)和HTTP压缩流水线卸载模式(同步并发),这两种创新卸载模式均允许单一应用进程/线程并发地提交卸载任务,继而分摊甚至消除阻塞造成的性能损失,且显着提高加速器内部并行计算单元的利用率。在深度分析SSL/TLS异步卸载模式的基础上,本文提出了两点重要性能优化,进一步提升I/O协同交互的效率:其一是引入启发式轮询机制,集成至应用内部以避免可能的频繁线程切换,并利用应用层知识来指导轮询行为,兼顾效率和及时性;其二是提供绕过内核的异步通知机制,通过避免异步事件递交造成的昂贵用户态/内核态切换来进一步提升应用加速性能。此外,在基于Nginx的原型实现中,本文将Nginx中的简单SSL Engine设置机制扩展为SSL Engine框架,既支持灵活强大的加速器功能配置,也方便开发者集成不同种类的加密加速器。丰富的实验表明SSL/TLS异步卸载模式和HTTP压缩流水线卸载模式均能显着提升系统加速性能,本文设计实现的两点性能优化也能带来进一步的性能提升。综合上述的分析、性能优化以及实验评估,本文可以得出一系列研究结论,为云数据中心负载引入异构加速器、实现高性能卸载提供参考。异构加速器的兴起为同时实现私钥安全和高性能密码学运算提供了新的可能性,但却不一定能够直接适应云环境。本论文最后研究云环境租户私钥保护与使用这一安全与性能关键问题,目标是在保护租户私钥的同时兼顾运算性能。现有的Keyless和Keyguard策略存在性能或安全性上的局限性,以Intel KPT为代表的新型架构使用可信安全模块(TPM)建立信任、部署密钥,并引入加密加速器卸载高开销的加密运算,然而直接将这种新型“类KPT架构”用于云租户私钥保护存在可扩展性(支持足够数量的共驻虚拟机/容器)、密钥部署延迟和透明性上的挑战。本文设计了综合性密钥管理系统Cloud KPT去解决上述挑战:基于密钥包装的思路,Cloud KPT为每个云租户随机生成唯一的租户对称密钥(TSK)作为使用类KPT硬件的主密钥并加密该租户的所有私钥,以此解决可扩展性和密钥部署延迟这两个挑战;加密私钥被租户用于应用部署,Cloud KPT使用从加速器Engine加载私钥的策略配合私钥特殊加密方式,使得上层应用和加密库不会感知到底层的底层的密钥保护机制,从而解决透明性挑战。考虑到TSK代替私钥成为租户最重要的密钥,Cloud KPT在TPM 2.0密钥复制协议的基础上引入证书信任来确保TSK部署的安全性,不仅满足传输安全,而且在目的存储处受真实TPM保护,并只能被合法租户所使用。对于需要安全TSK存储的云端密钥服务器实现方案,Cloud KPT提供了基于TPM的两阶段TSK复制机制,同时兼有高安全性、低成本以及灵活密钥部署等多项优点。此外,本文也呈现了以SGX作为可信硬件技术的Cloud KPT复用方案,提供了直接复用和间接复用两种设计思路。综合性实验表明Cloud KPT可以极大地扩展私钥保护容量,有效减少密钥部署延迟,运行时开销也很低,且得益于硬件加速,Cloud KPT仍能提供远超软件基准的私钥运算和SSL/TLS性能。
豆淋淋[8](2020)在《虚拟化技术的测评与研究》文中提出近几年来,计算机技术的发展从起初的面向物理设备的裸机时代,发展到面向资源的虚拟化时代,再到现在广泛发展并使用的面向服务的云计算时代,使得虚拟化技术更加成熟化。虚拟化技术从起初的纯软件支持发展到硬件辅助虚拟化水平,其应用平台也从传统的虚拟机级别的虚拟化发展到轻量级虚拟机级别。时至今日,由于平台之间底层硬件的不同支持程度,以及虚拟机与容器(轻量级虚拟机)的不同特点,致使传统虚拟机和轻量级虚拟机各自占据一部分市场,成为各大企业以及个人用户的基本使用需求,并得到持续蓬勃发展。然而,用户和企业对虚拟化技术的性能支持程度存在一定的疑惑。一方面,用户面对自身需求难以选择符合自身要求的、使得资源最优化利用和配置的平台;另一方面,企业在开发完成自己的服务产品后,也同样需要自测其产品或平台的性能问题。那么,如何测试并评价产品的性能,并根据测评结果选择需求平台或者进行持续优化,以求更高的性能突破。因此,要解决上述问题,需要设计一套比较通用的虚拟化性能测评方案,并在此基础上开发出对应于该测评方案的测评工具。目前市场上缺乏可以针对不同虚拟化平台的测试和评价体系,并且在虚拟化平台内部,鲜有关于虚拟机和轻量级虚拟机比较全面的性能测评研究。对虚拟机和容器性能,大多仅是定性的描述,或定量的对某一方面的性能进行对比测试。因此,本文依托于国家重点研发技术项目,以自主可控的国家发展战略为背景,设计了一套比较通用的虚拟化性能测评方案,包括对虚拟化平台的用户负载模拟、指标、场景、测试流程以及评估模型的设计。并以国产虚拟化平台和x86平台的虚拟化性能对比为代表,开发实现了针对该方案的自动化的、可视化的虚拟化性能测评工具。企业或者个人用户只需要选择被测平台的测试项,并通过简单的提交配置信息,便可以启动整个测评流程,与此同时,在工具上观察测评过程中的某些指标的实时变化。在测试完成后,可以观测到测试最终结果和图表,并查看生成的测试报告。针对本课题的研究背景和意义,本文首先对国内外现存的虚拟化技术以及虚拟化平台的测评现状进行调研,并以虚拟化技术的相关理论为基础,结合已有的研究工作,提出一套新的虚拟化性能测评方案;其次,开发了虚拟化平台测评工具原型;最后,本文以x86虚拟化平台和国产虚拟化平台为被测试平台进行实验,并进行对比化测评。进一步尝试通过实验结果找到各平台在支持虚拟化性能方面的优势和不足,从而为虚拟化平台性能调优提供参考。实验证明,本文提出的虚拟化测评方案能够定量的对不同虚拟化平台的性能进行较为全面的测评。
千瑾璐[9](2020)在《基于全局性能测试模型的Web应用系统性能测试研究与应用》文中研究指明随着企业信息化程度的提高,企业级Web应用系统的用户访问量日益增加,巨大的访问量可能会使得系统页面的响应时间变慢,甚至导致系统崩溃,这将直接影响企业的正常运营,给企业造成极大的损失,因此,企业对应用系统的性能提出越来越高的要求。如何高效地开展性能测试便成为了急需研究的课题。Web应用系统架构具有复杂性,用户的操作行为存在许多不可预见性,加之许多企业没有专业的性能测试团队,导致了性能测试过程中存在许多问题,他们的测试过程往往混乱无序,操作行为也较为随意,这些问题都反映出Web性能测试工作需要遵循一定的测试规则和测试模型。但是传统性能测试模型存在许多问题如:缺乏性能需求分析的能力,缺少对系统部署环境和性能需求指标的分析;不具备普遍指导性,没有关注系统的实际业务特性,无法广泛应用于不同领域的测试;不具备全面性,测试过程中缺少性能调优和回归测试环节,无法充分指导性能测试全过程。针对以上问题和现状,本文提出了一种用于指导Web应用系统性能测试全过程的全局性能测试模型(Global Performance Testing Model,简称GPTM)。文中深入研究了Web系统性能测试相关的理论、技术及工具。详细分析了传统的性能测试模型,总结出传统模型中存在的缺陷,针对这些缺陷并结合性能测试理论研究以及大量性能工作经验,提出了全局性能测试模型。文中构建了全局性能测试模型的整体架构,详细阐述了该模型在性能测试各个阶段的具体内容和应用方法。本文选择自动化程度较高的性能负载工具Load Runner作为本论文的实践研究工具,以智能仓储系统作为Web应用系统实例,通过实际项目来验证全局性能测试模型的有效性和易用性。文中依照全局性能测试模型的指导方法执行性能测试,分析测试结果,优化性能以及回归测试验证,最终顺利完成性能测试工作。实践结果表明本文中提出的全局性能测试模型比传统模型更加的全面和易操作,该模型将帮助企业更好地开展和管理性能测试工作。
孙天齐[10](2020)在《演化场景下云应用系统资源管理研究》文中指出随着云计算的发展和兴起,其越来越受到用户的喜爱。作为云上的虚拟化产品,相对于传统服务器,云服务器具有高可靠性、按需付费、资源弹性获取和管理方式灵活等特点,因此越来越多的Web应用管理者都选择将Web应用部署在云上。对于Web应用的管理者而言,一方面需要保证服务质量(Quality of Service,QoS),另一方面需要尽可能降低云资源租赁费用,提高费效比。Web应用运维人员需要根据需求对云服务器进行相关计算资源的配置,其中带宽资源是云服务费用中一项主要支出项目,且是配置更新相对频繁的一项资源。当负载发生较大变化时,为保证QoS,Web应用运维人员需要及时进行带宽需求预测并制定带宽管理方案,同时需要对候选方案可能带来的结果进行预先评估,以保证选择的方案能够提供稳定可用的服务,因此对于带宽资源管理的研究十分必要。带宽管理候选方案可以看作是一种假设的系统演化,本文的研究内容即是对系统进行带宽驱动的假设分析(What-if Analysis)。在现有的云应用资源管理研究中,着重关注带宽资源的较少,大多数研究侧重于CPU和内存等资源。此外,大多数研究中的方法不能适用于演化场景的预测任务,需要调整数据集或重新训练模型。针对上述问题,本文首先提出一种基于网络仿真的假设分析方法,该方法可以用于带宽需求预测和带宽管理方案的评估。但该方法模型参数较多,调节过程复杂,故本文进一步提出一种基于机器学习的方法,该方法分成两部分,一部分为采用传统机器学习模型进行带宽需求和QoS预测,另一部分为采用迁移学习方法实现特征的迁移,以帮助传统机器学习模型解决演化场景下的QoS预测问题。本文提出的两种方法均可以帮助Web应用运维人员更好地进行带宽资源管理。本文的研究内容具体包括以下三个部分:1)一种基于网络仿真的Web应用带宽资源需求和QoS预测方法,该方法采用简化的并行负载模型,同时运用自动化日志挖掘方法提取模型所需参数,并使用网络仿真工具模拟复杂的网络传输过程,用来预测不同负载强度下的带宽需求和QoS变化。最后通过基于基准测试TPC-W的Web应用验证方法的有效性,并对几种带宽管理方案进行评估。2)由于基于网络仿真的方法对QoS预测结果的稳定性稍差,且模型参数较多,参数调节过程复杂,故本文提出一种基于机器学习的方法对网络吞吐量和QoS进行预测。该方法采用传统的机器学习模型,方法中详细介绍了数据挖掘过程,并引入带宽利用率作为一个特征,使模型摆脱固定带宽配置的约束。另外,该方法同时考虑了CPU资源的影响。最后同样选择基于TPC-W的云应用作为案例来评估该方法的有效性和稳定性,且尝试进行演化场景下的QoS预测任务。3)由于传统机器学习方法对于演化场景下的QoS预测任务难以取得好的结果,因此本文进一步提出了一种基于域自适应的方法用于特征迁移,帮助传统机器学习方法更好地预测带宽驱动的演化场景下Web应用的QoS。该方法根据用户体验对响应时间进行分级,将回归问题转化为分类问题。最后通过丰富的实验来评估该方法,包括在多种演化场景下对于基准测试系统TPC-W和一个真实Web应用的QoS预测。本文提出的方法可以用于评估云上Web应用的带宽管理方案,评估结果可以为Web应用运维人员提供决策参考,以帮助他们提供高质量的应用服务,同时节约成本。另外本文提出的方法也可以推广应用到其他计算资源的管理中。
二、一种基于用户需求的基准测试方法(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、一种基于用户需求的基准测试方法(论文提纲范文)
(1)面向C程序的软件功耗评估方法研究与应用(论文提纲范文)
摘要 |
Abstract |
第1章 绪论 |
1.1 研究背景及意义 |
1.2 软件功耗的基本定义 |
1.3 国内外研究现状分析 |
1.4 论文主要研究内容 |
1.5 论文组织结构 |
第2章 相关技术研究 |
2.1 引言 |
2.2 软件功耗的建模分析方法 |
2.2.1 指令级建模分析方法 |
2.2.2 算法级建模分析方法 |
2.2.3 体系结构级建模分析方法 |
2.3 基准测试方法 |
2.3.1 基准测试的概念 |
2.3.2 基准测试的规范 |
2.3.3 基准测试程序与综合评价指标 |
2.3.4 现有基准分析 |
2.4 评估工具HMSim |
2.4.1 HMSim概述 |
2.4.2 HMSim基本组成 |
2.4.3 HMSim软件功耗评估方法 |
2.4.4 HMSim使用 |
2.5 本章小结 |
第3章 系统软件功耗的评估方法 |
3.1 引言 |
3.2 C程序软件功耗特性分析 |
3.2.1 数据类型语句 |
3.2.2 分支语句 |
3.2.3 循环语句 |
3.2.4 函数语句 |
3.2.5 数据结构语句 |
3.2.6 面向C程序的优化策略 |
3.3 系统软件功耗评估基准CEC-Benchmark |
3.3.1 基准测试方法 |
3.3.2 基准测试程序的设计 |
3.3.3 基准综合评价指标的设计 |
3.4 本章小结 |
第4章 应用软件功耗的评估方法 |
4.1 引言 |
4.2 函数软件功耗的评估方法 |
4.2.1 函数软件功耗与时间的关系 |
4.2.2 函数软件功耗与空间的关系 |
4.2.3 函数软件功耗的评估方法 |
4.3 软件功耗评估工具HMSim的改进B-HMSim |
4.3.1 B-HMSim总体设计 |
4.3.2 B-HMSim子系统设计 |
4.3.3 B-HMSim实现 |
4.4 本章小结 |
第5章 实验验证与结果分析 |
5.1 引言 |
5.2 实验环境 |
5.3 实验验证与结果分析 |
5.3.1 面向C程序的功耗优化策略验证 |
5.3.2 系统软件功耗评估基准CEC-Benchmark有效性验证 |
5.3.3 软件功耗评估工具B-HMSim验证 |
5.3.4 函数软件功耗评估方法有效性验证 |
5.4 本章小结 |
第6章 总结与展望 |
6.1 全文总结 |
6.2 未来工作展望 |
参考文献 |
攻读学位期间取得的研究成果 |
致谢 |
(2)基于改进灰狼算法的共享单车停车点选址研究(论文提纲范文)
摘要 |
ABSTRACT |
第1章 绪论 |
1.1 研究背景及研究意义 |
1.1.1 研究背景 |
1.1.2 研究意义 |
1.2 国内外研究现状 |
1.2.1 国外研究现状 |
1.2.2 国内研究现状 |
1.2.3 国内外研究现状评述 |
1.3 研究内容与研究方法 |
1.3.1 研究内容 |
1.3.2 研究方法 |
第2章 相关理论概述 |
2.1 共享单车系统概述 |
2.1.1 系统定义 |
2.1.2 系统组成 |
2.1.3 系统功能 |
2.2 多目标问题的概述 |
2.2.1 多目标问题的特点 |
2.2.2 多目标优化问题的数学描述 |
2.2.3 多目标问题的常见解决方法 |
2.3 算法改进策略的概述 |
2.3.1 混沌序列和混沌优化 |
2.3.2 模拟退火算法 |
2.4 本章小结 |
第3章 基于多目标规划的共享单车停车点选址模型建立 |
3.1 用户出行行为和停靠规律分析 |
3.1.1 用户出行目的分析 |
3.1.2 影响用户满意度因素分析 |
3.1.3 影响用户停靠因素分析 |
3.2 共享单车停车点选址模型的目标分析 |
3.3 共享单车停车点选址模型建立 |
3.3.1 选址模型的假设 |
3.3.2 选址模型的建立 |
3.4 本章小结 |
第4章 灰狼算法设计及求解比较 |
4.1 标准灰狼算法 |
4.2 改进灰狼算法 |
4.2.1 改进Tent混沌映射初始化种群 |
4.2.2 引入螺旋式数学模型 |
4.2.3 融合模拟退火算法 |
4.2.4 设置搜索阈值和高斯扰动 |
4.2.5 引入杂交权重 |
4.3 改进灰狼算法仿真实验与结果分析 |
4.3.1 算法参数设置 |
4.3.2 基准测试函数选择 |
4.3.3 算法寻优测试结果分析 |
4.4 本章小结 |
第5章 算例分析 |
5.1 算例概述 |
5.2 基于改进灰狼算法的选址模型求解及结果分析 |
5.3 本章小结 |
结论 |
参考文献 |
附录 |
攻读硕士学位期间承担的科研任务与主要成果 |
致谢 |
(3)面向云系统性能优化的学习增强设计研究(论文提纲范文)
摘要 |
abstract |
第1章 绪论 |
1.1 研究背景与意义 |
1.2 国内外研究现状 |
1.3 本文研究内容 |
1.4 论文组织结构 |
第2章 相关研究工作 |
2.1 端到端的系统优化 |
2.1.1 参数优化服务 |
2.1.2 含参的系统框架 |
2.1.3 并发系统的调参工作 |
2.1.4 基于贝叶斯的调参算法 |
2.1.5 实时调度优化 |
2.2 自动化建模 |
2.2.1 自动模型生成与选择 |
2.2.2 模块化建模 |
2.3 正确性测试 |
2.3.1 软件测试 |
2.3.2 ML/DL正确性测试 |
第3章 面向系统参数优化的学习增强设计 |
3.1 研究动机与场景描述 |
3.1.1 场景实例:Bing Ads IDHash |
3.1.2 参数配置对系统性能的影响 |
3.2 Metis设计与实现 |
3.2.1 Metis框架概述 |
3.2.2 鲁棒性提升 |
3.2.3 Metis实现 |
3.3 实验验证 |
3.3.1 实验设置 |
3.3.2 Metis的有效性 |
3.4 案例研究:BingKV |
3.5 本章小结 |
第4章 面向优先级调度的学习增强设计 |
4.1 研究动机 |
4.2 LearnedRanker |
4.2.1 LeamedRanker框架概述 |
4.2.2 LearnedRanker核心方法实现 |
4.3 实验验证 |
4.3.1 实验设置 |
4.3.2 LearnedRanker性能评估 |
4.3.3 各组件基准测试 |
4.4 本章小结 |
第5章 学习增强系统设计与运维 |
5.1 研究背景与动机 |
5.1.1 WebSearch概述 |
5.1.2 系统复杂性 |
5.1.3 运维复杂性 |
5.2 AutoSys设计 |
5.2.1 AutoSys框架概述 |
5.2.2 API设计 |
5.3 生产环境评估 |
5.3.1 系统应用逻辑优化 |
5.3.2 排序引擎优化 |
5.3.3 数据存储优化 |
5.4 AutoSys经验总结 |
5.5 本章小结 |
第6章 基于误差分布的系统性能预测模型测试工具 |
6.1 研究动机 |
6.2 方法设计 |
6.2.1 样本生成器 |
6.2.2 等价类划分 |
6.2.3 GlobalLC |
6.2.4 维度切分 |
6.2.5 异常点检测 |
6.3 Tapio实现 |
6.4 实验验证 |
6.4.1 案例研究1: 测试RocksDB的写吞吐预测模型 |
6.4.2 案例研究2: 测试Azure VM的CPU利用率预测模型 |
6.5 本章小结 |
第7章 总结与展望 |
7.1 研究内容总结 |
7.2 探讨与展望 |
参考文献 |
致谢 |
在读期间发表的学术论文与取得的研究成果 |
(4)高性能并行程序性能预测和能效优化(论文提纲范文)
摘要 |
Abstract |
第1章 绪论 |
1.1 课题背景及研究的目的和意义 |
1.2 研究现状及分析 |
1.2.1 性能建模和预测技术研究 |
1.2.2 基准测试程序构建技术研究 |
1.2.3 性能-能耗协同优化技术研究 |
1.2.4 存在的主要问题 |
1.3 本文的研究内容及组织结构 |
1.3.1 本文的研究内容 |
1.3.2 本文的组织结构 |
第2章 基于中间代码的HPC程序可扩展性预测 |
2.1 引言 |
2.2 可扩展性预测方法整体结构设计 |
2.3 可扩展性预测方法的计算预测模块 |
2.3.1 计算模型的定义 |
2.3.2 代码的混合基本块插桩 |
2.3.3 代码删减技术 |
2.4 可扩展性预测方法的通讯预测模块 |
2.4.1 通讯模型定义 |
2.4.2 代码的MPI通讯时间插桩 |
2.5 实验评估 |
2.5.1 实验方法和配置 |
2.5.2 基本块频率预测效果 |
2.5.3 程序计算部分性能预测结果 |
2.5.4 计算部分的预测开销 |
2.5.5 程序通讯部分性能预测结果 |
2.5.6 最终性能预测结果 |
2.6 本章小结 |
第3章 基于基本块特征的HPC程序多参数性能预测 |
3.1 引言 |
3.2 研究动机 |
3.3 多参数性能预测方法的整体结构设计 |
3.4 多参数性能预测方法的训练阶段 |
3.4.1 代码的Edge Profiling分析 |
3.4.2 基本块频率特征过滤 |
3.4.3 性能预测模型生成 |
3.5 多参数性能预测方法的预测阶段 |
3.5.1 代码的基本块插桩 |
3.5.2 目标程序的Collector生成 |
3.6 实验评估 |
3.6.1 实验平台和基准测试程序 |
3.6.2 模型的性能预测结果 |
3.6.3 与其他方法的预测结果对比 |
3.6.4 性能预测开销 |
3.7 本章小结 |
第4章 基于基准测试程序自动构建的跨平台性能预测 |
4.1 引言 |
4.2 基准测试程序自动构建方法的日志获取阶段 |
4.2.1 日志获取的基本方法 |
4.2.2 函数特殊参数处理 |
4.2.3 程序派生类型处理 |
4.3 基准测试程序自动构建方法的日志压缩阶段 |
4.3.1 程序连续I/O识别 |
4.3.2 程序循环结构识别 |
4.3.3 日志压缩算法 |
4.4 基准测试程序自动构建方法的日志合并阶段 |
4.4.1 程序日志预处理 |
4.4.2 日志合并算法 |
4.5 基准测试程序自动构建方法的代码生成阶段 |
4.5.1 模拟原程序的计算部分 |
4.5.2 模拟原程序的通讯和I/O |
4.5.3 模拟原程序的循环结构 |
4.6 实验评估 |
4.6.1 实验平台和测试程序 |
4.6.2 日志获取性能验证 |
4.6.3 日志压缩性能验证 |
4.6.4 日志合并性能验证 |
4.6.5 基准测试程序的性能保真性验证 |
4.6.6 性能预测结果 |
4.6.7 基准测试程序的可移植性验证 |
4.7 本章小结 |
第5章 基于预测模型的HPC系统性能-能耗协同优化 |
5.1 引言 |
5.2 性能-能耗协同优化方法的整体结构设计 |
5.2.1 多目标优化问题定义 |
5.2.2 性能-能耗协同优化方法的结构 |
5.3 特征选择和预处理 |
5.4 基准测试程序集的构建 |
5.5 多目标模型的构建 |
5.5.1 单目标堆叠 |
5.5.2 极端梯度提升 |
5.6 帕累托最优功率配置预测 |
5.7 实验评估 |
5.7.1 实验设置 |
5.7.2 性能和能耗预测效果评估 |
5.7.3 帕累托前沿预测效果评估 |
5.7.4 针对不同优化目标的程序调优 |
5.7.5 与动态非核频率缩放方法的比较 |
5.7.6 多计算节点调优 |
5.8 本章小结 |
结论 |
参考文献 |
攻读博士学位期间发表的论文及其他成果 |
致谢 |
个人简历 |
(5)边缘计算服务品质优化技术研究(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 研究背景与意义 |
1.2 国内外研究现状 |
1.2.1 边缘计算服务品质衡量指标 |
1.2.2 用户响应延迟优化机制研究 |
1.2.3 系统生命周期优化机制研究 |
1.2.4 应用计算精度优化机制研究 |
1.3 论文的研究问题与技术路线 |
1.3.1 论文的研究问题 |
1.3.2 论文的技术路线 |
1.4 论文的主要贡献与创新 |
1.5 论文的组织结构 |
第二章 系统模型 |
2.1 系统架构模型 |
2.1.1 “终端设备-边缘/云服务器”架构模型 |
2.1.2 “多终端设备-边缘服务器”架构模型 |
2.1.3 “单终端设备-边缘服务器”架构模型 |
2.2 应用模型 |
2.3 能量模型 |
2.3.1 能量供应模型 |
2.3.2 能量消耗模型 |
2.4 用户响应延迟模型 |
2.4.1 通信延迟模型 |
2.4.2 执行延迟模型 |
2.4.3 总延迟模型 |
2.5 系统生命周期模型 |
2.6 应用计算精度模型 |
2.7 本章小结 |
第三章 移动性感知的边缘计算用户响应延迟优化 |
3.1 模型说明 |
3.2 问题定义与方法概述 |
3.2.1 问题定义 |
3.2.2 方法概述 |
3.3 静态用户响应延迟优化 |
3.3.1 利用ILP形式化静态用户响应延迟优化 |
3.3.2 基于ILP的静态用户响应延迟优化算法 |
3.4 动态用户响应延迟优化 |
3.4.1 基于合作博弈的基站重映射求解 |
3.4.2 基于合作博弈的基站重映射算法 |
3.5 仿真平台开发与实验结果 |
3.5.1 仿真平台开发 |
3.5.2 仿真实验结果 |
3.6 本章小结 |
第四章 移动性感知的边缘计算系统生命周期优化 |
4.1 模型说明 |
4.1.1 近似计算应用模型说明 |
4.1.2 应用计算精度模型说明 |
4.1.3 终端设备能耗模型说明 |
4.2 问题定义与方法概述 |
4.2.1 问题定义 |
4.2.2 方法概述 |
4.3 移动性感知的静态任务调度 |
4.3.1 利用MILP形式化系统生命周期优化 |
4.3.2 基于MILP的静态任务调度算法 |
4.4 应用计算精度自适应的动态任务调度 |
4.4.1 交叉熵技术的理论基础 |
4.4.2 基于交叉熵技术的动态任务调度 |
4.5 仿真平台开发与实验结果 |
4.5.1 仿真平台开发 |
4.5.2 仿真实验结果 |
4.6 本章小节 |
第五章 复用性感知的边缘计算精度优化 |
5.1 模型说明 |
5.1.1 近似计算应用模型说明 |
5.1.2 应用计算精度模型说明 |
5.1.3 终端设备能耗模型说明 |
5.2 问题定义与方法概述 |
5.2.1 问题定义 |
5.2.2 方法概述 |
5.3 基于“本地”应用调度的计算精度优化 |
5.3.1 基于博弈论的应用层能量分配 |
5.3.2 基于MILP技术的部件层能量分配 |
5.4 基于“本地-远程”应用调度的计算精度优化 |
5.4.1 计算卸载准则 |
5.4.2 可再生能量自适应的计算卸载算法 |
5.5 仿真平台开发与实验结果 |
5.5.1 仿真平台开发 |
5.5.2 仿真实验结果 |
5.6 本章小节 |
第六章 总结与展望 |
6.1 本文总结 |
6.2 未来展望 |
参考文献 |
科研成果 |
致谢 |
(6)高精度GNSS接收机计量检测关键技术研究及系统研制(论文提纲范文)
摘要 |
Abstract |
缩略词注释表 |
第一章 绪论 |
1.1 研究目的和意义 |
1.2 国内外研究现状 |
1.2.1 GNSS定位终端计量检测的现状 |
1.2.2 GNSS发展现状 |
1.2.3 多系统GNSS数据融合方法 |
1.2.4 动态检测基准构建方法 |
1.2.5 动态定位性能评估数据处理方法 |
1.3 本文研究内容及技术路线 |
第二章 多模GNSS定位终端计量算法研究 |
2.1 引言 |
2.2 GNSS时空统一理论 |
2.2.1 GNSS坐标系统与坐标统一 |
2.2.2 GNSS时间系统与时间统一 |
2.3 GNSS组合定位模型及参数估计 |
2.3.1 GNSS松组合定位模型 |
2.3.2 GNSS紧组合定位模型 |
2.3.3 参数估计方法 |
2.4 多模GNSS组合定位实验验证 |
2.4.1 松组合模型定位效果分析 |
2.4.2 GPS/BDS伪距DISB参数应用研究 |
2.4.3 BDS-3/GPS/GALILEO重叠频率观测值紧组合定位方法 |
2.5 本章小结 |
第三章 基于INS/多系统GNSS融合的空间检测基准技术研究 |
3.1 引言 |
3.2 检测基准定位算法 |
3.2.1 基于CORS精准计量的GNSS高精度算法 |
3.2.2 GNSS/INS松组合原理 |
3.2.3 GNSS/INS紧组合原理 |
3.3 基于INS/多系统GNSS融合的空间检测基准建设 |
3.3.1 基于多系统GNSS的CORS系统建设 |
3.3.2 INS增强动态检测基准系统的建设 |
3.4 INS/多系统GNSS融合终端空间检测基准测试 |
3.4.1 基于多系统GNSS的CORS系统测试 |
3.4.2 融合多系统GNSS的检测基准性能测试 |
3.5 本章小结 |
第四章 面向高精度GNSS静态检测的参考标准方法研究 |
4.1 引言 |
4.2 GNSS接收机检测误差理论 |
4.2.1 测量误差的定义及其分类 |
4.2.2 测量结果质量评定方式 |
4.3 常规GNSS网络差分接收机静态检测方法 |
4.3.1 测量型GNSS接收机的检测方法和内容 |
4.3.2 导航型GPS接收机的定位误差表述 |
4.4 网络差分接收机的整体检测指标体系的建立 |
4.4.1 单机状态检测(单点) |
4.4.2 联网状态检测(浮点/差分) |
4.4.3 联网状态检测(固定) |
4.5 差分接收机各单项检测量化方法 |
4.5.1 单机检测方法 |
4.5.2 联网检测方法 |
4.6 零基线GPS/北斗快速模糊度固定及残差评测 |
4.6.1 单差零基线模糊度快速固定方法 |
4.6.2 基于零基线结果的精度统计及指标分析 |
4.7 本章小结 |
第五章 高精度GNSS导航终端动态检测系统 |
5.1 引言 |
5.2 系统总体组成与检测流程 |
5.2.1 系统总体组成 |
5.2.2 数据传输和检测流程的设计 |
5.3 系统测试与分析 |
5.3.1 车载检测基准系统性能测试 |
5.3.2 车载检测平台系统测试 |
5.3.3 测试小结 |
5.4 高精度BDS/GPS定位终端动态检测标准规范的研制 |
5.4.1 标准研制总体设计思路 |
5.4.2 各项标准具体内容 |
5.4.3 技术指标的标准评价 |
5.5 本章小结 |
第六章 总结与展望 |
6.1 主要研究成果 |
6.2 本文创新点 |
6.3 展望 |
致谢 |
参考文献 |
作者简介 |
攻读博士学位期间的学术成果 |
(7)云数据中心性能与安全关键问题研究(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 云计算和数据中心 |
1.2 研究方向和关键问题 |
1.2.1 系统虚拟化 |
1.2.2 异构加速器 |
1.2.3 敏感数据安全 |
1.3 研究内容与贡献 |
1.3.1 研究内容 |
1.3.2 研究贡献 |
1.4 论文组织结构 |
第二章 背景知识和相关研究工作 |
2.1 虚拟I/O事件通路 |
2.1.1 x86 I/O事件架构 |
2.1.2 虚拟I/O事件递交:性能瓶颈 |
2.1.3 软件解决方案 |
2.1.4 硬件辅助技术:Posted-Interrupt |
2.2 云数据中心计算密集型负载加速 |
2.2.1 加密负载加速 |
2.2.2 压缩负载加速 |
2.3 云环境下密钥保护 |
2.3.1 云环境私钥安全威胁 |
2.3.2 Keyless解决方案 |
2.3.3 Keyguard解决方案 |
2.4 本章小结 |
第三章 高性能:I/O虚拟化事件通路研究 |
3.1 引言 |
3.2 现存挑战分析 |
3.3 高效低延迟虚拟I/O事件通路设计 |
3.3.1 概述 |
3.3.2 混合I/O处理机制 |
3.3.3 智能中断重定向机制 |
3.4 系统实现 |
3.4.1 混合I/O处理 |
3.4.2 智能中断重定向 |
3.5 实验验证与性能评估 |
3.5.1 实验设置 |
3.5.2 VM-Exit发生率测试 |
3.5.3 吞吐量测试 |
3.5.4 I/O响应性测试 |
3.6 分析讨论 |
3.6.1 系统开销分析 |
3.6.2 SR-IOV适用性讨论 |
3.7 本章小结 |
第四章 高性能:云数据中心异构计算I/O协同交互研究 |
4.1 引言 |
4.2 背景和挑战 |
4.2.1 事件驱动Web架构 |
4.2.2 Intel QAT加速器 |
4.2.3 直接卸载模式性能瓶颈 |
4.3 两种新型高效卸载模式分析和对比 |
4.3.1 SSL/TLS异步卸载模式 |
4.3.2 HTTP压缩流水线卸载模式 |
4.3.3 同步并发vs. 异步并发 |
4.4 SSL/TLS异步卸载模式优化 |
4.4.1 性能优化:启发式轮询机制 |
4.4.2 性能优化:绕过内核的异步通知机制 |
4.4.3 配置优化:SSL Engine框架 |
4.5 实验验证与性能评估 |
4.5.1 实验设置 |
4.5.2 SSL/TLS卸载 |
4.5.3 HTTP压缩卸载 |
4.5.4 联合卸载 |
4.6 研究结论 |
4.7 本章小结 |
第五章 安全加性能:云环境租户私钥保护与使用研究 |
5.1 引言 |
5.2 目标和方法 |
5.2.1 威胁模型和假设 |
5.2.2 设计目标 |
5.2.3 硬件选择:类KPT架构 |
5.2.4 上云挑战 |
5.2.5 Cloud KPT方法 |
5.3 Cloud KPT系统设计 |
5.3.1 系统概述 |
5.3.2 密钥生命周期 |
5.3.3 TSK部署安全保障 |
5.3.4 云密钥服务器:两阶段TSK复制机制 |
5.4 系统实现细节 |
5.4.1 加密私钥的生成、部署和加载 |
5.4.2 TSK相关操作 |
5.4.3 证书和信任 |
5.5 Cloud KPT复用:使用SGX作为可信硬件技术 |
5.5.1 基于TSK部署的直接复用 |
5.5.2 基于私钥部署的间接复用 |
5.5.3 密钥部署安全保障 |
5.5.4 后端加密服务集成与保护 |
5.6 安全分析 |
5.7 实验验证与性能评估 |
5.7.1 实验设置 |
5.7.2 保护容量 |
5.7.3 密钥部署延迟 |
5.7.4 私钥运算性能与运行时开销 |
5.8 本章小结 |
第六章 总结与展望 |
6.1 研究总结 |
6.2 后续工作展望 |
参考文献 |
致谢 |
攻读博士学位期间已发表或录用的论文 |
攻读博士学位期间参与的项目 |
攻读博士学位期间申请的专利 |
(8)虚拟化技术的测评与研究(论文提纲范文)
摘要 |
ABSTRACT |
符号对照表 |
缩略语对照表 |
第一章 绪论 |
1.1 课题背景及意义 |
1.1.1 课题背景 |
1.1.2 课题意义 |
1.2 国内外研究现状 |
1.2.1 虚拟化技术研究现状 |
1.2.2 虚拟化平台测评研究现状 |
1.3 论文研究内容 |
1.4 论文组织结构 |
第二章 相关理论和技术介绍 |
2.1 虚拟化产品基本架构及类型 |
2.1.1 虚拟化基本架构 |
2.1.2 虚拟化技术的分类 |
2.2 典型虚拟化平台介绍 |
2.2.1 x86虚拟化平台 |
2.2.2 国产虚拟化平台 |
2.3 本章小结 |
第三章 虚拟化平台性能测评方案设计 |
3.1 性能测评关键问题 |
3.2 测试负载分析与设计 |
3.3 虚拟化平台测评指标分析与设计 |
3.4 测试场景分析与设计 |
3.5 测试流程分析与设计 |
3.5.1 测试流程总体分析设计 |
3.5.2 测试流程详细设计 |
3.6 测试评估模型设计 |
3.7 本章小结 |
第四章 虚拟化性能测评工具设计与实现 |
4.1 虚拟化性能测评工具功能分析与设计 |
4.2 虚拟化性能测评工具总体设计 |
4.2.1 虚拟化性能测评工具总体架构设计 |
4.2.2 虚拟化性能测评工具流程设计 |
4.2.3 虚拟化性能测评工具关键技术选型 |
4.3 虚拟化测评工具模块设计 |
4.3.1 信息配置模块详细设计 |
4.3.2 测试驱动模块详细设计 |
4.4 虚拟化测评工具实现 |
4.5 本章小结 |
第五章 测评及结果分析 |
5.1 实验环境 |
5.1.1 硬件环境 |
5.1.2 软件环境 |
5.2 x86虚拟化平台测试 |
5.2.1 虚拟机与容器性能测试 |
5.2.2 性能对比结果 |
5.3 国产虚拟化平台测试 |
5.3.1 虚拟机与容器性能测试 |
5.3.2 性能对比结果 |
5.4 x86平台与国产平台对比测试 |
5.4.1 平台CPU性能测试对比 |
5.4.2 平台内存性能测试对比 |
5.4.3 平台磁盘性能测试对比 |
5.4.4 平台网络性能测试对比 |
5.4.5 平台虚拟化性能测试对比总结 |
5.5 本章小结 |
第六章 总结与展望 |
6.1 本文总结 |
6.2 未来展望 |
参考文献 |
致谢 |
作者简介 |
(9)基于全局性能测试模型的Web应用系统性能测试研究与应用(论文提纲范文)
摘要 |
Abstract |
第一章 绪论 |
1.1 研究背景及意义 |
1.2 国内外研究现状 |
1.3 论文主要研究内容 |
1.4 论文章节安排 |
第二章 Web性能测试技术分析 |
2.1 Web性能测试的概念 |
2.2 Web性能测试的基础理论 |
2.2.1 Web性能测试方法 |
2.2.2 Web性能测试指标 |
2.2.3 Web性能测试应用领域 |
2.3 性能测试工具 |
2.3.1 Load Runner测试工具的介绍 |
2.3.2 Load Runner体系架构 |
2.3.3 Load Runner工作原理 |
2.3.4 Load Runner中的概念解析 |
2.4 本章小结 |
第三章 全局性能测试模型 |
3.1 传统性能测试模型的研究与分析 |
3.1.1 传统性能测试模型 |
3.1.2 传统性能测试模型的不足 |
3.2 全局性能测试模型架构的提出 |
3.2.1 性能测试的需求分析 |
3.2.2 制定性能测试的计划 |
3.2.3 设计并执行性能测试 |
3.2.4 性能测试结果分析 |
3.2.5 性能调优和回归测试 |
3.2.6 全局性能测试模型整体架构 |
3.3 全局性能测试模型的描述及应用方法 |
3.4 全局性能测试模型的优势 |
3.5 本章小结 |
第四章 基于全局性能测试模型的实践应用 |
4.1 实例系统简介 |
4.2 性能需求分析 |
4.2.1 系统环境部署情况 |
4.2.2 提取性能测试点 |
4.2.3 计算性能需求指标 |
4.2.4 确定性能需求 |
4.3 制定测试计划 |
4.3.1 测试目的 |
4.3.2 测试引用标准及资料 |
4.3.3 测试范围 |
4.3.4 测试内容 |
4.3.5 测试工具 |
4.3.6 测试通过准则 |
4.3.7 测试阶段人员分工 |
4.4 设计性能测试用例 |
4.5 创建性能测试脚本 |
4.5.1 系统登录脚本 |
4.5.2 查询物资库存脚本 |
4.5.3 新建物资领料单脚本 |
4.6 设计并执行场景 |
4.6.1 基准场景 |
4.6.2 单业务负载场景 |
4.6.3 综合业务负载场景 |
4.7 测试结果的分析与优化 |
4.7.1 场景一性能结果分析 |
4.7.2 场景二性能结果分析 |
4.7.3 场景三性能结果分析 |
4.7.4 综合场景性能结果分析 |
4.8 性能测试结果调优 |
4.9 回归测试验证 |
4.10 全局性能测试模型的应用总结 |
4.11 本章小结 |
总结与展望 |
全文工作总结 |
未来工作展望 |
参考文献 |
攻读硕士学位期间取得的研究成果 |
致谢 |
附件 |
(10)演化场景下云应用系统资源管理研究(论文提纲范文)
摘要 |
abstract |
第一章 绪论 |
1.1 研究背景和意义 |
1.1.1 研究背景 |
1.1.2 研究意义 |
1.2 研究问题和挑战 |
1.2.1 研究问题 |
1.2.2 面临的挑战 |
1.3 主要研究内容 |
1.4 本文组织结构 |
第二章 相关方法与技术介绍 |
2.1 资源需求与QoS预测方法 |
2.1.1 仿真 |
2.1.2 传统机器学习 |
2.1.3 迁移学习 |
2.2 数据处理工具 |
2.3 模拟实验 |
2.3.1 基准测试TPC-W |
2.3.2 应用部署 |
2.4 网络仿真工具 |
2.5 本章小结 |
第三章 基于网络仿真的带宽资源管理 |
3.1 概述 |
3.2 相关工作 |
3.3 建模与仿真方法 |
3.3.1 Web服务建模与仿真框架 |
3.3.2 并行负载模型 |
3.3.3 系统模型及其参数 |
3.3.4 从日志中挖掘模型参数 |
3.3.5 模型验证与仿真预测 |
3.4 带宽需求预测实验 |
3.4.1 实验设置 |
3.4.2 实验结果及分析 |
3.5 带宽伸缩方案评估实验 |
3.5.1 实验设置 |
3.5.2 实验结果及分析 |
3.6 方法的局限性 |
3.7 本章小结 |
第四章 基于机器学习的带宽资源管理 |
4.1 概述 |
4.2 相关工作 |
4.3 建模方法 |
4.3.1 数据挖掘 |
4.3.2 TPC-W的特殊情况 |
4.3.3 带宽利用率 |
4.3.4 模型构建 |
4.4 实验评估 |
4.4.1 实验设置 |
4.4.2 数据收集 |
4.4.3 模型性能比较 |
4.4.4 特征选择 |
4.4.5 演化场景下的预测能力 |
4.5 方法的局限性 |
4.6 本章小结 |
第五章 基于域自适应的演化场景下QoS预测 |
5.1 概述 |
5.2 相关工作 |
5.3 问题描述 |
5.4 建模方法 |
5.4.1 特征选择 |
5.4.2 响应时间分级 |
5.4.3 域自适应 |
5.4.4 模型构建 |
5.5 实验评估 |
5.5.1 实验设置 |
5.5.2 数据收集 |
5.5.3 域自适应方法选择 |
5.5.4 演化场景下的QoS预测 |
5.5.5 灵敏度分析 |
5.6 方法的局限性 |
5.7 本章小结 |
第六章 总结与展望 |
6.1 网络仿真与机器学习方法比较 |
6.2 本文总结 |
6.3 工作展望 |
参考文献 |
攻读硕士学位期间发表的学术论文及取得的相关科研成果 |
致谢 |
四、一种基于用户需求的基准测试方法(论文参考文献)
- [1]面向C程序的软件功耗评估方法研究与应用[D]. 周文迪. 四川大学, 2021(02)
- [2]基于改进灰狼算法的共享单车停车点选址研究[D]. 杨林. 燕山大学, 2021(01)
- [3]面向云系统性能优化的学习增强设计研究[D]. 李昭. 中国科学技术大学, 2021(06)
- [4]高性能并行程序性能预测和能效优化[D]. 郝萌. 哈尔滨工业大学, 2020(02)
- [5]边缘计算服务品质优化技术研究[D]. 曹坤. 华东师范大学, 2020(08)
- [6]高精度GNSS接收机计量检测关键技术研究及系统研制[D]. 曹相. 东南大学, 2020(01)
- [7]云数据中心性能与安全关键问题研究[D]. 胡小康. 上海交通大学, 2020(01)
- [8]虚拟化技术的测评与研究[D]. 豆淋淋. 西安电子科技大学, 2020(05)
- [9]基于全局性能测试模型的Web应用系统性能测试研究与应用[D]. 千瑾璐. 华南理工大学, 2020(02)
- [10]演化场景下云应用系统资源管理研究[D]. 孙天齐. 上海工程技术大学, 2020(04)