一、多线程文件传输的实现方法及其性能的研究(论文文献综述)
何易于[1](2021)在《基于ZooKeeper和Netty的分布式文件传输系统的设计与实现》文中研究表明近年来,我国的社会信息化程度不断提高,互联网渗透进了各行各业。与之相对的,传统的文件传输方式由于存在着诸如传输效率低下、文件安全无法保障、文件传输大小受限等缺点,日渐难以满足现代企业的文件传输需求。另一方面,主流的文件传输工具在面对企业内网时也很难发挥其应有的作用。如何在企业局域网内部进行高效的文件传输成为了每个企业亟待解决的问题。基于这样的现状,本文结合企业实际网络环境设计实现了一种分布式文件传输系统。本文基于Netty实现文件传输功能,设计了一种消息对象来规避传输文件时因数据序列化/反序列化导致的额外开销,大幅提高了文件传输效率。同时,本文设计了两种任务信息来记录文件传输的详情,并以任务信息来控制文件传输,从而实现断点续传、加密传输、文件完整性校验等功能。另一方面,通过将任务信息保存到高速缓存,本文也实现了任务恢复和自动重传功能。其次,本文基于ZooKeeper设计了一种能够反映系统内节点间路由关系并能根据系统内节点上下线情况自动进行更新的路由图。而基于路由图提供的路由链路,本文设计了一种数据中转机制来实现了文件的跨局域网传输,使系统能够适应各种网络环境。测试结果表明,本文设计实现的分布式文件传输系统对比FTP在传输效率方面具有明显优势。
罗德宁[2](2021)在《大规模数据实时绘制关键技术研究》文中指出三维图形绘制在游戏娱乐、虚拟现实、科学计算可视化等众多领域有着广泛应用,而且在实时和真实方面的绘制要求越来越高。近年来,软硬件的计算性能得到了很大提升,但是面对数据规模的日益增长,大规模数据的实时绘制面临巨大挑战。本文主要针对体数据和地理地形数据的真实和实时绘制技术展开研究。对于精度高、体量大的体数据,三维可视化计算量大,同时增加光照计算更加重了计算负担。大规模地理地形数据一直存在如何高效处理和绘制的问题。同时,反走样技术在数据绘制中能够显着增强视觉效果,减少图像走样、闪烁,但会带来额外的绘制开销。数据规模的增长无疑加重了各种绘制技术的计算开销,即便是提高绘制性能的并行绘制技术在面绘制和体绘制上还存在诸多挑战。针对上述技术问题,本文的主要工作和创新点包括以下方面:(1)数据并行化体绘制及光照计算在基于切片和光线投射两种主流体绘制方法基础上,针对光照计算量大的问题展开性能可扩展研究。针对基于切片体绘制在多绘制遍全局光照计算效率低的问题,提出单绘制遍多切片(Multi-Slice Per Pass,MSPP)算法,从数据与算法并行层面提升绘制能力。在相同切片数量下,MSPP算法可以提高半角切片(Half-Angle Slicing)算法大约两倍的性能。针对光线投射体绘制采样复杂导致光照计算量大的问题,提出基于切片的光线投射(Slice-based Ray Casting,SBRC)方法提升绘制效率和效果。首先,以光源为视点逐切片绘制体数据的整个几何体切片的光照信息到光照衰减缓存。其次,在光线投射过程中,利用光照衰减缓存计算采样点的光照影响,包括体积阴影、软阴影及散射等效果计算。SBRC算法只需要一个绘制遍的时间开销,并且通过变化切片数量和每个切片的分辨率实现可扩展的绘制性能。实验表明,以上方法能够大幅提升体数据的绘制效率和效果,满足性能可扩展的体数据绘制要求。(2)大规模地形数据高效组织与绘制三维地理地形绘制主要包括地理数据组织和三维地形构建两个主要过程。为了使地形绘制发挥最佳性能,并且支持层次细节(Level of Detail,LOD)及Mipmap技术提升绘制性能,提出一种灵活的数字高程模型及数字正射影像经纬度范围一致的无缝划分策略,并对每一块地形瓦片采用分组、分段、四边形网格的组织方式,快速生成具有LOD高效调度的真实三维地形。实验表明,该方法能够快速构建性能可扩展的三维地形,减少绘制调用。(3)数据绘制中的反走样技术针对延迟着色阶段开启硬件反走样方法无法直接兼容的问题,提出子像素连续边界反走样(Sub-Pixel Reconstruction Continuous Edges,SRCE)方法。首先,开启多重采样反走样绘制场景到几何体缓存(Geometry Buffer,G-Buffer)。其次,在子像素上利用切比雪夫不等式通过概率统计检测边界像素,以及标识边界像素和普通像素减少着色线程一致性开销。再次,以#过滤方法从子像素上重构连续边界。最后,自适应着色边界像素进行反走样处理。SRCE方法使三维物体边缘的“阶梯”效应最小化,同时还可以结合后处理或时间反走样技术增强图形绘制效果。针对延迟着色技术与覆盖采样反走样(Coverage Sample Anti-Aliasing,CSAA)不兼容的问题,提出基于延迟着色技术的大场景反走样绘制架构。该架构能够针对不同绘制对象使用不同的反走样级别,减少延迟与卡顿,从而平衡效果与效率。实验表明,以上方法能够有效提高数据的绘制质量,同时平衡绘制性能。(4)大规模数据并行绘制虚拟化框架在主流并行绘制框架研究基础上,结合虚拟化技术设计了一种三维图形并行绘制虚拟化框架(Parallel Rendering Virtualized Framework,PRVF),提高体绘制、面绘制及反走样技术在大规模数据上的算力结构并行绘制能力。以Equalizer作为并行绘制中间件,灵活组织并行绘制各功能模块,虚拟化各类绘制资源作为绘制单元,按需调度及管理。综上所述,本文研究体数据及地理地形数据在实时绘制方面的一系列关键技术问题,充分提高真实与实时绘制能力,通过从数据、算法和算力结构等并行层面有效提升大规模数据绘制的实用性。
殷泽坤[3](2020)在《大规模超长生物序列聚类分析》文中指出新测序技术的数据产生能力已经超越着名的摩尔定律,当前基因组数据正以12-18个月10倍以上的速度增长。数据处理所耗费的时间、人力与经济开销在整个测序流程中所占的比重越来越大。我国十三五期间将对150万人进行基因组测序,每个人将产生300-500GB的数据,基因数据总量在十三五末期将达到EB级别。而对于宏基因组学,仅1克土壤样品的宏基因组测序就可以产生50TB的原始数据。如何高效处理超大规模生物序列数据是高性能处理生物信息分析必须面对的课题。生物序列聚类分析是生物信息学和现代生命科学研究中一个基本且重要的问题,在冗余去除、序列分类和物种分析等方面具有重要意义。本文的研究内容是超大规模生物数据的聚类以及如何利用高性能计算技术来加速聚类的过程,本文主要解决了四个方面的挑战:一、超大规模生物序列数据的I/O问题:在超大规模序列数据聚类分析中本文面临的首要问题是如何高效解析规模如此之大的生物序列数据,这是后续序列数据处理和分析的前提。为此本文提出了一个专门用于生物序列数据处理的高性能I/O框架。本文充分利用了 FASTA以及FASTQ格式的特性,设计并开发了一套面向多核平台的、支持轻量级格式化的I/O框架,消除了大规模生物序列处理中 I/O性能瓶颈,并且该框架已经应用于本文开发的高性能序列相似度计算软件RabbitMash中。该框架的提出为后续的序列聚类分析奠定了基础。另外本文还将该框架推广应用于I/O密集的测序数据质量控制软件RabbitQC中,得益于这个高效率的I/O框架,RabbitQC取得了较大性能提升。二、超大规模以及超长生物序列的相似度计算问题:如何度量序列之间的相似度是生物数据聚类分析中的核心问题。在超大规模以及超长序列相似度计算方面,本文介绍了一个面向多核计算平台的高性能序列相似度分析软件RabbitMash。RabbitMash采用了最小哈希(MinHash)算法并且使用Jaccard Index来评估基因组或者序列之间的相似度。MinHash算法的复杂度远远低于基于动态规划的比对算法以及非基于比对的kmer方法,该算法是处理超大规模数据以及超长序列的一种行之有效的手段。在算法实现上,RabbitMash充分利用了现代高性能多核计算平台上的快速存储设备以及具备强大计算能力的向量处理单元。在单个计算节点上,RabbitiMash成功地将1.1TB生物序列的距离矩阵计算时间缩短到5分钟,相对于其它基于比对的计算方法,RabbitMash的性能提升可以达到2-3个数量级。在RabbitMash的基础上,本文继续开发了RabbitSketch 软件库。除 MinHash 算法外,RabbitSketch 中还支持 HistoSketch、OrderMinHash 以及 HyperLogLog 等一系列 sketch 算法,RabbitSketch 是后续聚类工作中相似度计算的核心。同时本文将RabbitSketch封装为一个独立的软件库提供给其他科研人员使用,并且针对不同的用户群体提供了 C++和Python两种语言的API。三、层次聚类在大规模生物序列数据处理上的拓展性问题:为了解决层次聚类算法的数据拓展性问题,本文实现了一种支持超长序列的、基于稀疏距离矩阵的层次聚类方法,该方法使用RabbitMash计算稀疏距离矩阵,然后将这个稀疏矩阵按距离从小到大的顺序排序,最后使用hcluster算法对已排序的稀疏矩阵进行聚类。这个方法中除了计算稀疏距离矩阵之外另一个性能热点就是稀疏矩阵的排序操作。针对这个比较耗时的排序操作本文提出了一个基于归并排序和排序网络的混合并行排序算法,并介绍了其在多核和众核平台上的优化实现。四、贪心增量聚类算法在分布式环境下的拓展性问题:本文还介绍了一个面向分布式环境下的贪心增量聚类框架,该框架将贪心增量聚类方法拓展到了集群环境上,打破了单节点计算资源不足对聚类分析数据规模的限制。该框架采用了“MPI+Pthread”的混合并行编程模型,并且使用计算通信掩盖的技术来降低节点间通信带来的额外开销。最终,该框架能够充分利用分布式计算集群对更大规模的生物序列数据进行聚类分析。拓展性测试表明该框架在200个CPU核心的分布式测试环境下取得了接近线性的拓展性。综合上述的研究内容以及所取得成果,本文中所提出的方法在现代多核与众核平台以及分布式集群平台上基本完成了超大规模生物序列数据的聚类分析工作,可以在可控时间内完成对TB级数据的聚类分析工作。另外,本文所述的工作成功地将高性能计算的相关技术应用于超大规模生物序列分析中,并且将其中通用的方法封装为相应的软件包和软件库。本文已经将高性能I/O框架RabbitIO、高性能测序数据质控软件RabbitQC、高效基因组分析软件RabbitMash、高性软件库RabbitSketch以及分布式贪心增量聚类框架DGCF发布到开源软件平台Github和Bitbucket上,这些高性能软件能够极大提高相关数据分析工作的效率。
吴挺[4](2020)在《面向非易失性内存的文件系统优化与共享文件系统研究》文中研究说明随着社会数字化、网络化、智能化的快速发展,以云计算、大数据、物联网为代表的新一代信息技术向计算机系统提出了新的需求,包括亟需对大量数据以及中间数据进行高效地计算和存储。然而,传统面向块设备的存储系统由于存储设备效率低、存储层次多不能有效满足日益增长的存储需求。近年来快速发展的新型非易失性内存具有存储密度高、访问延迟低、可按字节寻址、数据掉电不丢失等优点,构建面向非易失性内存的存储系统成为提升数据存取效率的有效方法。新的非易失性内存存储介质的引入对存储结构带来新的挑战,当前的系统软件和应用程序需要调整或重新设计以适应新介质的特征。为此,本文从内存文件系统多粒度空间管理机制、面向NUMA架构的内存文件系统与虚拟机间的共享内存文件系统出发,研究面向新型非易失性内存的文件系统优化和共享文件系统。相对之前的研究工作,本研究致力于利用新型非易失性内存的优势提升存储系统的性能。本文主要研究内容如下:1内存文件系统多粒度空间管理机制研究。随着接近DRAM速度的NVM和硬件加速在内存文件系统中的应用,写操作流程中重复地调用分配例程,申请空闲数据块、构建文件映射表,对写请求的性能影响越来越凸显。对此,设计了内存文件系统多粒度空间管理机制,提供以文件映射表构建的多粒度结构化大块,通过分配大粒度的块来减少对分配例程的调用次数,促进写操作的性能。针对不同模式的写操作提出了对应的空间分配算法以有效利用结构化大块。2面向NUMA架构的内存文件系统研究。由快速总线连接的节点组成的NUMA架构计算机具有非一致的内存访问延迟和带宽,现有的内存文件系统由于其文件系统布局、物理空间管理、文件访问操作没有考虑NUMA架构的特性,在NUMA架构计算机中存在访问文件性能差异大、节点间文件请求负载不均衡等问题。对此,设计一个高效的面向NUMA架构的内存文件系统,根据NUMA节点设计分布式内存文件系统布局,每个节点管理部分元数据和文件数据,以平衡各个节点上的文件请求负载。基于分布式文件系统布局,提出面向节点的文件创建方法、面向文件的线程绑定方法及用户缓冲区分配方法,优化访问文件的性能。3面向同驻虚拟机的高效共享内存文件系统研究。针对同驻一台物理机上的多个虚拟机,共享文件系统是提高文件传输性能的有效途径。新型非易失性内存可作为高性能共享文件系统的存储设备。现有的共享文件系统的设计是基于虚拟I/O或网络通信,未考虑新型非易失性内存的优良特性,不能充分发挥其性能优势。为此,提出一个新型共享内存文件系统设计,在虚拟机之间、虚拟机与宿主机之间提供高效的文件共享机制。在该设计中,共享文件系统被安装在虚拟机与宿主机共享的非易失性内存中,通过共享的页表组织共享文件的数据页。共享文件系统使用虚拟地址空间和处理器中既有的硬件MMU直接访问共享文件,减少文件访问I/O的软件层次和数据拷贝产生的性能开销。此外,对共享数据的并发访问和一致性提供高效的同步机制。本文进一步通过实验对所提出的空间管理机制和文件系统进行了验证。实验结果表明上述技术能够有效地促进文件访问的性能,为上层应用提供有效的数据存储和处理服务。本文充分利用新型非易失性内存的优良特征,开展了内存文件系统性能优化及共享内存文件系统的研究,能够较好地应对即将到来的新型存储时代,促进云计算与大数据领域的发展。
陈垚臻[5](2020)在《振动台电源监控系统软件的设计与实现》文中研究说明随着产品可靠性要求的提高,振动试验的应用越来越广泛。振动台作为可靠性测试的重要设备,对其进行状态监控是保证测试正常进行的必要手段。目前,大多数振动台电源监控系统采用PLC控制箱作为监控单元,设备成本高、功耗大、集成度低、人机交互性偏差;另外,对于数据的管理依赖PC机实现。针对以上不足,本文采用基于ARM平台的嵌入式Linux系统,在Qt系统软件开发环境下,设计了一种既能实现对振动台电源运行数据实时监测和管理,又能够对其运行进行控制的监控系统软件,来满足工业现场应用需求;并在此基础上开发远程监控软件,实现远程监控功能。本文主要研究内容如下:首先,对国内外振动台监控系统研究现状进行分析,并结合实际需求,给出基于ARM的振动台电源监控系统解决方案,在此基础上设计监控系统软件整体架构,并对本地与远程监控软件界面和通用功能进行设计实现。其次,根据设计方案开发本地监控软件。本地监控软件设计时采用模块化的思想,分别对各模块进行功能设计、软件编程和综合优化。数据通信模块主要通过对GPIO与CAN通信的开发完成对数据的传输;数据处理模块利用多线程数据处理方法提高程序的执行效率、利用卡尔曼滤波算法与校准方法解决数据采集过程中的噪声干扰与准确性问题;数据存储过程中,利用数据压缩方法解决数据存储量大的问题;最后通过内核的裁剪优化本地监控软件的运行环境。再次,在本地监控软件的基础上完成远程监控软件设计与实现。远程监控软件设计主要完成远程监控模块的开发、应用层协议的制定与实现、文件系统数据的同步。其中采用TCP、UDP通信相结合的方式提高数据传输效率;使用多端口通信机制实现不同类型数据的分类传输。最后,在实验室环境下搭建测试平台,对监控系统进行通信功能测试和软件主要功能测试,并在现场进行性能测试。结果表明监控系统界面显示良好,通信功能正常,运行稳定,能够实现对电源的运行控制、数据监视与管理、远程监控的功能,已达到最初的设计要求。本文运用内核配置与裁剪、数据交互与存储、多线程应用、数字滤波等技术,结合Qt可视化系统软件开发,实现振动台电源的监控系统。本设计有效提高了监控系统的集成度、人机交互性,提升了振动台电源监控的数字化水平,满足实际工程的应用需求。
付茜雯[6](2020)在《计算机科技论文摘要的机翻错误类型及译后编辑》文中认为科研论文在知识传播过程中作用重大,推动国际范围内的知识共享。摘要是科研论文中必不可少的一部分,既是对论文的概括性总结,也是读者发现和探寻相关领域知识的快捷途径。然而,目前英文摘要的机器翻译质量在精确性和专业性方面都不尽人意,需要通过后期编辑和人工校对才能产出高质量的中文翻译文本。本文以计算机科学论文摘要为例,对谷歌机器翻译的300篇计算机英文论文摘要的中文版本进行了翻译错误类型分析并归类,并提出相应的译后编辑策略。首先在赖斯文本类型理论翻译策略指导下,对机器翻译系统生成的译文进行译后编辑,再邀请计算机专业以及翻译专业的专业人士进行确认。之后以DQF-MQM错误类型分类框架为依据,对机器翻译系统生成的译文中的错误进行分类。研究发现,机器翻译的计算机英文论文摘要的中文版本中存在七大类翻译错误,其中不符合中文表达习惯的翻译错误占比最大,其次是术语误译、误译、欠译、漏译、过译以及赘译。本论文研究发现,由于源文本的信息型学术文本特征,长难句、被动语态以及术语翻译是造成机器翻译错误的主要原因。针对源文本的逻辑缜密、语步序固定等特征,本研究针对性地对各类错误类型提出了相应译后编辑策略。建议译者在译后编辑中通过将隐性连接转换为显性连接从而保持源文逻辑性,通过增加主语以及调整语序处理被动语态保持源文的学术精准,通过恰当选取词意处理半技术词汇等。本研究采用定性和定量分析方法,系统归类了计算机科技文本摘要中机器翻译出现的错误,并提出相应译后编辑策略,为该领域的译者提供参考建议,从而提高该领域的机器翻译质量。
欧小龙[7](2020)在《基于中间件的C-V2X车载单元消息分发机制研究与设计》文中指出随着C-V2X(Cellular-Vehicle-to-Everything)车联网技术的研究,C-V2X车载单元成为了车辆与其他设备或系统的主要通信设备。为了适应不同设备或系统对消息的不同要求,需要对车载单元的消息分发机制进行研究设计,以提高车载单元消息的分发效率和通信的可靠性。本文研究符合C-V2X通信环境要求的异构通信网络、中间件等关键技术,重点研究了车载系统的消息分发管理机制,设计了一种基于发布/订阅的并行化中间件软件架构。论文主要工作如下:1.C-V2X车载单元消息中间件设计与实现。本文设计并实现了一种适应车联网通信、支持并行化中间件架构,基于发布/订阅模型,并设计了线程池管理器对线程进行了有效分配和管理,为车联网应用提供良好的支持接口,增强了系统的并发通信能力,从而保障上层应用和底层通信模块间数据高效、可靠和有序的传递。2.C-V2X车载单元消息分发关键技术实现。针对周期性消息分发容易造成严重的网络负载问题,本文提出了基于模糊逻辑的自适应消息周期方法,并对消息优先级进行划分,使用基于优先级的消息调度策略,优先转发高优先级的消息,从而提高消息分发效率。3.在研发C-V2X车载单元通信中间件及消息分发的基础上,开发C-V2X通信应用实例对研究内容中的各个模块进行测试验证,结果表明,采用中间件的软件架构,使用自适应消息分发方法,有效解决了异构网络的通信自适应分发问题,屏蔽了不同网络间的通信异构性问题,提高了应用的可移植性和开发效率。
罗尧[8](2020)在《基于ARM的指针式仪表自动读数系统设计与实现》文中进行了进一步梳理随着现代工业的快速发展,工业仪表的应用越来越广泛,指针式仪表具有成本低、结构简单、抗干扰能力强等优点,因此在工业领域中被大量的使用,目前主要还是依靠人工对仪表进行读数与监测,人工读数存在效率低、出错率高等缺点,然而工业生产正朝着自动化、智能化的方向发展,仅仅依靠人工读数已经不能满足工业快速发展的需求。因此如何运用便捷化设备和相关的处理技术对指针式仪表进行自动读数成为了工业生产中迫切需要解决的难题。本系统结合嵌入式技术与图像处理技术实现指针式仪表的自动读数,选取符合系统性能需求的嵌入式ARM硬件平台,并在嵌入式平台上移植Linux操作系统,深入研究了指针式仪表图像预处理算法和示数判断算法,将仪表读数算法程序移植到嵌入式平台运行。本文主要对系统总体设计方案、指针式仪表自动读数算法、嵌入式读数终端和服务器端进行了研究,具体内容如下:1、分析工业领域中指针式仪表的实际使用环境,将系统分为嵌入式读数终端和服务器端。嵌入式读数终端采集现场仪表图像,利用图像处理算法对仪表图像进行处理,以实现指针式仪表的自动读数,并将仪表读数结果和现场视频图像传输至服务器端,服务器端实现视频监控、仪表异常读数报警、数据存储和命令控制等功能。2、首先将采集到的仪表图像进行增强降噪等预处理操作,使用自适应阈值法对仪表图像进行二值化处理,提取仪表图像前景像素区域,结合Hough圆变换和刻度线质心点拟合圆两种方式计算仪表特征区域圆心和半径,该算法具有更强的鲁棒性,其次利用二值图像轮廓法提取主刻度单个字符,并通过K最近邻(k NN,k-Nearest Neighbor)分类算法识别字符,获取字符的数值,根据字符的位置关系确定主刻度示数值和主刻度字符区域中心点坐标,完成最小值刻度线和最大值刻度线的数值匹配,使用累计概率霍夫变换定位仪表指针,最后通过角度法计算指针式仪表示数。3、嵌入式系统平台搭建,首先需要搭建嵌入式系统开发所需的交叉编译环境,移植引导程序u-boot,配置Linux内核主要的设备驱动,交叉编译Linux内核源码,制作根文件系统。为增强该读数系统的实用性,在系统中增加视频监控的功能,当嵌入式终端读数错误或仪表出现故障时能够实现远程监控,移植嵌入式系统下所需的Open CV视觉算法库和视频传输jrtplib库,生成在ARM平台所需的动态链接库,为读数终端应用程序提供运行环境,视频数据压缩采用硬件编码方式,需加载MFC硬件编码API函数源文件。4、服务器端是基于Qt界面程序设计,在Ubuntu16.04系统中编译jrtplib和FFmpeg源码库,搭建接收解码H.264视频流的开发环境,jrtplib库用于接收并解析RTP协议荷载的H.264视频流,通过FFmpeg解码H.264码流,在Qt界面显示解码之后的视频图像,服务器端使用TCP协议收发读数结果和配置命令等重要数据,同时也实现数据存储和仪表读数异常报警功能。通过本系统设计,可以实现指针式工业仪表远程自动读数、视频监控和数据存储等功能,在工业生产领域中意义重大。
唐玉华[9](2018)在《面向图搜索的并行计算机体系结构关键技术研究与实现》文中研究表明随着云计算、移动互联网和物联网等新一代信息技术的创新与普及,人类已经进入大数据时代,我国正在推进实施大数据国家战略。图搜索问题作为大数据应用的典型代表,已成为国际上测评面向大数据计算机能力Graph 500排名的标准测试。大数据应用与传统计算密集型应用存在显着不同,面向大数据应用特征的并行计算机系统结构研究仍处于起步阶段。本文结合国家自然基金重点项目“面向大数据的高时效并行计算机系统结构与技术”和高性能计算国家重点实验室项目“面向大数据处理的并行计算机系统关键技术”,面向图搜索大数据典型应用,针对大数据处理的并行计算机系统结构设计问题展开了系统的研究,包括并行计算机理、宏体系结构、微体系结构及并行计算机原型系统,主要工作与创新点如下:1.提出了面向图搜索的并行计算机性能量化模型(第二章)本文针对图搜索应用的数据驱动、全局同步、随机访问等特征,综合数据规模、并行度、存储访问、通信延迟等因素,采用理论分析与实验验证相结合的办法,建立了计算、访存和通信的综合量化性能模型,可为面向大数据的并行计算机系统设计提供有效指导。2.设计了面向图搜索的可扩展异构并行计算机体系结构(第三章)本文面向图搜索应用特征,设计了通用CPU结合基于FPGA流处理器的可扩展异构并行体系结构,节点内主机与流处理器通过PCIE总线连接,采用主从工作模式;节点间主机通过以太网实现控制连通,而流处理器之间则通过高速InfiniBand网络实现数据连接。设计了硬件支持全局编址的分布式共享存储访问、全局线程同步等技术,可有效缓解图搜索类大数据应用的随机访问和全局同步等问题。3.设计了面向图搜索的向量交叉多线程流处理器体系结构(第四章)本文面向图搜索应用特征,设计了面向图搜索的向量交叉多线程流处理器体系结构,提出了流处理执行机制及其指令集,建立了显式控制数据流动、捕获数据时空局部性的LRF-SRF-MEM三级存储框架,设计了基于5级流水线的向量交叉多线程流处理核,可有效加速图搜索类大数据应用的微处理器并行执行效率。4.设计实现了面向图搜索的流处理器芯片和异构并行计算机原型系统(第五章)本文基于Xilinx VC709开发板采用Verilog语言设计实现了流处理器原型,该原型拥有一个Virtex-7 XC7VX690T-2FFG1761CFPGA芯片,提供2片4GB的SODIMM内存条、8通道PCI-E接口,流处理加速器主频达200MHz;将该开发板与拥有通用微处理器芯片的主机相结合构成一个异构节点,并以此为基础构建了拥有8节点的异构并行计算机原型系统。实验结果验证了论文所提出宏、微体系结构及相关技术的有效性。
刘昊[10](2018)在《面向非易失性内存的系统软件若干问题的研究》文中研究指明随着大数据时代的来临和数据科学发展的不断深入,被采集,存储和处理的数据量急剧膨胀,传统计算机体系架构中以“计算为中心”的模式,难以应对数据规模与数据处理能力之间日益突出的矛盾,现存的计算机体系架构面临着严峻的挑战和生存瓶颈。近年来,随着新型非易失性内存介质技术的兴起,打破传统的体系架构,构建大容量,非易失,高可靠的内存系统,将数据大量或整体存放于内存中,形成以内存为主体的新型内存计算模式,从而完成计算模式从以“计算为中心”向以“数据为中心”的转变,成为学术界和工业界关注的热点。该技术减少了数据存储的软件层次,降低了数据访问的延迟,提升了数据处理的性能,具备相当的创新价值和市场价值,成为学术界和工业界关注的热点。其中,将非易失性内存引入计算机内存系统中,构建既有易失性内存又有非易失性内存的内存系统,又成为研究热点中的热点,吸引了大量的学术界研究者和行业翘楚的目光。本论文以非易失性内存为介质背景,基于异构混合内存体系架构,以存储类的系统软件为研究对象,主要探讨非易失性内存介质引入后对软件设计带来的影响与变化,提出在异构混合内存体系架构下,存储类软件设计面临的挑战和解决方法,选取了具有代表性的存储类系统软件,文件系统和键值对数据库系统,详细阐述基于非易失性内存环境下文件系统以及键值对系统的设计原理,实现方法,数据一致性保障机制,实验验证等方面的问题。在文件系统层面,针对文件系统的数据一致性问题,对文件系统的数据一致性给出了层次划分,并针对较高层级的版本数据一致性给出了一种新型的多版本一致性保障机制,论证了该多版本一致性机制的有效性和正确性。针对非易失性内存有限的访问寿命,文件系统采用了日志型的数据更新方式,尽量保证对底层非易失性内存介质的均匀访问,提升系统的耐久性和非易失性介质的使用寿命,并通过实验的方法验证了日志型文件系统设计方法对非易失性内存介质的访问均衡的改善效果。在键值对系统层面,针对现有键值对系统在整个系统中所占据的位置和作用,提出不依靠文件系统直接将键值对存储在非易失性内存的存储方法,减少了存储软件栈的层级,降低了系统数据持久化的代价。同时,基于散列表为主要存储数据结构,分别在传统内存DRAM和新型非易失性内存NVM中上使用静态散列表和动态散列表,该设计有效地取得了系统性能和内存使用效率的平衡,解决了数据量不固定的前提下,散列表容量难以固定初始化的问题,大大提升了系统的可移植性和普适性。本文以非易失性内存为主要介质背景,以存储类系统软件为主要研究对象,以文件系统和键值对存储系统为具体研究对象,提出了基于非易失性内存环境下,存储类系统软件的设计和实现方法,并讨论了数据一致性保障机制的实现方法,提出了一种新型的,有效的数据一致性保障机制。本论文的主要工作及创新如下:1.设计并实现了一个异构混合内存文件系统HMFS,该文件系统基于异构混合内存体系架构,以非易失性内存为主要存储介质,具备多版本控制和版本一致性保障机制,实现了文件系统中较高级别的一致性保障层级,文件系统中对文件系统元数据和数据采用不同的更新方式,对于文件系统数据采用原地更新方式,并缓存一部分在DRAM中,以提高数据查找的速度,对于文件系统数据采用日志型的更新方式,以实现对内存介质的尽量均匀访问,增长NVM介质的使用寿命。该文件系统提出了一种基于图的多版本控制数据结构,并给出一系列的的多版本操作相关算法设计,该设计打破了传统基于树结构的多版本实现方法,提升了版本生成,删除和获取的性能,降低了文件系统元数据的体量大小,设计并实施了全面的实验方案,从性能,多版本有效性以及介质耐久性等多个方面评测了文件系统性能,多版本有效性和对底层非易失性内存介质的访问均衡。2.设计并实现了一套文件系统多版本实现机制,该机制以一种新型的支持多版本功能的数据结构和一套完整的版本控制算法组成,实现了版本控制的基本功能,如创建、读取、删除等,并实现了完全的多版本功能,即可基于已存于系统中的任一版本进行版本演化,子版本与父版本之间无严格的生成时间先后顺序限制,并可以基于多个版本进行版本合并等,该多版本控制机制有效地提升了版本生成,读取和删除的性能,并实现了空间利用效率的提升。该多版本机制同时支持逆向查找功能,可以确定同一个文件属于哪些版本,并可以列出文件及所属版本的信息,该多版本控制机制有别于现存的多版本控制机制,全面支持多版本功能的所有操作,并降低了维护多版本所需的元数据量,在提升性能的同时取得了良好的空间利用效率。3.设计并实现了一个异构混合内存键值对系统LibreKV,该键值对系统基于异构混合内存体系架构,以非易失性内存为主要存储介质,使用静态散列表和动态散列表相结合的设计方法,实现系统性能和内存使用效率的平衡,提出一套动态扩展机制,实现散列表大小的动态扩展和内存的按需分配。利用传统内存的高性能特点,在DRAM中对键值对的读写请求进行快速响应,利用新型非易失性内存容量大,存储密度高的特点,完成对键值对的持久存储,并在DRAM和NVM中使用不同的散列表结构,DRAM中使用静态散列表结构,在静态散列表中使用布谷鸟散列算法,该方法可快速接收来自客户端的读写请求,并使静态散列表到达较高的使用效率。在NVM中,使用动态散列表和动态扩展算法,以实现散列表规模随实际数据量大小而动态改变的功能,提高了系统的自适应性和可扩展性。同时,针对键值对系统数据吞吐率高,对数据响应速度要求较高的特点,在数据一致性保障方面,摒弃了传统的使用高代价的硬件原语来保证内存写顺序的方法,采用了基于键值对校验和和合并检查点的一致性保障机制,该机制有效地结合了动态散列表和检查点机制的特性,有效降低了系统恢复时所需要检验的键值对个数,避免了因维护一致性而导致的过大的系统开销,提升了系统性能。4.提出一种基于校验和检查点技术的数据一致性保障机制,并将其应用于异构混合内存键值对系统LibreKV中,结合基于动态散列表的检查点机制,实现键值对系统数据一致性的保障,该一致性保障机制,避免了使用硬件原语保证写顺序来维护一致性的开销,降低了系统开销,提升了系统性能。该一致性保障机制可以充分利用键值对系统计算键值散列值的特性,利用简单的算法计算键值对散列值,并将散列值作为元数据一部分进行存储,作为发生系统异常和一致性检验时的依据。该方法非常适用于单个数据体量不太大的键值对存储系统,具有良好的应用系统场景,适应了系统的设计需求,完成了系统的基本要求,为在非易失性内存中设计有效的数据一致性保障机制维护数据的最终一致性并完成键值对在非易失性内存介质上的持久存储提供了一种参考方案。
二、多线程文件传输的实现方法及其性能的研究(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、多线程文件传输的实现方法及其性能的研究(论文提纲范文)
(1)基于ZooKeeper和Netty的分布式文件传输系统的设计与实现(论文提纲范文)
摘要 |
Abstract |
第1章 绪论 |
1.1 研究背景 |
1.2 研究意义 |
1.3 国内外研究现状 |
1.4 论文的主要研究内容 |
1.5 论文组织架构 |
第2章 相关技术介绍 |
2.1 分布式网络 |
2.1.1 分布式网络的优点 |
2.1.2 常见的分布式网络结构 |
2.2 ZooKeeper |
2.2.1 ZooKeeper简介 |
2.2.2 ZooKeeper数据模型 |
2.2.3 ZooKeeper的 Watch机制 |
2.2.4 ZooKeeper的一致性保障 |
2.3 Netty框架 |
2.3.1 Netty简介 |
2.3.2 Netty线程模型 |
2.3.3 Netty编解码器 |
2.4 Redis |
2.5 Kafka |
2.6 本章小结 |
第3章 文件传输系统的需求分析与整体设计 |
3.1 系统需求分析 |
3.1.1 整体需求分析 |
3.1.2 功能需求 |
3.1.3 非功能需求 |
3.2 系统整体设计 |
3.3 基础传输节点设计 |
3.4 管理控制中心设计 |
3.5 系统运行流程 |
3.6 本章小结 |
第4章 文件传输系统的详细设计与实现 |
4.1 路由模块 |
4.1.1 ZooKeeper操作 |
4.1.2 节点路由图 |
4.1.3 路由链路计算 |
4.2 任务模块 |
4.2.1 任务生成 |
4.2.2 任务记录 |
4.2.3 任务重传 |
4.2.4 任务控制 |
4.3 传输模块 |
4.3.1 编解码器 |
4.3.2 断点续传 |
4.3.3 分片传输 |
4.3.4 加密传输 |
4.3.5 文件完整性校验 |
4.3.6 文件中转 |
4.3.7 文件传输流程 |
4.4 HTTP模块 |
4.5 管理控制中心 |
4.6 本章小结 |
第5章 系统测试 |
5.1 测试环境 |
5.2 系统功能测试 |
5.3 文件传输功能测试 |
5.3.1 任务恢复测试 |
5.3.2 断点续传和失败重传测试 |
5.3.3 多文件传输测试 |
5.3.4 大文件传输测试 |
5.4 文件传输性能测试 |
5.5 本章小结 |
第6章 总结与展望 |
6.1 总结 |
6.2 展望 |
参考文献 |
作者简历 |
致谢 |
(2)大规模数据实时绘制关键技术研究(论文提纲范文)
摘要 |
Abstract |
第1章 绪论 |
1.1 背景与意义 |
1.2 研究现状 |
1.2.1 体数据绘制 |
1.2.2 大规模地理地形绘制 |
1.2.3 反走样技术 |
1.2.4 GPU绘制 |
1.2.5 并行绘制 |
1.3 本文工作 |
1.4章节安排 |
第2章 性能挑战与评价方法 |
2.1 引言 |
2.2 性能瓶颈分析 |
2.2.1 多线程绘制 |
2.2.2 绘制瓶颈 |
2.2.3 数据规模 |
2.3 并行绘制性能 |
2.3.1 负载平衡 |
2.3.2 图像合成 |
2.3.3 图像解压缩 |
2.4 评价方法 |
2.4.1 时间复杂度 |
2.4.2 并行粒度 |
2.4.3 空间复杂度 |
2.4.4 绘制质量 |
2.5 本章小结 |
第3章 数据并行化体绘制及光照计算 |
3.1 引言 |
3.2 体绘制 |
3.2.1 体数据 |
3.2.2 体绘制方程 |
3.2.3 体绘制方法 |
3.3 体数据光照计算 |
3.3.1 体绘制全局光照 |
3.3.2 单绘制遍多切片MSPP算法 |
3.3.3 基于切片的光线投射SBRC算法 |
3.4 体绘制并行化 |
3.5 本章小结 |
第4章 大规模地形数据高效组织与绘制 |
4.1 引言 |
4.2 大规模地理地形数据 |
4.2.1 数字高程模型 |
4.2.2 数字正射影像 |
4.3 可伸缩三维地理地形绘制 |
4.3.1 算法概述 |
4.3.2 关键步骤及实现 |
4.3.3 实验结果与分析 |
4.4 本章小结 |
第5章 数据绘制中的反走样技术 |
5.1 引言 |
5.2 反走样方法 |
5.2.1 走样原因 |
5.2.2 反走样基本思路 |
5.2.3 主流反走样方法 |
5.3 子像素连续边界反走样SRCE算法 |
5.3.1 算法概述 |
5.3.2 关键步骤及实现 |
5.3.3 实验结果与分析 |
5.4 一种大场景反走样绘制架构 |
5.4.1 算法概述 |
5.4.2 关键步骤及实现 |
5.4.3 实验结果与分析 |
5.5 本章小结 |
第6章 大规模数据并行绘制虚拟化框架 |
6.1 引言 |
6.2 并行绘制 |
6.2.1 体系结构 |
6.2.2 数据与绘制资源 |
6.2.3 并行绘制框架 |
6.3 PRVF框架结构 |
6.3.1 绘制资源层 |
6.3.2 并行绘制虚拟化层 |
6.3.3 应用层 |
6.3.4 实验结果与分析 |
6.4 本章小结 |
第7章 总结与展望 |
7.1 工作总结 |
7.2 未来展望 |
参考文献 |
在读期间科研成果 |
致谢 |
(3)大规模超长生物序列聚类分析(论文提纲范文)
摘要 |
ABSTRACT |
第1章 绪论 |
1.1 研究背景及意义 |
1.2 研究现状与挑战 |
1.3 本文研究内容与创新点 |
1.4 本文组织结构和章节安排 |
第2章 背景 |
2.1 常见生物序列文件格式 |
2.2 生物序列的相似度计算 |
2.2.1 序列相似度计算简史 |
2.2.2 基于sketch的序列相似度分析方法 |
2.3 高性能计算机的体系结构 |
2.3.1 向量处理单元 |
2.3.2 Xeon Phi |
2.4 并行计算语言 |
2.4.1 POSIX线程与OpenMP |
2.4.2 消息传递接口(MPI) |
2.4.3 SIMD扩展指令集 |
2.5 本章小结 |
第3章 针对生物序列数据的通用高性能I/O框架 |
3.1 高性能生物序列I/O框架的设计与实现 |
3.1.1 基于生产者-消费者模型的I/O框架 |
3.1.2 FASTQ格式的文件解析 |
3.1.3 FASTA格式的文件解析 |
3.1.4 压缩数据的处理 |
3.2 基于高性能I/O框架的案例研究 |
3.2.1 测序数据质量控制软件RabbitQC简介 |
3.2.2 性能测试 |
3.2.3 质控结果的可视化 |
3.3 本章小结 |
第4章 面向现代多核架构的高性能序列相似度算法 |
4.1 RabbitMash:一个面向多核处理器的基于MinHash算法的基因组分析软件包 |
4.1.1 在多核平台上的优化 |
4.1.2 测试平台及数据 |
4.1.3 性能测试结果 |
4.2 RabbitSketch:基于sketch方法的高效生物序列相似度分析软件库 |
4.2.1 RabbitSketch的实现以及其特性 |
4.2.2 性能测试 |
4.3 本章小结 |
第5章 多核以及集群平台上的大规模超长生物序列聚类方法 |
5.1 基于层次聚类和最小哈希算法的大规模基因组数据聚类分析方法 |
5.1.1 一种面向现代体系架构的向量化排序方法 |
5.1.1.1 并行排序算法简介 |
5.1.1.2 算法实现 |
5.1.1.3 排序性能测试 |
5.1.2 hcluster层次聚类算法 |
5.1.3 大规模数据下的性能测试 |
5.2 一个面向大规模生物数据的分布式贪心增量聚类框架 |
5.2.1 基于MPI+Pthread实现的分布式贪心聚类框架 |
5.2.2 性能测试 |
5.3 本章小结 |
第6章 总结与展望 |
6.1 总结 |
6.2 展望 |
参考文献 |
致谢 |
攻读学位期间发表的学术论文目录 |
攻读学位期间参与科研项目情况 |
攻读学位期间获得的奖励 |
相关的开源项目 |
学位论文评阅及答辩情况表 |
(4)面向非易失性内存的文件系统优化与共享文件系统研究(论文提纲范文)
摘要 |
Abstract |
1 绪论 |
1.1 引言 |
1.2 研究背景及国内外研究现状 |
1.2.1 研究背景 |
1.2.2 多粒度空间管理机制的研究现状分析 |
1.2.3 面向NUMA架构文件系统的研究现状分析 |
1.2.4 同驻虚拟机间共享文件系统的研究现状分析 |
1.3 研究目的与研究内容 |
1.3.1 内存文件系统多粒度空间管理机制 |
1.3.2 面向NUMA架构的高效内存文件系统 |
1.3.3 面向同驻虚拟机的高效共享内存文件系统 |
1.4 论文的主要贡献 |
1.4.1 内存文件系统多粒度空间管理机制研究 |
1.4.2 面向NUMA架构的高效内存文件系统研究 |
1.4.3 面向同驻虚拟机的高效共享内存文件系统研究 |
1.5 论文组织结构 |
2 内存文件系统多粒度空间管理机制研究 |
2.1 引言 |
2.2 研究动机 |
2.2.1 写操作空间分配流程 |
2.2.2 空间分配开销 |
2.3 多粒度结构化块空间管理机制 |
2.3.1 设计准则 |
2.3.2 多粒度结构化块空间管理机制MSMS |
2.3.3 开销分析 |
2.4 基于MSMS的空间分配 |
2.4.1 追加写空间分配 |
2.4.2 就地写与部分追加写空间分配 |
2.5 实验及分析 |
2.5.1 实验配置 |
2.5.2 写性能评估 |
2.5.3 初始化开销评估 |
2.6 本章小结 |
3 面向NUMA架构的高效内存文件系统研究 |
3.1 引言 |
3.2 研究动机 |
3.2.1 文件访问的性能差异 |
3.2.2 文件系统性能的降低 |
3.3 面向NUMA架构的内存文件系统Hydra FS |
3.3.1 设计准则 |
3.3.2 分布式文件系统布局 |
3.3.3 文件创建的节点选择策略 |
3.3.4 文件访问的线程调度策略 |
3.3.5 用户态缓冲区的分配接口 |
3.3.6 性能开销的分析 |
3.3.7 文件系统操作 |
3.4 实验及分析 |
3.4.1 实验配置 |
3.4.2 不同文件系统布局的性能评估 |
3.4.3 调度线程访问文件的性能评估 |
3.4.4 整体性能评估 |
3.4.5 文件系统利用率对性能的影响 |
3.4.6 文件系统大小对性能的影响 |
3.4.7 应用实例的性能 |
3.5 本章小结 |
4 面向同驻虚拟机的高效共享内存文件系统研究 |
4.1 引言 |
4.2 研究动机 |
4.3 共享内存文件系统Stargate FS |
4.3.1 设计准则 |
4.3.2 总体架构 |
4.3.3 虚拟机间内存共享 |
4.3.4 虚拟机间文件共享 |
4.3.5 预留虚拟地址空间管理 |
4.3.6 元数据同步 |
4.3.7 文件系统的实现 |
4.3.8 性能分析 |
4.3.9 文件系统和文件操作 |
4.4 共享内存信号量 |
4.5 实验及分析 |
4.5.1 实验配置 |
4.5.2 读写性能评估 |
4.5.3 共享信号量的性能评估 |
4.6 本章小结 |
5 总结与展望 |
参考文献 |
附录 |
A.攻读学位期间发表的论文目录 |
B.攻读学位期间取得的科研成果目录 |
C.攻读学位期间参加的科研项目目录 |
D.学位论文数据集 |
致谢 |
(5)振动台电源监控系统软件的设计与实现(论文提纲范文)
致谢 |
摘要 |
ABSTRACT |
1 绪论 |
1.1 课题研究背景及意义 |
1.2 国内外研究现状 |
1.3 关键技术概述 |
1.4 论文的主要研究内容 |
2 振动台电源监控软件总体设计 |
2.1 振动台电源监控系统概述 |
2.2 振动台电源监控软件运行环境设计 |
2.2.1 硬件平台设计 |
2.2.2 软件平台设计 |
2.3 振动台电源监控软件整体功能设计 |
2.4 显示界面设计与通用功能的实现 |
2.4.1 界面设计准则与总体结构 |
2.4.2 主界面设计 |
2.4.3 分柜信息界面设计 |
2.4.4 状态记录界面设计 |
2.4.5 设置选择界面设计 |
2.4.6 主柜开关量界面设计 |
2.4.7 辅助功能的实现 |
2.5 本章小结 |
3 振动台电源本地监控软件的设计与实现 |
3.1 本地监控软件设计方案 |
3.2 主控内部数据采集模块设计 |
3.2.1 内核中GPIO模块的开发 |
3.2.2 GPIO驱动程序的开发 |
3.2.3 接口控制策略 |
3.2.4 数据收发的实现 |
3.3 基于CAN总线的大量数据传输管理机制 |
3.3.1 CAN应用层通信协议的制定 |
3.3.2 数据最佳传输周期的计算 |
3.3.3 主/模控CAN通信的实现 |
3.4 数据处理模块设计 |
3.4.1 基于多线程的数据处理方法 |
3.4.2 卡尔曼滤波算法的应用 |
3.4.3 校准功能设计 |
3.5 数据存储与压缩功能设计 |
3.5.1 数据存储功能设计 |
3.5.2 数据压缩功能设计 |
3.6 功放流程的实现 |
3.7 本地监控软件运行环境的完善与优化 |
3.7.1 根文件系统配置 |
3.7.2 内核的裁剪 |
3.8 本章小结 |
4 振动台电源远程监控软件的设计与实现 |
4.1 远程监控软件设计方案 |
4.2 网络通信模块设计 |
4.2.1 基于TCP/IP协议的通信模块设计 |
4.2.2 多端口通信的设计与实现 |
4.3 远程监控模块设计 |
4.3.1 应用层传输协议的制定 |
4.3.2 远程监控功能的实现 |
4.4 文件系统数据的同步 |
4.5 本章小结 |
5 整体功能测试与试验验证 |
5.1 监控系统测试平台的搭建 |
5.2 通信功能测试 |
5.2.1 GPIO通信功能测试 |
5.2.2 CAN通信功能测试 |
5.2.3 网络通信功能测试 |
5.3 监控软件功能测试 |
5.3.1 本地监控软件功能测试 |
5.3.2 远程监控软件功能测试 |
5.4 监控系统性能及稳定性测试 |
5.5 本章小结 |
6 总结与展望 |
6.1 论文工作总结 |
6.2 问题与展望 |
参考文献 |
作者简介 |
学位论文数据集 |
(6)计算机科技论文摘要的机翻错误类型及译后编辑(论文提纲范文)
摘要 |
Abstract |
CHAPTER1 INTRODUCTION |
1.1 Research Background and Significance |
1.2 Aims of the Study |
1.3 Organization of the Thesis |
CHAPTER2 LITERATURE REVIEW AND FRAMEWORK |
2.1 Overview on Machine Translation and Post-editing |
2.2 Previous Studies on MT Error Types and Post-Editing Strategies |
2.3 DQF-MQM Error Classification Framework |
2.4 Previous Studies on MT Error Types of Paper Abstracts |
2.5 Text Typology Theory |
2.5.1 Text Typology Theory of Reiss |
2.5.2 Previous Studies on Informative Texts and Translation Principles |
CHAPTER3 METHODOLOGY |
3.1 Source Text and Text Analysis |
3.1.1 Source Text |
3.1.2 Text Analysis |
3.2 Research Method |
3.3 Translation Process |
3.3.1 Translating300 computer science abstracts with MT system |
3.3.2 Post-editing the MT-generated translation based on Text Typology Theory |
3.3.3 Conducting a semi-structured interview for ensuring post-editing quality |
3.3.4 Analyzing and summarizing the errors in300 abstracts |
3.3.5 Preliminary error classifications based on DQF-MQM Framework |
3.3.6 Conducting the2nd semi-structured interview to confirm error classifications |
3.3.7 Quantitative analysis of all MT errors in the300 abstracts |
CHAPTER4 RESULTS AND DISCUSSION |
4.1 Error Types of Machine Translated English Abstracts |
4.1.1 Unidiomatic Translation Errors in MT output |
4.1.2 Terminology Mistranslation Errors in MT Output |
4.1.3 Mistranslation Errors in MT Output |
4.1.4 Under-translation Errors in MT Output |
4.1.5 Omission Translation Errors in MT Output |
4.1.6 Over-translation Errors in MT Output |
4.1.7 Errors of Addition in MT Output |
4.2 Post-editing Strategies for Machine Translated Abstracts |
4.2.1 Post-editing Strategies for Long and Complex Sentences |
4.2.2 Post-editing Strategies for Passive Voice Sentences |
4.2.3 Post-editing Strategies for Technical Terms |
CHAPTER5 CONCLUSION |
5.1 Major Findings |
5.2 Limitations and Suggestions |
References |
Appendix Source Texts and Target Texts of300 Abstracts |
1-20 Abstracts |
21-40 Abstracts |
41-60 Abstracts |
61-80 Abstracts |
81-100 Abstracts |
101-120 Abstracts |
121-140 Abstracts |
141-160 Abstracts |
161-180 Abstracts |
181-200 Abstracts |
201-220 Abstracts |
221-240 Abstracts |
241-260 Abstracts |
261-280 Abstracts |
281-300 Abstracts |
ACKNOWLEDGEMENTS |
(7)基于中间件的C-V2X车载单元消息分发机制研究与设计(论文提纲范文)
摘要 |
abstract |
注释表 |
第1章 绪论 |
1.1 研究背景及意义 |
1.2 国内外研究现状 |
1.2.1 V2X车联网研究现状 |
1.2.2 嵌入式中间件的研究现状 |
1.2.3 面向车联网应用的V2X消息研究现状 |
1.3 论文主要工作 |
1.4 论文组织架构 |
第2章 OBU系统架构设计 |
2.1 OBU网络架构分析 |
2.2 OBU消息通信特征与需求分析 |
2.2.1 OBU消息特征与性能要求分析 |
2.2.2 OBU中间件需求分析 |
2.3 OBU系统架构设计 |
2.3.1 人机交互层 |
2.3.2 中间件层 |
2.3.3 Linux系统层 |
2.3.4 硬件设备层 |
2.4 本章小结 |
第3章 基于并行化的消息中间件设计与实现 |
3.1 中间件组件总线实现 |
3.1.1 组件总线实现 |
3.1.2 组件总线的组件表设计 |
3.2 消息代理实现 |
3.2.1 消息格式设计 |
3.2.2 发布/订阅实现 |
3.3 异构通信网络管理实现 |
3.3.1 消息格式转换实现 |
3.3.2 消息事件监听实现 |
3.3.3 通信接口选择实现 |
3.4 中间件并行化实现 |
3.4.1 Open MP并行实现 |
3.4.2 线程池实现 |
3.4.3 POSIX多线程管理器的实现 |
3.5 本章小结 |
第4章 消息分发关键技术实现 |
4.1 基于模糊逻辑的自适应消息周期方法 |
4.1.1 模糊逻辑理论 |
4.1.2 通信场景及问题分析 |
4.1.3 自适应消息周期实现 |
4.2 基于优先级的消息调度策略 |
4.2.1 消息优先级划分 |
4.2.2 优先级调度策略 |
4.3 基于优先级和自适应周期的消息分发数据流 |
4.3.1 消息接收数据流 |
4.3.2 消息发送数据流 |
4.4 典型OBU安全应用设计 |
4.4.1 前向/后向碰撞预警应用设计 |
4.4.2 道路危险状况应用设计 |
4.5 本章小结 |
第5章 测试与验证 |
5.1 测试环境 |
5.1.1 软硬件环境介绍 |
5.1.2 仿真环境介绍 |
5.1.3 仿真环境搭建 |
5.2 中间件功能测试与性能分析 |
5.2.1 中间件功能测试 |
5.2.2 中间件性能分析 |
5.3 消息分发功能测试与性能分析 |
5.3.1 消息分发功能测试 |
5.3.2 消息分发关键技术性能分析 |
5.3.3 消息分发综合性能分析 |
5.4 本章小结 |
第6章 总结与展望 |
6.1 全文总结 |
6.2 展望 |
参考文献 |
致谢 |
攻读硕士学位期间从事的科研工作及取得的成果 |
(8)基于ARM的指针式仪表自动读数系统设计与实现(论文提纲范文)
摘要 |
Abstract |
第1章 引言 |
1.1 研究背景和意义 |
1.2 国内外发展现状 |
1.2.1 国外发展现状 |
1.2.2 国内发展现状 |
1.3 研究内容 |
1.4 论文组织结构 |
1.5 本章小结 |
第2章 系统总体设计方案 |
2.1 系统需求分析 |
2.1.1 系统功能需求 |
2.1.2 系统性能需求 |
2.2 系统总体设计 |
2.2.1 系统架构设计 |
2.2.2 系统功能框架设计 |
2.3 系统硬件选型 |
2.3.1 嵌入式硬件开发平台介绍 |
2.3.2 图像采集模块介绍 |
2.4 本章小结 |
第3章 指针式仪表读数算法处理流程 |
3.1 指针式仪表图像预处理 |
3.1.1 图像尺寸调整 |
3.1.2 彩色图像灰度化 |
3.1.3 分段线性变换 |
3.1.4 图像滤波 |
3.1.5 边缘检测 |
3.1.6 阈值分割 |
3.2 指针式仪表表盘圆拟合 |
3.2.1 Hough变换圆检测 |
3.2.2 二值图像连通域 |
3.2.3 仪表刻度线质心提取 |
3.2.4 刻度线质心点拟合圆 |
3.3 主刻度线示数识别 |
3.3.1 主刻度单个字符提取与识别 |
3.3.2 计算主刻度示数 |
3.4 指针提取 |
3.4.1 图像细化 |
3.4.2 累计概率霍夫变换检测直线 |
3.5 仪表示数的判定 |
3.6 本章小结 |
第4章 嵌入式系统平台搭建 |
4.1 嵌入式系统硬件设计 |
4.1.1 电源模块 |
4.1.2 调试串口 |
4.1.3 OTG接口 |
4.1.4 USB接口 |
4.1.5 以太网卡 |
4.1.6 触摸屏 |
4.2 嵌入式开发环境的建立 |
4.2.1 搭建交叉编译环境 |
4.2.2 安装TFTP服务器 |
4.3 嵌入式Linux系统移植 |
4.3.1 u-boot移植 |
4.3.2 Linux内核配置及移植 |
4.3.3 嵌入式文件系统移植 |
4.4 QtE应用程序的开发环境 |
4.5 OpenCV移植 |
4.6 本章小结 |
第5章 系统软件设计 |
5.1 读数终端软件设计 |
5.1.1 多线程程序设计 |
5.1.2 视频采集 |
5.1.3 H.264压缩编码 |
5.1.4 数据传输 |
5.2 服务器端软件设计 |
5.2.1 数据收发 |
5.2.2 FFmpeg解码 |
5.2.3 服务器界面设计 |
5.3 本章小结 |
第6章 系统测试与分析 |
6.1 读数终端测试 |
6.1.1 图像处理算法测试 |
6.1.2 读数结果测试 |
6.2 服务器端测试 |
6.3 测试结果分析 |
6.4 本章小结 |
结论 |
致谢 |
参考文献 |
(9)面向图搜索的并行计算机体系结构关键技术研究与实现(论文提纲范文)
摘要 |
Abstract |
第一章 绪论 |
1.1 研究背景 |
1.2 相关研究 |
1.2.1 面向大数据的并行计算特征分析 |
1.2.2 并行计算模型研究 |
1.2.3 并行编程模型研究 |
1.2.4 面向图搜索的计算机体系结构研究 |
1.2.5 面向图搜索的并行计算瓶颈研究 |
1.3 研究内容 |
1.3.1 面向图搜索的并行计算机理研究 |
1.3.2 面向图搜索的异构并行计算机体系结构设计 |
1.3.3 面向图搜索的并行流处理器体系结构设计 |
1.3.4 面向图搜索的并行计算机原型系统实现 |
1.4 主要创新 |
1.5 论文组织 |
第二章 面向图搜索的并行计算机理研究 |
2.1 影响图搜索并行性能模型的结构因素研究 |
2.1.1 BFS算法分析 |
2.1.2 构建面向图搜索并行性能模型的结构因素分析 |
2.2 面向图搜索的的并行性能模型及其分析 |
2.2.1 算法性能分析及建模 |
2.2.2 算法性能模型拟合及分析 |
2.2.3 两种通信机制下算法性能对比 |
2.3 面向图搜索的可扩展度量模型及其分析 |
2.3.1 传统可扩展度量模型及分析 |
2.3.2 可扩展度量模型及分析 |
2.4 本章小结 |
第三章 面向图搜索的异构并行计算机体系结构设计 |
3.1 面向图搜索的异构并行计算机体系结构设计 |
3.2 面向图搜索的可扩展分布共享存储体系结构设计 |
3.2.1 面向图搜索的访存瓶颈分析 |
3.2.2 全局统一编址的存储结构设计 |
3.3 面向图搜索的可扩展互连通信体系结构设计 |
3.3.1 基于Infini Band的低延迟子网通信机制设计 |
3.3.2 全局同步机制设计 |
3.4 本章小结 |
第四章 面向图搜索的并行流处理器体系结构设计 |
4.1 向量交叉多线程流处理器体系结构设计 |
4.2 流处理器指令集体系结构设计 |
4.3 基于向量交叉多线程流执行机制的流水线设计 |
4.3.1 基于向量交叉多线程流执行机制的GE-Core流水线 |
4.3.2 GE-Core中的各流水段设计 |
4.3.3 GE-Core中的核心功能部件设计 |
4.4 流处理器存储层次结构设计 |
4.4.1 流寄存器文件——SRF |
4.4.2 片内共享便笺存储器——SPM |
4.4.3 局部寄存器文件——LRF |
4.4.4 主存 |
4.4.5 数据传送接口 |
4.5 流处理器数据通路及其控制器设计 |
4.5.1 访存数据通路的设计 |
4.5.2 访存数据通路的优化 |
4.5.3 访存数据通路的原子操作 |
4.6 本章小结 |
第五章 面向图搜索的并行计算机原型系统实现 |
5.1 并行计算机原型系统设计与实现 |
5.2 单节点原型系统测试与分析 |
5.2.1 访问SRF数据通路的测试 |
5.2.2 访存数据通路的测试 |
5.2.3 多级存储层次结构的访存性能测试 |
5.3 多节点原型系统测试与分析 |
5.3.1 全局统一编址共享存储体系结构的性能测试 |
5.3.2 多节点系统的加速比测试 |
5.4 本章小结 |
第六章 结论与展望 |
6.1 工作总结 |
6.2 研究展望 |
致谢 |
参考文献 |
作者在学期间取得的研究成果 |
附录 A 流处理器指令集 |
A.1 数据传送类指令 |
A.2 算术运算类指令 |
A.3 逻辑运算类指令 |
A.4 转移控制类指令 |
A.5 同步控制类指令 |
(10)面向非易失性内存的系统软件若干问题的研究(论文提纲范文)
摘要 |
abstract |
第一章 绪论 |
1.1 引言 |
1.2 非易失性内存(NVM) |
1.3 内存计算 |
1.4 异构混合内存体系架构 |
1.5 论文主要工作 |
1.6 论文结构安排 |
第二章 文件系统及存储类系统软件相关工作 |
2.1 存储类系统软件主要分类 |
2.2 文件系统 |
2.2.1 Linux文件系统 |
2.3 虚拟文件系统 (VFS) |
2.3.1 VFS简介 |
2.3.2 基本概念 |
2.4 数据库系统 |
2.4.1 关系型数据库系统 |
2.4.2 ACID理论模型 |
2.4.3 非关系型数据库系统 |
2.4.4 CAP理论模型 |
2.4.5 BASE理论模型 |
2.5 键值对数据库系统 |
2.5.1 LSM树数据结构 |
2.5.2 散列表数据结构 |
2.5.3 基于LSM树的键值对存储系统Level DB |
2.5.4 基于散列表的键值对存储系统Redis |
2.6 本章小结 |
第三章 异构混合内存文件系统HMFS |
3.1 前言 |
3.2 研究基础 |
3.2.1 NVM相关基础 |
3.2.2 文件系统一致性 |
3.2.3 文件系统数据更新方法 |
3.3 相关工作 |
3.3.1 非易失性内存介质 |
3.3.2 日志型文件系统 |
3.3.3 异构混合体系架构 |
3.4 文件系统设计 |
3.4.1 HMFS概览 |
3.4.2 HMFS内存布局 |
3.4.3 文件与目录结构 |
3.5 文件系统实现 |
3.5.1 优化的MMap直接访问机制 |
3.5.2 垃圾回收 |
3.5.3 异常恢复与一致性 |
3.6 文件系统实验 |
3.6.1 文件系统实验环境 |
3.6.2 实验结果概述 |
3.6.3 性能实验 |
3.6.4 耐久性 |
3.7 本章小结 |
第四章 内存文件系统多版本实现机制 |
4.1 前言 |
4.2 相关工作 |
4.2.1 多版本功能的用途 |
4.2.2 多版本数据结构 |
4.3 文件系统多版本机制设计 |
4.3.1 多版本文件系统理论模型 |
4.3.2 文件基本操作 |
4.3.3 多版本文件系统数据结构 |
4.3.4 多版本文件系统实例分析 |
4.3.5 文件操作相关算法 |
4.3.6 版本操作相关算法 |
4.3.7 多版本机制总结 |
4.4 多版本文件系统实验 |
4.4.1 实验环境 |
4.4.2 实验结果概述 |
4.4.3 版本有效性 |
4.5 本章小结 |
第五章 异构混合内存键值对存储系统Libre KV |
5.1 前言 |
5.2 相关工作 |
5.3 Libre KV设计与实现 |
5.3.1 Libre KV整体架构 |
5.3.2 Libre KV内存布局 |
5.3.3 Libre KV内部架构 |
5.3.4 Libre KV静态散列表结构 |
5.3.5 Libre KV动态散列表结构 |
5.3.6 Libre KV键值对数据结构 |
5.3.7 Libre KV数据处理流程 |
5.3.8 Libre KV实现概述 |
5.4 实验结果 |
5.4.1 实验环境配置 |
5.4.2 实验方法 |
5.4.3 实验结果 |
5.5 本章小结 |
第六章 Libre KV动态扩展算法与一致性保障机制 |
6.1 前言 |
6.2 相关工作 |
6.3 动态扩展算法 |
6.3.1 静态散列表布谷鸟散列算法 |
6.3.2 散列表静态重构 |
6.3.3 Libre KV动态扩展算法 |
6.4 自适应一致性保障机制 |
6.5 实验验证 |
6.6 本章小结 |
第七章 总结与研究展望 |
7.1 总结 |
7.2 研究展望 |
参考文献 |
致谢 |
攻读学位期间发表的学术论文 |
攻读学位期间参与的项目 |
攻读学位期间申请的专利 |
四、多线程文件传输的实现方法及其性能的研究(论文参考文献)
- [1]基于ZooKeeper和Netty的分布式文件传输系统的设计与实现[D]. 何易于. 浙江大学, 2021(02)
- [2]大规模数据实时绘制关键技术研究[D]. 罗德宁. 四川大学, 2021(01)
- [3]大规模超长生物序列聚类分析[D]. 殷泽坤. 山东大学, 2020(04)
- [4]面向非易失性内存的文件系统优化与共享文件系统研究[D]. 吴挺. 重庆大学, 2020(02)
- [5]振动台电源监控系统软件的设计与实现[D]. 陈垚臻. 北京交通大学, 2020(03)
- [6]计算机科技论文摘要的机翻错误类型及译后编辑[D]. 付茜雯. 大连理工大学, 2020(06)
- [7]基于中间件的C-V2X车载单元消息分发机制研究与设计[D]. 欧小龙. 重庆邮电大学, 2020(02)
- [8]基于ARM的指针式仪表自动读数系统设计与实现[D]. 罗尧. 成都理工大学, 2020(04)
- [9]面向图搜索的并行计算机体系结构关键技术研究与实现[D]. 唐玉华. 国防科技大学, 2018
- [10]面向非易失性内存的系统软件若干问题的研究[D]. 刘昊. 上海交通大学, 2018(01)