一、基于关系数据库的XML查询效率测试方法(论文文献综述)
王松[1](2020)在《基于Spark的会话语料库管理系统》文中研究表明近几年来,随着计算机技术的快速发展,语料库作为语言学研究的一种手段,对汉语、英语以及世界各国语言的研究起到了重要的推进作用,语料库的建设也引起了国内外的广泛关注。语料库是为某一个领域或者多个领域收集的具有一定结构的、具有代表性的、并且能够被计算机程序检索的有规模的语料集合。不同规模、不同类型的语料库对语言学研究具有不同的影响,并且随着语料库的加工程度越来越深,应用范围也越来越广。把会话语言作为研究对象,建立相关的会话语料库,有助于人们将语言的结构规律更加形式化、计算化的表示出来。本文主要针对会话语料进行语料库管理系统的设计,对语料的存储以及查询进行研究。会话语料具有一定的结构,可以使用XML文档进行语料的存储,利用Spark计算框架对语料进行分布式存储。本文的主要内容如下:(1)设计并实现了基于Spark的会话语料库管理系统,系统中主要包括存储模块和查询模块。用户可以根据自身的的需求上传语料建立语料库,也可以对语料库中的语料进行聚合查询等查询。(2)针对会话型语料自身语言结构的特点对会话型语料的存储进行研究,使用XML对会话型语料进行存储,并将数据存储在大数据环境下,实现了将用户上传数据转换为XML文档。(3)对于大数据环境下语料,使用原始的XPath查询或者XQuery查询对XML文档进行查询响应时间会越来越长。为了提高查询的效率,利用Spark对XML文档进行分布式的查询,使用XPath或者XQuery查询,实现了对语料的分布式查询。
刘健[2](2014)在《模糊XML数据存储与查询技术的研究》文中研究说明随着Web技术的广泛应用,互联网已成为人们获取信息的主要工具。由于互联网数据格式通常存在着异构性,为了高效地处理Web数据信息,越来越多的应用系统采用了XML (Extensible Markup Language)作为数据表示和交换的标准。作为下一代的Web语言,XML具有格式独立、与平台无关的特性。XML技术在当前的互联网络环境中扮演着越来越重要的角色,它事实上已经成为了Web时代实现数据信息智能管理的基石。正是在这样的应用背景下,基于XML的数据管理应用引起了学术界和工业界的高度关注,有关XML数据存储与查询的理论和技术也相应地成为了数据库领域中的研究热点。现实世界应用中存在着大量的不精确和不确定信息,在数据库中融入模糊数据处理技术以满足现实需求成为了当前研究热点,并因此产生了有关模糊XML数据管理的需求。然而,从现有的有关模糊XML的研究文献来看,该领域研究成果还很少,特别对模糊XML数据的存储以及查询等问题的研究还处于起步阶段,许多重要的理论问题和技术难点当前仍是研究空白。鉴于这样的研究现状,本论文的研究工作将从构建模糊XML数据库系统的角度出发,围绕模糊XML数据存储与查询问题深入展开,本文将提出一套行之有效的模糊XML数据管理的解决方案。具体研究内容包括以下几个方面:(1)针对模糊XML数据的存储问题,提出了基于关系数据库的存储方法,同时提出了从模糊XML模型到UML概念数据模型的映射转换方法。首先研究了模式信息未知情况下模糊XML数据的关系数据库存储问题,提出了基于XML边信息的关系数据库存储方法,给出了从XML查询表达式到SQL查询表达式的映射转换方法。通过边位置序号的引入,有效解决了现有方法在数据转换时出现的语义次序信息丢失问题。同时研究了从模糊XML模型到UML数据模型的转换问题,提出了模式信息未知情况下模糊XML模型到UML概念数据模型的映射以及模式构建方法,解决了现有方法在进行模式转换时需要强制系统提供XML模式信息的问题。(2)针对模糊XML数据的查询问题,提出了基于小枝模式的模糊XML数据查询方法。基于整体匹配策略,研究了模糊XML小枝模式的结构化查询问题,提出了复杂逻辑语义下,特别是包含逻辑或和逻辑非语义的小枝匹配问题的解决方案,解决了现有方法在处理逻辑或和逻辑非语义的小枝模式查询时需要重复读取源数据所带来的读取代价过大问题,提升了小枝模式匹配的处理效率。基于孩子线索,定义了异构哈希表,并在此基础上研究了异构XML数据源下的小枝匹配方法,解决了现有方法需要预先集成异构文档再计算小枝匹配所带来的集成代价过大问题,提升了异构模糊XML小枝模式的查询性能。(3)针对严格结构化查询可能返回过少甚至空查询结果的问题,提出了基于语义相似度的针对模糊XML数据的近似查询方法。首先,基于用户查询和数据分布推测用户查询意图,据此提出了模糊XML数据查询的权重评估方法。然后,分别给出了查询结构相似度以及查询内容语义相似度评估方法。在此基础上,提出了基于模糊XML数据的自适应查询松弛方法以及结果排序方法,解决了现有结构化查询方法在响应查询时需要强制用户了解数据模式信息并提供严格查询语言语法所带来的用户查询负担过重问题,提高了模糊XML近似查询的查准率和查全率。
杨刚[3](2013)在《外包数据库机密性保护技术研究》文中研究指明外包数据库是一种为用户提供数据库管理、维护、更新和查询支持的SaaS应用。随着外包数据库的应用平台—云计算的迅猛发展,如何为用户提供安全、可靠和高效的外包数据库服务已成为云计算应用研究的热点。在外包数据库服务中,数据不再存储在数据拥有者可完全控制的、可信的服务器上,而是委托给外包数据库服务提供商存储。由于数据库服务提供商本身并不完全可信,因此,外包数据库的机密性受到了巨大的挑战。本文在分析和研究现有成果的基础上,提出了一种循环分区密文索引技术,并分别基于属性分解和多项式划分提出了面向关系数据库和XML数据库的机密性保护外包方案。主要研究内容如下:1.分析了外包数据库机密性保护的研究背景和现状,指出了机密性保护目标和目前存在的主要问题,设计了一种包含可信第三方的外包数据库机密性保护架构,该架构是本文后续研究方案的基础。2.提出了一种基于AES和模运算的循环分区密文索引方案。通过引入安全参数,增加了属性值的可映射区间数目,增强了索引本身的机密性;同时,使用该方法建立的索引具有桶间有序、桶内随机且弱碰撞的性质,在不显着增加执行范围查询时外包数据库服务提供商返回结果中假阳性元组数量的前提下,降低了方案在执行等值查询时的假阳性元组数量,实现了同一索引下高效的等值查询和范围查询。3.为了减少数据库拥有者或可信第三方的加解密计算量,通过将关系表中可能泄露隐私的属性组合进行分解存储,提出了一种基于属性分解的外包关系数据库的机密性保护方案。首先,设计了考虑查询类型和属性所处查询位置的属性分解代价计算策略,并以此计算策略为评价标准,给出了求解最小属性分解代价方案的算法;然后,对各数据切片进行了准标识符的抗共谋攻击处理,并在加密属性上建立了循环分区索引;最后,研究了方案的查询执行机制并进行了性能测试。4.提出了一种改进多项式划分的外包XML数据库机密性保护方案。针对已有方案中节点值验证效率较低的缺点,通过向XML文档多项式树中的非叶子节点添加辅助查询数据AVD,以较小的预处理代价改进了节点值验证算法,实现了不用计算其孩子节点值即可完成节点验证。基于改进后的验证算法,给出了改进方案下的查询执行过程,并实验验证了上述方案的有效性。
温延龙[4](2012)在《XML信息检索关键技术研究》文中指出随着XML技术的广泛应用,XML已成为Web上表示和交换数据的标准格式,各个领域不断涌现出大量的XML数据。如何有效检索大量的XML数据,是当前数据库与信息检索等领域中一个亟待解决的热点研究问题。传统信息检索技术在处理非结构化数据的检索上,取得了大量卓有成效的研究成果。XML数据具有半结构化特性,既有结构又有内容,给信息检索领域的研究带来了新的挑战。将数据库技术与信息检索技术巧妙结合,用于解决XML检索问题,已在研究人员中达成共识,为XML检索提供了新思路。本文在深入分析XML检索研究现状的基础上,以XML检索方式为主线,结合数据库技术与信息检索技术,对XML检索的若干关键技术进行了深入研究,包括XML关键字检索、模糊结构上下文的XML内容与结构检索、基于关系数据库的XML全文检索等内容。具体的创新和贡献如下:提出了一种基于候选片段语义的XML关键字检索方法。该方法首先根据XML文档树中节点所包含的属性类型数量以及节点的后裔节点数量选择候选节点,以候选节点为中心创建候选片段,将候选片段作为回答XML关键字检索最基本的语义单元;然后,针对候选片段建立倒排索引,在回答关键字查询时,根据XML数据集自身特点和用户的选择返回包含全部关键字的候选片段集合或存在祖先后裔关系的候选片段集合。实验结果表明以候选片段作为XML关键字检索的基本语义单元,能够为用户返回粒度适中、信息比较完整、拥有实际意义的检索结果,并且检索效率也比较理想。提出了一种模糊结构上下文的XML检索方法。该方法将查询与文档中的结构化约束条件定义为结构上下文,以结构化词项集合表示XML查询和XML文档。在上下文相似度计算方面,综合考虑了上下文之间的最大匹配部分以及各元素的层次权重、元素间的层次相似性等因素,提出了查询上下文与文档上下文相似度计算方法。为有效实现XML内容与结构检索,扩展了向量空间模型,设计了模糊结构上下文的XML内容与结构检索算法。实验结果表明,该方法在检索效率、检索结果上均有较好性能。提出了一种基于关系数据库的XML全文检索方法ReXFT。ReXFT采用基于模型映射的XML数据存储方案NXRel,能够在关系模型之上自然的体现出XML数据逻辑模型。提出了基于全文检索元素节点的XML全文索引方案,允许用户自定义全文索引路径。ReXFT以W3C推荐的XML全文检索标准作为XML全文检索提交形式,检索语法符合国际标准。综合考虑XML数据层次特性以及检索词之间的逻辑关系、距离、出现频率等因素,提出了一种基于文本覆盖密度的检索结果计分方法。实验结果表明,ReXFT可以有效处理XML全文检索。
闫威[5](2012)在《XML柔性查询技术的研究》文中研究表明随着World Wide Web的迅速发展,半结构数据得到了广泛的关注,进而XML成为Web上交换信息和整合数据资源的事实上的标准。XML作为一种数据格式与其他文档格式的区别在于除了有内容信息之外,XML还有结构信息。当检索XML文档的时候,由于大多数普通用户对XML文档的结构和内容信息不够了解,从而频繁地获得空查询结果,不得不多次修改查询表达式。为了避免这种空查询结果问题,提出了查询松弛方法。查询松弛的基本思想是减少原始查询的约束进而扩大查询的范围,为用户返回更多相关的查询结果。在松弛原始查询之后,用户将面对的另一个问题是系统通常为用户返回很多的查询结果。为了处理多查询结果问题,本文使用有效的排序方法对查询结果进行排序。此外,在查询XML文档的时候用户经常有模糊的或者不精确的查询要求。用户更加喜欢使用模糊词或者模糊关系表达其模糊查询意图,此时如何扩展查询系统并让查询系统能够满足用户的模糊查询要求是一个重要的问题。因此,对XML的查询语言进行柔性扩展,并给系统提供柔性查询能力,能够提高用户与系统之间的交互性。近年来,大量的研究工作致力于XML数据库柔性查询技术的研究,研究的重点主要包括XML查询松弛、查询结果排序和模糊查询等研究领域。然而,在大多数查询松弛的研究工作中没有考虑用户偏好的作用,而在实际应用中查询松弛的效果能够极大地受到用户偏好的影响。为此,为了处理在查询XML数据库过程中出现的个性化查询和模糊查询问题,本文提出了有效的柔性查询技术满足用户的查询需求和偏好。主要的研究内容包括以下几个方面:(1)针对用户的个性化查询问题,提出了一种松弛上下文偏好的方法,即偏好查询的结果依赖于查询提交时的上下文条件。上下文可以表示成多维属性的集合形式。首先,提出了一种XML上下文偏好模型;然后,讨论了松弛上下文操作的方法,它可以松弛一个或者多个上下文属性而产生更多的上下文状态;进一步地,上下文偏好存储在一种特定的数据结构——兴趣树中;最后,通过在兴趣树中使用关联规则挖掘方法自动地获取上下文偏好的偏好程度。(2)为了解决在查询XML数据库过程中出现的空查询结果问题和多查询结果问题,提出了一种基于XML结构偏好松弛和内容偏好打分的查询结果排序方法。首先,提出了结构偏好的定义,由结构偏好生成所有可能的松弛查询;然后,用户可以在XML的属性节点上表达他们的兴趣,进而用户给他们感兴趣的属性节点分配兴趣度得分,并快速计算偏好得分;在此基础上,提出了一种偏好查询的结果排序方法,主要包括基于上下文状态的相似性合并聚类的聚类融合算法、找到有代表性聚类排列的算法和Top-k排序算法来处理多查询结果问题。(3)用户在查询XML文档的时候经常有模糊的或者不精确的查询要求。为了解决用户的模糊查询问题,提出了一种基于XML结构和内容的模糊查询扩展方法。首先,以模糊集理论为基础,提出了利用模糊谓词实现XPath查询表达式的模糊扩展方法;然后,基于代数操作,提出了一种新颖的模糊代数查询方法表达用户的模糊查询意图。该方法的目的是定义一个模糊代数操作的集合,能够支持XML模糊查询,模糊查询的结果能够满足用户提出的模糊查询条件;进一步地,提出了一种排序方法考虑隶属度和用户自定义查询权重之间的相关性;最后,提出了一种有效地计算模糊查询结果的Top-k答案的方法。(4)针对XML文档进行模糊查询过程中出现的空查询结果问题,提出了一种模糊查询松弛方法,该方法能够获得更多的满足用户模糊查询要求的查询结果。首先,可以将原始的模糊查询条件转换为一个精确的查询区间,该查询区间内的值都能够满足用户的模糊查询要求;然后,提出了一种基于扩展的向量空间模型,用于度量XML属性节点和模糊关系谓词之间的相关度;最后,提出了一种基于改进的PIR方法排序模糊查询结果,它考虑被模糊查询指定的属性节点和未被模糊查询指定的属性节点之间的相关性。
邝子民[6](2011)在《基于XML模式的查询优化技术研究与实现》文中研究说明可扩展标记语言XML正得到越来越广泛的应用。近年来,计算机网络和移动计算方式迅速发展,大量的数据通过网络,在各种不同的平台和应用程序间进行交换和传递。XML非常适合用来作为网络上数据的描述方式,XML具有自描述、半结构化、简单易用、跨平台、可扩展等优点。越来越多的应用和服务开始支持XML语言,使用XML语言描述的数据也随之呈现爆炸性增长。如何有效地处理这些涌现的海量XML数据,已经成为研究人员和计算机厂商十分关注的问题。关于这个问题,一个最直接的想法是使用数据库来处理XML数据。目前,研究人员已经在XML数据库技术的多个方面取得了进展,也出现了不少可商用的XML数据库系统产品和大量的实验室原型系统。对于所有的数据库系统来说,查询处理都是其必不可少、最重要的功能之一。而作为查询处理的重要组成部分,查询优化技术往往是影响查询效率的关键因素。然而人们在传统的关系数据库中已经运用得相当成熟的查询优化技术,在面对XML数据的时候却遇到了不少困难,主要表现为这些针对关系数据的查询优化技术无法处理层次结构的XML数据。XML数据库的查询优化技术是目前该领域的一个研究热点。几乎所有XML查询语言都使用路径表达式来描述和定位查询的目标信息,路径表达式是XML查询的重要组成部分,对路径表达式的计算也是查询处理过程中开销较大的操作之一,如何提高查询中路径表达式的处理速度,是一个非常值得研究的问题。本文在回顾了现有查询优化技术的基础上,提出一套基于XML模式的查询优化策略。本文利用一种能快速捕捉XML节点包含关系的层次编码,提出了一种能够快速求解路径表达式中最优结构连接顺序的算法,并在此基础上通过引入XML模式信息,给出一种在特定条件下执行速度更快的改进算法。在本文的最后部分给出了该优化算法在XSQS中的一种实现,并测试了算法的实际运行效果。实验结果表明,通过使用该优化算法,能较为有效地提高XML查询处理的速度。
赵利[7](2011)在《关系-XML无缝集成数据库系统中关键字查询技术的研究与实现》文中研究指明随着XML逐渐成为数据表示和数据交换的标准,XML在越来越多的领域得到了广泛的应用,XML文档的数量也在逐渐增多,如何从大量的XML文档中搜索出用户满意的结果已经成为数据库领域一个重要的研究方向。本文依托于国家863数据库重大项目“无缝集成的关系-XML双引擎数据库管理系统研制及其示范应用”,设计并实现了XML关键字查询的功能。文中将XML关键字查询分为带有复杂结构和不带有复杂结构的关键字查询。带有复杂结构的关键字查询即为结构查询,它能够精确的表达用户的查询要求,但同时对用户要求很高,要求用户掌握复杂的查询语言,了解XML文档的模式信息,适用于高级程序员或数据库管理员;不带有复杂结构的关键字查询即为关键字查询,它对用户要求低,适合于广大的普通用户,用户只需输入感兴趣的一个或多个关键字,系统就会返回满足用户查询意图的结果。文中首先介绍了关键字查询的设计,包括存储XML文档信息的XmlInfoRelation表的结构,存储索引词及索引词的各种信息的倒排索引和关键字查询及结构查询用到的一些算法。XmlInfoRelation表中存储了XML文档的文本内容和模式信息,是XML文档的另一种表示形式,倒排索引建立在表中的文本列上,在倒排索引中,存储了每个索引词在XML文档中的详细位置信息。在此基础上,提出了一个适合本系统的关键字查询算法CoSQLRXSE,并与ILE算法进行了比较。其次,介绍了关键字查询的具体实现过程。以一个XML关键字查询实例来具体介绍关键字查询具体涉及到的数据结构和算法,接下来对所有的数据结构和算法分为三个方面进行实现方面的介绍,这三个方面包括从倒排索引中或扫描XML文档来提取所需要的查询信息,根据查询条件对提取的信息进行判断,将满足查询条件的XML文档或文档片段返回给用户。最后,本文进行了实验测试与分析。文中采用XMark测试基准对系统中不同规格的XML文档进行关键字查询测试。实验结果表明,本文所设计的XML关键字倒排索引能够显着的加快查找速度,本文提出的算法能够很好的结合系统存储的特点,高效的返回查找结果。
张永祥[8](2011)在《基于XML模式的异构数据集成中间件研究》文中研究表明近些年来,随着计算机技术、网络技术、信息技术的高速发展以及电子产品成本的急速下降,企业的信息化得以空前的施展,信息化使得企业在发展过程中积累了不少数据。市场环境变化的复杂性以及企业发展竞争的激烈性,使得企业需要访问多种数据源的数据,以提高自身的竞争实力。由于多种原因,这些数据源之间存在异构特点,如何有效地解决这种差异性,为企业访问异构数据源提供便利,则是企业高度信息化亟待解决的问题。典型的解决方案是借助于数据库服务器,将各数据源中的数据提取出来,经过数据转换存储到中心数据库,操作中心数据库的数据,但这样会导致大量的数据重复存储,同时也影响业务的敏捷性。还有一种方案是运用数据库服务器和虚拟视图方式来到达数据集成的目的,这种方案的不足之处在于对XML数据或者非结构化数据的处理效果不佳。如何提供一个高效的、可扩展的、可靠的异构数据集成中间件,使其能够提供统一的接口为其它应用系统的开发服务,则是当前数据集成研究的热点。本文分析了当前异构数据集成领域中的主要问题,针对数据源存储结构的特点,提出数据源分类的思想,把数据源分成数据库、XML、非结构化三种类型,依据各自的特征,对每一类数据源采用统一的方式处理。对于数据库数据源,利用数据库服务器来处理;对于XML数据源,则应用XQuery引擎处理;对于非结构化数据源,转化成XML数据源来处理。利用XML模式描述数据的优点,通过提取各数据源的元数据,对元数据进行转换处理,在此基础上根据一定的规则构建虚拟数据库,使得待集成的数据源以一致的全局视图形态呈现给用户。借鉴JDBC能够访问不同数据库的设计特点,针对开发人员设计异构数据集成中间件HDAM(Heterogeneous Data Source Access Middleware),描述了中间件各功能模块的作用和运行流程,说明了HDAM的数据源注册接口和数据操作接口,研究了全局查询分解以及局部查询语句的转换算法。最后经过开发和测试验证了中间件设计方案的可行性和正确性,并通过案例演示了HDAM的应用流程。本课题基于对数据源分类的思想研究异构数据集成,提出在中间件设计中利用XQuery处理器处理XML数据,提高了中间件处理XML数据和非结构化数据的查询效率,从而使得集成中间件扩展性更好,访问速率更快。
汪陈应[9](2010)在《XML数据编码与存储管理关键技术研究》文中研究说明在过去的十余年里,XML得到了迅速的发展和极其广泛的应用,XML数据凭借其灵活的半结构化特征成为当今各个领域广泛采用的新的数据形式。呈指数级增长的XML数据给数据库研究领域注入了新鲜的血液,半结构化数据管理已成为现代数据库技术的一个重要分支。XML数据管理应以XML数据模型为中心,从XML数据的本质特征出发,探求支持其独特树形结构的高效管理方案,即原生XML数据管理方案是解决问题的关键所在。本文正是对原生XML数据管理中相关的关键技术进行了研究,一方面是设计和实现了一种完全独立的原生XML数据库的物理存储方案,它完整地体现了XML数据逻辑模型,支持各种XML索引结构,并能高效的进行XML查询;另一方面,针对传统基于关系数据库管理XML数据所造成的语义丢失以及性能下降问题,本文设计和实现了一种无缝集成关系数据库系统的原生XML存储方案,该方案最大幅度地重用关系数据库的存储管理器,解决了XML数据逻辑模型与关系模型之间的差异,能够以最自然的方式存储和索引XML数据。在分析近几年来国内外相关研究成果的基础上,本文对原生XML编码、存储、索引、更新、文档相似性度量等问题进行了系统深入的研究。主要贡献与创新点如下:●提出了一种基于二进制分数的动态XML节点编码方案BSC。给出了BSC编码方案的基本定义及其扩展定义,设计了BSC的静态和动态编码算法,分析和对比了多种节点编码串行化方法的效率和局限性,最后实验验证了BSC编码方案的高效性。●参与设计了一种节点级原生XML存储方案XN-Store。该方案以节点记录为最小单位,直接在分页文件上构建持久化的XML数据逻辑模型,节点记录的文档序存储可以支持快速的XML文档发布和节点的随机访问,能够支持各种XML辅助索引和高效的查询处理。实验证明XN-Store是一种高性能的原生XML存储方案。●基于XN-Store存储方案,本文设计了一种高效的XML数据更新策略XN-Store+。在XN-Store的基础上,该方案添加前向链接记录以保持移动记录的虚拟地址不变,进而维护各种索引结构的正确性;添加重定位记录以保持实际节点记录的文档序存储,很好地解决了XML数据高效更新和索引维护困难之间的矛盾。●提出了一种基于关系的原生XML存储方案NXRel。基于模型映射的方式,NXRel解决了XML数据逻辑模型和关系模型之间的差异所引起的各种问题,在关系表的基础之上构建了XML数据逻辑模型,能够以自然的方式存储和索引XML文档,支持高效的XML数据更新。实验证明NXRel处理各类XML数据集都具有稳定的表现,各种索引结构能够对XML查询提供强有力的支持。●基于双向路径约束模型,本文提出了一种综合考虑各种因素的XML文档相似性的度量方法。提出了双向路径约束模型以精确刻画XML文档结构特征,设计了基于集合和基于N-Gram的路径约束相似性度量方法,综合各种权重代价,给出了基于双向路径约束模型的文档相似性度量方法。通过聚类实验证明,该方法能够提高聚类效果的准确率和召回率。
周士钦[10](2010)在《基于关系数据库的XML存储、查询与重构》文中认为XML(eXtensible Markup Language,可扩展标记语言)为网络传输提供了一种便捷有效的数据格式,它是一种自描述的标记语言,能提供统一的数据说明方式,可以描述任意数据逻辑关系。XML很快成为了Internet上数据表示、集成和交换的标准,同时也促进了下一代网络的发展。如今,互联网上急剧膨胀的XML数据带来了一个全新的研究领域——XML数据管理。而借助关系数据库来管理XML数据是其中一个热门研究方向,这种方法可以利用关系数据库成熟的技术,例如内存管理、查询服务、并发控制、数据恢复、访问控制及安全性等。然而具有层次和嵌套的XML数据模型比二维平面式的关系模型复杂得多,要使用关系数据库无损地存储和管理XML数据是一项十分困难的任务。论文的目的是设计并实现一种通用的基于关系数据库的XML数据管理系统,使之能有效应用于电子商务等领域。使用关系数据库管理XML的方法一般需要完成三个步骤,论文分别针对这三个阶段作了一系列工作:(1)模式映射——利用XML模式信息生成关系模式以存储遵从该模式定义的所有XML文档。论文首先提出一种改进的共享内联技术,它增加了DTD简化规则,并定义新的DTD图模型和内联DTD图模型。基于这些模型,模式映射算法DTD2RSchema将DTD转换成对应的关系模式和σ映射。(2)文档映射——将XML文档存储到关系数据库中。为表示XML文档,首先定义一种XML树模型,文档映射算法SAXDocMap自顶向下遍历XML树为每一个结点编码,同时利用σ映射将结点信息映射到关系元组中。(3)查询映射——将XML查询转换为关系查询,并在需要时将关系查询结果重构成XML子树。在路径匹配阶段,定义一种断环DTD图来管理DTD中存在的递归环路,利用这种断环DTD图,路径匹配算法PathMatching可有效地找出递归查询的所有匹配路径;在查询转换阶段,转换算法Convert2SQL以匹配路径为输入并生成等价的SQL查询;在XML重构阶段,首先通过算法SESGen生成结构编码序列,再由重构算法ReconXML将结构编码序列还原成XML文档。所有算法都已在XML存取原型系统X2R中实现。论文最后以MySQL作为后台数据库从不同角度对X2R进行测试和验证。实验证明,X2R能够无损地存储XML数据,且具有良好的可扩展性和高效的查询性能。
二、基于关系数据库的XML查询效率测试方法(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、基于关系数据库的XML查询效率测试方法(论文提纲范文)
(1)基于Spark的会话语料库管理系统(论文提纲范文)
摘要 |
Abstract |
1 绪论 |
1.1 项目研究背景 |
1.2 研究目的和意义 |
1.3 国内外研究现状 |
1.3.1 国内研究现状 |
1.3.2 国外研究现状 |
1.4 论文结构 |
2 会话语料库特点与相关技术 |
2.1 会话语料库特点 |
2.2 Hadoop平台架构 |
2.2.1 技术背景 |
2.2.2 分布式文件系统HDFS |
2.2.3 Map/Reduce计算框架 |
2.3 Spark计算框架 |
2.3.1 技术背景 |
2.3.2 集群模型 |
2.3.3 RDD计算框架 |
2.3.4 键值对操作 |
2.4 本章小结 |
3 系统需求分析和设计 |
3.1 需求分析 |
3.1.1 功能性需求 |
3.1.2 非功能性需求分析 |
3.2 架构设计 |
3.3 HDFS存储模块 |
3.3.1 原始语料存储模型概述 |
3.3.2 转换语料存储模型概述 |
3.3.3 HDFS存储模型概述 |
3.4 查询模块 |
3.4.1 XPath查询解析 |
3.4.2 XQuery查询解析 |
3.4.3 XML编码方案 |
3.4.4 Spark RDD操作查询 |
3.5 本章小结 |
4 基于Spark的分布式查询 |
4.1 传统查询 |
4.1.1 传统查询概述 |
4.1.2 存在问题 |
4.2 分布式查询 |
4.2.1 分布式查询概述 |
4.2.2 分布式查询的Spark实现 |
4.2.3 分布式查询和传统查询对比 |
4.3 本章小结 |
5 系统的实现与测试 |
5.1 系统实现 |
5.1.1 Hadoop集群搭建 |
5.1.2 Spark集群搭建 |
5.1.3 HDFS存储模块实现 |
5.1.4 分布式查询模块实现 |
5.2 系统测试 |
5.2.1 集群容错性测试 |
5.2.2 查询模块功能测试 |
5.3 本章小结 |
6 总结与展望 |
6.1 总结 |
6.2 展望 |
参考文献 |
附录 |
致谢 |
(2)模糊XML数据存储与查询技术的研究(论文提纲范文)
摘要 |
Abstract |
第一章 绪论 |
1.1 研究背景与动机 |
1.2 国内外相关研究的现状与分析 |
1.2.1 模糊数据表示模型的研究 |
1.2.2 XML数据存储的研究 |
1.2.3 XML查询技术的研究 |
1.3 研究目标与意义 |
1.4 本文工作 |
1.4.1 研究内容 |
1.4.2 论文的组织结构 |
第二章 相关理论基础 |
2.1 XML相关基础知识 |
2.2 不确定性理论基础 |
2.3 模糊关系数据库模型以及模糊UML概念数据模型 |
2.4 模糊数据的XML表示 |
2.5 模糊XML数据模型以及Schema定义 |
2.6 可能性信息的聚合评估 |
2.7 模糊XML查询模型 |
2.8 本章小结 |
第三章 模糊XML数据存储方法 |
3.1 引言 |
3.2 模糊XML数据的关系数据库存储方法 |
3.3 模糊XML到UML概念数据模型的映射方法 |
3.4 本章小结 |
第四章 模糊XML查询方法 |
4.1 引言 |
4.2 结点编码 |
4.3 小枝查询 |
4.3.1 相关符号 |
4.3.2 逻辑与小枝查询 |
4.3.3 逻辑或小枝查询 |
4.3.4 逻辑非小枝查询 |
4.3.5 异构环境下的小枝查询 |
4.4 实验评价 |
4.4.1 实验环境 |
4.4.2 逻辑与语义XML小枝查询测试 |
4.4.3 逻辑或语义XML小枝查询测试 |
4.4.4 逻辑非语义小枝查询测试 |
4.4.5 异构小枝查询测试 |
4.5 本章小结 |
第五章 模糊XML近似查询方法 |
5.1 引言 |
5.2 相似度评估 |
5.2.1 结构相似度评估 |
5.2.2 内容相似度评估 |
5.3 权重分配 |
5.4 模糊XML近似查询 |
5.4.1 查询松弛 |
5.4.2 结果打分 |
5.5 实验评估 |
5.5.1 实验环境 |
5.5.2 查全率测试 |
5.5.3 查准率测试 |
5.5.4 响应时间 |
5.6 本章小结 |
第六章 结束语 |
6.1 本文的主要贡献与结论 |
6.2 未来工作 |
参考文献 |
致谢 |
攻博期间主持及参加的科研项目 |
攻博期间获得的荣誉及奖励 |
攻读博士期间发表的论着 |
(3)外包数据库机密性保护技术研究(论文提纲范文)
摘要 |
Abstract |
图录 |
表录 |
第一章 绪论 |
1.1 研究背景与意义 |
1.2 国内外研究现状 |
1.3 论文主要工作 |
1.4 论文组织结构 |
第二章 外包数据库机密性保护架构和技术 |
2.1 外包数据库服务 |
2.1.1 外包数据库的数据模型 |
2.1.2 外包数据库的特点 |
2.1.3 外包数据库机密性保护目标 |
2.2 外包数据库机密性保护架构 |
2.3 数据加密技术 |
2.3.1 对称加密算法 |
2.3.2 秘密同态 |
2.3.3 保序加密 |
2.4 安全索引技术 |
2.5 数据分布技术 |
2.5.1 属性分解 |
2.5.2 秘密共享 |
2.5.3 多项式划分 |
2.5.4 数据分布技术比较 |
2.6 本章小结 |
第三章 基于AES和模运算的循环分区密文索引方案 |
3.1 WPCI方案 |
3.1.1 现有桶分区索引技术分析 |
3.1.2 WPCI主要思想 |
3.1.3 WPCI索引建立算法 |
3.2 查询执行 |
3.2.1 等值查询 |
3.2.2 范围查询 |
3.3 安全性与性能分析 |
3.3.1 安全性分析 |
3.3.2 性能分析 |
3.4 本章小结 |
第四章 基于属性分解的外包关系数据库机密性保护方案 |
4.1 属性分解概述 |
4.1.1 属性分解的相关定义 |
4.1.2 属性分解方案的求解目标 |
4.2 基于属性分解与WPCI的关系数据库外包方案 |
4.2.1 面向应用的查询模式特征参数提取 |
4.2.2 属性分解代价计算策略 |
4.2.3 最小查询代价的属性分解方案求解 |
4.2.4 抗DSP共谋攻击的数据存储 |
4.2.5 加密属性的WPCI索引建立 |
4.3 查询分解 |
4.4 实验与结果分析 |
4.4.1 实验环境 |
4.4.2 实验内容 |
4.4.3 查询效率测试结果与分析 |
4.5 本章小结 |
第五章 改进多项式划分的外包XML数据库机密性保护方案 |
5.1 XML数据库外包服务相关研究 |
5.2 改进多项式划分的外包XML数据库机密性保护方案 |
5.2.1 XML多项式树的建立 |
5.2.2 数据划分存储 |
5.2.3 查询执行 |
5.3 安全性分析 |
5.3.1 DSP端数据机密性 |
5.3.2 查询内容机密性 |
5.4 实验与结果分析 |
5.4.1 存储开销 |
5.4.2 计算开销 |
5.5 本章小结 |
第六章 总结与展望 |
6.1 工作总结 |
6.2 下一步工作展望 |
致谢 |
参考文献 |
作者简历 |
(4)XML信息检索关键技术研究(论文提纲范文)
摘要 |
Abstract |
第一章 绪论 |
第一节 研究背景与意义 |
第二节 研究内容和创新点 |
第三节 论文结构 |
第二章 相关研究基础 |
第一节 XML 基本概念 |
2.1.1 XML 简介 |
2.1.2 XML 模式 |
2.1.3 XML 数据模型 |
2.1.4 XML 节点编码 |
第二节 XML 查询与检索语言 |
2.2.1 XML 查询语言 |
2.2.2 XML 检索语言 |
第三节 本章小结 |
第三章 基于候选片段的 XML 关键字检索 |
第一节 引言 |
第二节 相关工作 |
3.2.1 XML 关键字检索 |
3.2.2 关系数据库的关键字检索 |
3.2.3 关键字检索技术的研究趋势 |
第三节 候选片段检索语义 |
3.3.1 相关概念 |
3.3.2 CAF 语义 |
第四节 检索算法 |
3.4.1 节点匹配算法 |
3.4.2 路径匹配算法 |
第五节 实验结果及分析 |
3.5.1 实验环境与数据集 |
3.5.2 检索效果 |
3.5.3 检索效率 |
第六节 本章小结 |
第四章 基于模糊结构上下文的 XML 检索 |
第一节 引言 |
第二节 相关工作 |
第三节 结构上下文相似度计算 |
4.3.1 相关概念 |
4.3.2 相似度计算 |
第四节 基于扩展向量空间模型的 XML 检索算法 |
4.4.1 相关概念 |
4.4.2 检索算法 |
第五节 实验结果及分析 |
4.5.1 实验环境与数据集 |
4.5.2 检索效果 |
4.5.3 检索效率 |
第六节 本章小结 |
第五章 基于关系数据库的 XML 全文检索 |
第一节 引言 |
第二节 相关工作 |
5.2.1 纯 XML 数据库 |
5.2.2 支持 XML 存储的关系数据库 |
第三节 ReXFT: 基于关系数据库的 XML 全文检索总体架构 |
第四节 基于关系数据库的 XML 数据存储与全文索引 |
5.4.1 NXRel: 基于关系的 XML 数据存储 |
5.4.2 XML 数据索引 |
5.4.3 XML 全文索引 |
第五节 XML 全文检索语法语义 |
5.5.1 基本检索单元 |
5.5.2 词频筛选 |
5.5.3 匹配选项 |
5.5.4 逻辑操作符 |
5.5.5 位置过滤器 |
第六节 XML 全文检索执行方案 |
第七节 XML 全文检索结果计分 |
5.7.1 相关概念 |
5.7.2 基于覆盖密度的检索结果计分 |
第八节 实验结果及分析 |
5.8.1 XML 全文检索功能覆盖 |
5.8.2 实验环境与数据集 |
5.8.3 检索效率 |
第九节 本章小结 |
第六章 总结与展望 |
第一节 研究内容总结 |
第二节 创新点和主要贡献 |
第三节 研究内容展望 |
参考文献 |
致谢 |
基本信息 |
教育背景 |
获奖情况 |
攻读博士学位期间发表论文 |
攻读博士学位期间参与的科研项目 |
攻读博士学位期间其他研究成果 |
(5)XML柔性查询技术的研究(论文提纲范文)
摘要 |
Abstract |
第一章 绪论 |
1.1 研究背景与动机 |
1.2 国内外相关研究的现状与分析 |
1.2.1 查询松弛技术的研究 |
1.2.2 偏好查询技术的研究 |
1.2.3 查询结果排序技术的研究 |
1.2.4 近似查询技术的研究 |
1.2.5 模糊查询技术的研究 |
1.3 研究目标与意义 |
1.4 本文工作 |
1.4.1 研究内容 |
1.4.2 论文的组织结构 |
第二章 基础理论和相关技术 |
2.1 XML数据库概述 |
2.2 XML数据模型 |
2.3 XML模式 |
2.3.1 DTD |
2.3.2 XML Schema |
2.4 XML查询语言 |
2.4.1 XPath查询语言 |
2.4.2 XQuery查询语言 |
2.5 相关算法和技术 |
2.5.1 关联规则挖掘算法 |
2.5.2 查询历史记录 |
2.5.3 Top-k排序算法 |
2.6 实验测试集和评价指标 |
2.6.1 测试数据集 |
2.6.2 评价指标 |
2.7 本章小结 |
第三章 基于XML的上下文偏好 |
3.1 引言 |
3.2 上下文建模 |
3.2.1 上下文的相关定义 |
3.2.2 上下文的层级结构 |
3.3 上下文偏好 |
3.3.1 XML上下文偏好模型 |
3.3.2 上下文偏好的存储 |
3.3.3 构建兴趣树的预处理方法 |
3.3.4 上下文偏好查询 |
3.4 松弛上下文偏好 |
3.4.1 松弛上下文操作 |
3.4.2 松弛上下文偏好算法 |
3.5 基于上下文偏好的关联规则挖掘方法 |
3.6 效果与性能实验评价 |
3.6.1 实验环境 |
3.6.2 兴趣树的可用性评测 |
3.6.3 构建兴趣树的预处理方法的效果测试 |
3.6.4 松弛上下文偏好算法的效果测试 |
3.6.5 响应时间测试 |
3.7 本章小结 |
第四章 基于结构偏好松弛和内容偏好打分的查询结果排序方法 |
4.1 引言 |
4.2 XML结构偏好 |
4.2.1 一个XML文档的实例 |
4.2.2 显式偏好和隐式偏好 |
4.2.3 XML结构偏好的定义 |
4.3 基于结构偏好的XML查询松弛方法 |
4.4 计算内容偏好的兴趣度得分 |
4.5 基于内容偏好的XML多查询结果排序方法 |
4.5.1 聚类兴趣度的得分 |
4.5.2 上下文状态的相似性 |
4.5.3 聚类融合算法 |
4.5.4 有代表性的聚类排列算法 |
4.5.5 Top-k排序算法 |
4.6 效果与性能实验评价 |
4.6.1 实验环境 |
4.6.2 查询松弛与结果排序方法的响应时间测试 |
4.6.3 有代表性聚类排列数的改变对Top-k排序算法性能的影响 |
4.6.4 返回Top-k个查询结果的执行时间测试 |
4.6.5 查询松弛方法的查全率测试 |
4.6.6 查询结果排序方法的查准率测试 |
4.7 本章小结 |
第五章 基于结构和内容的XML模糊查询扩展方法及其代数操作 |
5.1 引言 |
5.2 模糊集基本理论 |
5.2.1 模糊集的定义 |
5.2.2 模糊集相关基本概念 |
5.2.3 模糊集的运算及性质 |
5.3 模糊查询的相关定义 |
5.3.1 模糊查询的定义 |
5.3.2 模糊基本查询条件 |
5.4 基于结构和内容的XML模糊查询扩展方法 |
5.4.1 两个XML片段 |
5.4.2 XPath查询语言的模糊扩展方法 |
5.5 基于代数操作的XML模糊查询方法 |
5.5.1 模糊代数操作 |
5.5.2 用户自定义的查询权重 |
5.5.3 基于模糊代数操作的查询结果评估 |
5.6 本章小结 |
第六章 XML模糊查询松弛与结果排序方法 |
6.1 引言 |
6.2 XML模糊查询松弛 |
6.3 XML属性节点和模糊关系的相关度计算方法 |
6.3.1 扩展的向量空间模型 |
6.3.2 模糊查询相关度得分阈值的计算方法 |
6.4 模糊查询结果的排序方法 |
6.4.1 半结构数据的PIR排序方法 |
6.4.2 基于查询历史记录的PIR排序方法 |
6.4.3 改进的PIR方法排序模糊查询结果 |
6.4.4 模糊查询结果的Top-k排序方法 |
6.5 效果与性能实验评价 |
6.5.1 实验环境 |
6.5.2 模糊查询松弛与结果排序方法的响应时间测试 |
6.5.3 排序方法的查准率和查全率测试 |
6.5.4 不同排序方法的Top-k查准率测试 |
6.6 本章小结 |
第七章 结束语 |
7.1 本文的主要贡献与结论 |
7.2 未来的研究工作 |
参考文献 |
致谢 |
攻博期间参加的科研项目 |
攻读博士期间发表的论文 |
(6)基于XML模式的查询优化技术研究与实现(论文提纲范文)
摘要 |
Abstract |
第1章 绪论 |
1.1 研究背景及意义 |
1.2 本文的主要工作及章节安排 |
第2章 XML数据库技术综述 |
2.1 引言 |
2.2 XML查询语言 |
2.2.1 XPath |
2.2.2 XQuery |
2.3 XML数据模型和XML 代数 |
2.3.1 文档对象模型:DOM |
2.3.2 XML代数 |
2.4 XML数据库的关键技术 |
2.4.1 存储机制 |
2.4.2 查询处理 |
2.4.3 索引技术 |
2.5 XML数据库的发展趋势 |
2.6 本章小结 |
第3章 XML查询优化技术概述 |
3.1 引言 |
3.2 逻辑优化 |
3.2.1 XPath 路径表达式的最小化 |
3.2.2 基于模式信息的查询冗余消除 |
3.3 物理优化 |
3.3.1 面向节点的统计概要结构 |
3.3.2 面向路径的概要结构 |
3.4 查询处理核心操作 |
3.4.1 结构连接 |
3.4.2 模式树匹配 |
3.4.3 基于缓存的查询处理 |
3.5 本章小结 |
第4章 基于模式信息和代价估算的XPath结构连接优化 |
4.1 引言 |
4.2 基于层次编码的选择度估算 |
4.2.1 层次编码定义 |
4.2.2 节点包含关系测试 |
4.2.3 路径表达式选择度估算 |
4.3 结构连接顺序优化算法 |
4.3.1 查询代价矩阵 |
4.3.2 最优连接顺序的求解过程 |
4.3.3 查询计划树重构 |
4.4 基于模式信息的改进算法 |
4.4.1 XML模式 |
4.4.2 基于模式信息的改进算法 |
4.5 算法复杂度分析及决策因子 |
4.6 本章小结 |
第5章 查询优化算法在XSQS 中的实现 |
5.1 引言 |
5.2 XSQS 系统简介 |
5.3 XSQS 的查询处理流程 |
5.3.1 查询解析 |
5.3.2 查询执行 |
5.3.3 结果重构与返回 |
5.4 查询优化模块设计 |
5.5 性能测试及实验结果分析 |
5.5.1 测试用例与实验环境 |
5.5.2 实验结果及分析 |
5.6 本章小结 |
结论 |
参考文献 |
攻读硕士学位期间取得的研究成果 |
致谢 |
(7)关系-XML无缝集成数据库系统中关键字查询技术的研究与实现(论文提纲范文)
摘要 |
Abstract |
第1章 绪论 |
1.1 研究内容背景 |
1.2 研究内容的目的和意义 |
1.3 主要研究内容 |
1.4 本文的组织结构 |
第2章 相关研究工作 |
2.1 XML相关概念及技术 |
2.1.1 XML简介及标准 |
2.1.2 Dewey编码 |
2.2 XML关键字查询相关技术 |
2.2.1 倒排索引技术 |
2.2.2 结构查询语言 |
2.2.3 关键字查询算法 |
2.3 CoSQLRX数据库管理系统 |
2.3.1 PostgreSQL系统 |
2.3.2 CoSQLRX系统 |
2.4 本章小结 |
第3章 XML关键字查询处理的设计 |
3.1 基本思想 |
3.2 CoSQLRX系统XML关键字索引结构 |
3.2.1 XmlInfoRelation表结构 |
3.2.2 倒排索引 |
3.3 XML关键字查询执行策略 |
3.3.1 关键字查询 |
3.3.2 结构查询 |
3.4 全文检索结果的评分算法 |
3.5 本章小结 |
第4章 XML关键字查询处理的实现 |
4.1 XML关键字查询实例 |
4.1.1 XML文档及其存储 |
4.1.2 XML关键字查询实例 |
4.2 XML关键字查询的处理过程 |
4.2.1 查询信息的提取 |
4.2.2 查询条件判断 |
4.2.3 查询结果的返回 |
4.3 XML文档索引更新 |
4.4 本章小结 |
第5章 实验与性能分析 |
5.1 实验环境 |
5.1.1 测试平台 |
5.1.2 测试数据集 |
5.2 实验及结果分析 |
5.2.1 实验设置 |
5.2.2 索引和扫描 |
5.2.3 关键字查询算法 |
5.3 本章小结 |
第6章 总结与展望 |
6.1 内容总结 |
6.2 未来展望 |
参考文献 |
致谢 |
攻读硕士期间参加的项目和申请的专利 |
(8)基于XML模式的异构数据集成中间件研究(论文提纲范文)
中文摘要 |
英文摘要 |
1 绪论 |
1.1 课题的背景及研究意义 |
1.1.1 问题的提出 |
1.1.2 研究的意义 |
1.2 国内外研究现状 |
1.2.1 异构数据集成的研究现状 |
1.2.2 中间件技术的研究现状 |
1.3 论文研究的主要内容及组织 |
2 相关技术概述 |
2.1 中间件概述 |
2.1.1 中间件由来 |
2.1.2 中间件的定义 |
2.1.3 中间件的特点及分类 |
2.2 XML 相关知识 |
2.2.1 XML 简介 |
2.2.2 有效性验证—XML Schema |
2.2.3 XML 编程接口 |
2.3 XQuery 技术概述 |
2.3.1 XQuery 的能力 |
2.3.2 XQuery 的用途 |
2.3.3 处理方案 |
2.4 JDBC 和数据库元数据 |
2.4.1 JDBC 简介 |
2.4.2 元数据与数据集成 |
2.5 本章小结 |
3 异构数据集成中间件 HDAM 设计 |
3.1 现有数据集成方案分析 |
3.2 中间件体系结构 |
3.2.1 中间件HDAM 架构 |
3.2.2 HDAM 运行流程 |
3.3 数据源注册接口设计 |
3.3.1 数据源分类 |
3.3.2 注册接口设计 |
3.4 虚拟数据库的构建 |
3.4.1 数据源本地模式获取 |
3.4.2 局部视图的构建 |
3.4.3 构建虚拟数据库 |
3.5 查询处理模块 |
3.5.1 用户查询语言选择 |
3.5.2 查询接口设计 |
3.5.3 查询语句处理 |
3.6 数据动态处理操作 |
3.7 本章小结 |
4 HDAM 关键技术与重点算法设计 |
4.1 数据操作算法 |
4.1.1 查询语句分解 |
4.1.2 数据库SQL 差异性处理 |
4.2 XML 数据的查询 |
4.2.1 方案选择 |
4.2.2 SQL 转换为XQuery |
4.2.3 参数处理 |
4.2.4 查询语句优化 |
4.2.5 非结构化数据处理 |
4.3 查询结果处理模块 |
4.3.1 结果转换 |
4.3.2 结果合并 |
4.4 本章小结 |
5 中间件的实现与测试 |
5.1 中间件的实现 |
5.1.1 虚拟数据库 |
5.1.2 数据操作部分 |
5.2 中间件HDAM 测试 |
5.2.1 单元测试 |
5.2.2 集成测试 |
5.3 本章小结 |
6 总结与展望 |
6.1 总结 |
6.2 后续研究展望 |
致谢 |
参考文献 |
附录 |
(9)XML数据编码与存储管理关键技术研究(论文提纲范文)
摘要 |
Abstract |
第一章 绪论 |
第一节 研究背景 |
第二节 研究内容及意义 |
1.2.1 本文的研究内容和创新点 |
1.2.2 研究的理论和实际意义 |
第三节 论文结构 |
第二章 XML数据管理的研究基础 |
第一节 相关的XML知识 |
2.1.1 XML文档结构 |
2.1.2 XML模式语言 |
2.1.3 XML数据模型 |
2.1.4 XML查询语言 |
2.1.5 XML应用程序接口 |
第二节 XML数据库的相关研究 |
2.2.1 XML与数据库的对比 |
2.2.2 XML与关系数据库 |
2.2.3 原生XML数据库 |
第三节 XML数据挖掘的相关研究 |
2.3.1 XML数据挖掘的概念与分类 |
2.3.2 XML数据挖掘的主要方法 |
2.3.3 XML相似性度量 |
第四节 本章小结 |
第三章 动态XML节点编码方案 |
第一节 节点编码的特点 |
第二节 XML节点编码的现状 |
3.2.1 基于区间的编码方案 |
3.2.2 基于前缀的编码方案 |
3.2.3 素数编码方案 |
第三节 BSC编码方案 |
3.3.1 基本定义 |
3.3.2 BSC编码的原语 |
3.3.3 基本索引驱动的XPath表达式求值 |
第四节 BSC编码的串行化 |
3.4.1 固定长度的串行化 |
3.4.2 使用长度域的串行化 |
3.4.3 使用分隔符的串行化 |
3.4.4 使用前缀特性的串行化 |
3.4.5 串行化空间效率比较 |
3.4.6 BSC编码占用存储空间分析 |
第五节 实验结果 |
3.5.1 真实数据集下的编码长度比较 |
3.5.2 节点数对编码时间和空间的影响 |
3.5.3 散出度对编码时间和空间的影响 |
3.5.4 深度对编码时间和空间的影响 |
3.5.5 实验结果分析 |
第六节 本章小结 |
第四章 XML数据的编码与存储 |
第一节 二进制XML格式 |
第二节 XML数据编码存储的现状与趋势 |
4.2.1 XML数据的编码技术 |
4.2.2 XML数据的存储方案 |
4.2.3 XML编码存储的对比与趋势 |
第三节 XML数据逻辑模型 |
第四节 XML数据编码 |
4.4.1 符号表与多字节整数 |
4.4.2 XML数据编码概述 |
4.4.3 二进制XML的扩展BNF定义 |
第五节 独立的原生XML存储方案 |
4.5.1 节点记录格式 |
4.5.2 分页文件组织 |
4.5.3 索引框架 |
4.5.4 更新策略 |
第六节 基于关系的原生XML存储方案 |
4.6.1 XML数据模型与关系模型的差异 |
4.6.2 基于关系的XML文档存储与发布 |
4.6.3 更新策略 |
第七节 实验结果 |
4.7.1 实验环境与数据集 |
4.7.2 存储和发布效率 |
4.7.3 索引效率 |
第八节 本章小结 |
第五章 XML文档相似性度量 |
第一节 XML文档相似性度量的相关研究 |
5.1.1 基于树形结构的相似性度量 |
5.1.2 基于频繁路径的相似性度量 |
第二节 基于约束集合的相似性度量 |
5.2.1 基本定义 |
5.2.2 集合度量方法 |
第三节 加权双向路径约束的相似性度量 |
5.3.1 双向路径约束模型 |
5.3.2 路径约束相似性度量 |
5.3.3 XML文档相似性度量 |
第四节 实验结果 |
5.4.1 实验环境和数据集 |
5.4.2 算法的聚类效果对比 |
第五节 本章小节 |
第六章 总结与展望 |
第一节 论文研究内容总结 |
第二节 主要成果与创新点 |
第三节 研究内容展望 |
参考文献 |
致谢 |
个人简历 |
攻读博士学位期间发表论文 |
攻读博士期间参与的科研项目 |
攻读博士期间申请专利与研究成果 |
(10)基于关系数据库的XML存储、查询与重构(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 研究背景和意义 |
1.2 国内外研究现状 |
1.2.1 纯XML 数据库系统 |
1.2.2 XML-enabled 数据库系统 |
1.2.3 商业数据库对XML 的支持 |
1.3 本文研究内容和组织结构 |
第二章 XML 相关标准和技术 |
2.1 引言 |
2.2 XML 推荐标准 |
2.2.1 XML 标准 |
2.2.2 XML 语法 |
2.2.3 XML 模式 |
2.2.4 XML 查询语言 |
2.2.5 XML 解析技术 |
2.3 XML 编码技术 |
2.3.1 全局编码 |
2.3.2 局部编码 |
2.3.3 dewey 编码 |
2.3.4 PBiTree 编码 |
2.4 本章小结 |
第三章 X2R 系统概要 |
3.1 需求分析 |
3.1.1 电子商务对数据管理的需求 |
3.1.2 XML 存取系统需求分析 |
3.2 X2R 总体设计 |
第四章 模式映射和文档映射 |
4.1 引言 |
4.2 改进的共享内联技术 |
4.2.1 DTD 简化规则 |
4.2.2 创建DTD 图和内联DTD 图 |
4.2.3 生成关系模式和σ映射 |
4.2.4 讨论 |
4.3 基于PBiTree 编码的文档映射算法SAXDocMap |
4.4 本章小结 |
第五章 查询映射与XML 重构 |
5.1 引言 |
5.2 查询映射 |
5.2.1 路径匹配 |
5.2.2 查询转换 |
5.3 XML 重构技术 |
5.3.1 生成结构编码序列 |
5.3.2 文档重构 |
5.4 本章小结 |
第六章 实验结果及分析 |
6.1 实验环境 |
6.2 X2R 测试 |
6.2.1 模式映射测试 |
6.2.2 文档映射测试 |
6.2.3 X2R 查询测试 |
6.3 本章小结 |
第七章 结论 |
7.1 全文总结 |
7.2 工作展望 |
致谢 |
参考文献 |
四、基于关系数据库的XML查询效率测试方法(论文参考文献)
- [1]基于Spark的会话语料库管理系统[D]. 王松. 河北师范大学, 2020(07)
- [2]模糊XML数据存储与查询技术的研究[D]. 刘健. 东北大学, 2014(03)
- [3]外包数据库机密性保护技术研究[D]. 杨刚. 解放军信息工程大学, 2013(02)
- [4]XML信息检索关键技术研究[D]. 温延龙. 南开大学, 2012(06)
- [5]XML柔性查询技术的研究[D]. 闫威. 东北大学, 2012(07)
- [6]基于XML模式的查询优化技术研究与实现[D]. 邝子民. 华南理工大学, 2011(12)
- [7]关系-XML无缝集成数据库系统中关键字查询技术的研究与实现[D]. 赵利. 东北大学, 2011(07)
- [8]基于XML模式的异构数据集成中间件研究[D]. 张永祥. 重庆大学, 2011(01)
- [9]XML数据编码与存储管理关键技术研究[D]. 汪陈应. 南开大学, 2010(07)
- [10]基于关系数据库的XML存储、查询与重构[D]. 周士钦. 电子科技大学, 2010(03)