浅谈几种空间数据的索引原则

一、浅谈几种空间数据的索引原理（论文文献综述）

孟天杭^[1]（2021）在《基于Cesium的大规模三维场景瓦片构建与可视化》文中研究说明近年来,随着无人机、三维激光扫描等数据采集技术的发展,有效降低了三维空间数据的获取成本和时间周期,提高了数据精度。然而随着大规模三维空间数据的不断积累,三维空间数据如何在B/S下高效地发布、传输、可视化和分析成为一个亟待解决的问题。随着WebGL与Web开发技术的发展,产生了众多的三维可视化框架,Cesium作为目前性能优异的三维可视化框架之一,它能够在三维虚拟地球场景中添加丰富多样的地理要素。Cesium团队设计并研发了3D Tiles数据结构,便于海量三维空间数据的网络传输与渲染。虽然它是开源的一套规范,但是如何去生成3D Tiles,官方并没有给出合理的解决方案。当然,AGI公司开源了部分3D Tiles处理工具,在倾斜摄影数据方面已经能很好地进行处理,但在人工大模型和点云方面还没有很好地解决方案。本文通过详细研究Cesium框架与3D Tiles数据规范,提出了一种大规模三维场景瓦片构建的解决方案,并对海量三维空间数据的可视化做了相关研究,主要包括以下工作:1.对目前比较流行的几种三维瓦片数据规范进行了概括总结,并对近年来三维瓦片构建技术以及基于Cesium的可视化研究做了相关介绍。2.对Cesium的体系架构、3D Tiles渲染调度相关类进行了阐述。详细研究了gl TF模型数据格式,包括gl TF节点组织、数据访问规则以及二进制形式glb文件结构等。对3D Tiles的定义内容进行详细解析,包括瓦片数据常用的几种数据格式以及瓦片集数据各属性之间的关系和含义。3.对三维瓦片构建相关技术进行研究。提出了一种基于八叉树的三维场景分割算法,并对分割完的场景进行网格简化或点云抽稀过程,从而生成具有多细节层次的场景散列文件。并根据3D Tiles数据规范,对散列文件进行数据格式转换生成3D Tiles的瓦片数据,介绍了3D Tiles瓦片集数据中可以使用的几种空间索引结构以及适用条件,并采用八叉树空间索引结构生成3D Tiles的索引文件,最终生成具有多细节层次的3D Tiles三维瓦片数据结构。4.海量三维空间数据可视化技术研究。对Cesium场景裁剪技术进行了研究,通过背面裁剪和视景体裁剪先剔除不可见的瓦片数据。根据瓦片的空间几何误差计算屏幕空间误差SSE,并依据Cesium的LOD调度策略选择满足条件的瓦片。依据Cesium四叉树调度渲染原理,提出了基于八叉树的海量三维空间数据调度算法,通过使用跳跃式加载、动态屏幕空间误差、控制请求文件队列数量来提高渲染速度,降低了Cesium面对大规模三维空间数据的渲染压力。5.可视化平台搭建。为验证本文相关算法,设计并研发了基于Cesium的WebGIS可视化平台。系统采用前后端分离的方式,前端采用Vue和Cesium集成构成客户端部分。服务端采用Node JS来进行系统发布、数据发布、处理请求、操作数据库等。数据库采用My SQL关系型数据库,对瓦片属性信息进行存储,方便属性信息管理。结合Cesium相关空间分析功能,设计了地图显示、数据可视化、数据分析功能等模块,并进行了相关功能的测试,满足了项目需求,验证了本文相关方法的有效性。

李旸^[2]（2021）在《基于多层Voronoi图索引的城市地质环境空间数据高效查询技术研究》文中指出空间数据引擎是城市地质环境空间数据管理系统的关键核心部件之一,其功能主要是为城市地质环境时空透视和智能管控相关应用提供动态高效的空间数据存储与查询服务。其中空间数据索引的结构与基于空间索引实现的各种空间查询算法对空间数据引擎的整体性能起着关键性作用。城市地质环境空间数据具有体量大、多维度、空间分布不均匀和几何形态复杂等特征,基于这些特征目前已有的空间索引与空间查询技术在实际应用中尚存在着以下几个问题:（1）在空间数据索引方面,主流空间索引结构（如R-tree和VoRtree）无法满足对大规模、分布不均匀的地质环境空间数据的高效访问需求;（2）在面向空间分析应用的空间查询方面,基于空间近似性的查询算法（比如性能领先的反向k近邻问题SLICE算法）无法实现大规模查询场景下的快速响应,因此无法有效支持实际应用中的空间插值分析;（3）在基于边界约束的空间查询方面,现有空间区域查询算法（如Oracle Spatial PIP算法）在运行的过程中存在候选集有效命中率较低、冗余空间计算量大的问题,在面对几何形态不规则的区域查询时,难以快速的返回查询结果。针对上述问题本文开展了以下3个方面的研究工作:（1）研究设计支持空间数据高效检索的新型空间索引结构;（2）研究提出面向城市地质环境数据的高性能空间查询方法;（3）研发基于新型空间索引结构和空间查询方法的空间数据引擎建并开展应用示范。基于这些研究工作本文所取得的研究成果主要表现在以下4个方面:（1）通过逐层抽稀构建Voronoi图的方式,设计提出了一种多层Voronoi图结构的空间索引MVD（Multi-layer Voronoi Diagrams）;基于MVD索引提出了一种名为MVD-NN的最近邻查询方法,并且借助VR-kNN的设计思想以MVD-NN算法为扩展实现了kNN查询方法MVD-kNN。（2）利用圆、椭圆和双曲线三种典型圆锥曲线的特性,设计提出了一种利用已验证的数据点来辅助验证其它数据点的RkNN验证方法CSD（Conic Section Discriminance）;并利用Voronoi图实现了一种候选集规模比已有算法更低的候选集产生方法;最终将上述的RkNN验证方法和候选集产生方法组合形成一种名为CSD-RkNN的新型RkNN查询算法。（3）利用数据点构成的Voronoi图,根据数据点与查询区域的空间拓扑关系将所有的数据点进行分类,定义了边界点、内部点、外部点、边界邻居点、绝对内部点和绝对外部点等几种不同类别点的概念,根据不同类别点之间在Delaunay图上的连通性,设计提出了一种通过识别边界点来降低冗余I/O和冗余空间关系计算的新型空间区域查询方法。（4）基于提出的索引结构和空间查询方法设计了一套空间数据管理解决方案,并根据该方案开发实现了一套支持NN、kNN、Bi-RkNN、Mono-RkNN、Region和Buffer等空间查询功能的城市地质环境空间数据服务引擎。该数据服务引擎以Geo JSON为空间对象承载格式,通过Web Service方式发布数据服务,同时支持本地存储和HDFS分布式存储两种存储模式,具有良好的可扩展性。基于深圳市全市分布的3万余条地质钻孔数据和14万余条地面POI数据,开展了面向地质环境空间数据管理与查询的示范应用,取得了良好的应用效果,验证了本文方法的有效性。本文的创新点主要体现在以下3个方面:（1）设计提出的MVD索引摒弃了主流空间索引所采用的树形结构,而是采用一种多层网络结构,规避了树形索引的节点失衡问题和节点重叠问题,所以在其基础上实现的最近邻查询算法（MVD-NN）在I/O性能和运行效率方面均优于目前R-tree族索引上性能最优的最近邻查询算法（BFS）。（2）提出的CSD-RkNN算法利用Voronoi图的相关特性缩减了候选集的规模,并通过圆锥曲线判别法（CSD）提升了大部分候选对象的验证效率,所以其I/O性能和查询效率均优于目前最先进的RkNN算法（SLICE）。（3）提出的BPI-Region算法利用了查询区域边界点（即Voronoi单元与查询区域边界相交的数据点）将查询区域的内部点和外部点隔离成两个在Delaunay图上互不连通点集合,从而避免了绝大部分内部点的冗余空间验证和外部点的冗余访问,所以该算法的I/O性能和查询效率均优于目前R-tree族索引上最优的区域查询算法（Ocracle Spatial PIP）。

蒋叶林^[3]（2021）在《基于HBase数据库的时空大数据存储与索引研究》文中研究指明随着互联网、PC技术、传感器技术的不断发展与普及,越来越多的高水平技术和多领域的应用都会涉及地理信息数据,例如数字城市,智慧城市,地图导航等。在信息化世界呈现多元化的同时,随着用户的需求以及对数据的精准性的追求不断变高,数据量也呈显出大幅度增加,所以如何高效的组织和管理海量空间数据是十分重要的问题。随着云计算技术的诞生,使得对海量数据的快速存储与高效计算得以实现。本研究重点研究了基于不同预区下使用Spark技术框架进行分布式存储,以及在Hilbert曲线编码的原有基础上进行了改进,提出了一种多层级自适应的Hilbert曲线编码。并对该方式存储在Hbase数据库中的数据建立二级索引表对数据进行检索。研究具体如下:（1）本文首先对研究背景、现状和研究依据做了详细的阐述,并对本文研究的相关技术与理论做了详细的介绍。在此基础上详细地分析了本研究对海量数据存储以及索引的可行性,并为后续研究提供了必要的理论与技术支持。（2）在大数据整体架构的特点上,结合时空数据的聚集性的特点,分析了常见的数据划分曲线的优劣性,在此详细阐述下,本文的创新之处在于对基于Hilbert曲线传统编码的方式进行了改进,设计了一种各层级自适应的Hilbert编码方式包括分级码与排序码,并结合这种编码方式以及时空数据的特性,在对Hbase数据库Rowkey设计以及列族与预分区的设计基础上,分别比较在单个预分区下2W、20W、100W、500W、1000W、1500W、2000W数据量的存储效率与在10、51（根据官方提供的公式计算）、100个预分区情况下对10W、100W、500W、1000W数据量下存储的效率是否呈一定的规律且检测是否官方提供的公式计算的预分区为最佳预分区数。实验表明:在相同数据量下,并不是预分区数越多则存储效率越高,没有呈现一定的规律,且根据官方提供的预分区公式计算并不是最佳预分区数。（3）最后,本文采用了具有100W数据量的数据库来作为查询的根据Hbase的特点,结合了Phoenix来对时空数据进行二级索引表的建立,并实现对数据属性的查询,并比较了有无索引表对数据查询的效率。实验表明,有索引表的检索效率明显高于无索引表的检索效率。而对于时空范围的查询,本文是基于底层的Filter的过滤器与Spark技术框架相结合来做的精确的时空范围查询和建立索引表的时空范围查询以及Geo Mesa系统作比较,证明本文关键技术研究的可行性和有效性。实验表明,该Hilbert曲线编码改进算法与基于索引表的时空范围查询算法结合的查询效率较Geomesa在本实验中提高了约16%-26%,较无索引表的算法的查询效率提高了约45-240倍。

王久旺^[4]（2020）在《空间加密数据库关键技术研究》文中指出近年来随着带位置感知能力智能设备的广泛应用,含地理空间信息的数据以前所未有的速度迅速增长,空间大数据时代已经来临。空间数据具有数据量大、数据种类多等典型的大数据特点,中小企业为了减少自己的数据管理成本,往往选择将空间大数据托管到第三方的云平台上。为了防止云存储服务商泄漏数据,可以在云平台上基于加密数据库存储加密后的空间数据,直接在加密数据上进行查询运算,只有数据托管用户可以对查询结果进行解密。但是目前以CryptDB为代表的传统加密数据库仅支持在关系型加密数据上进行运算,不支持在空间加密数据上进行空间查询等操作。针对上述问题,本文在CryptDB的基础上进行改进使其支持空间数据类型,实现了对空间加密数据的存储、索引和查询等空间操作,将其进一步完善为了较完备的空间加密数据库原型系统。本文主要工作如下:（1）空间加密数据范围查询算法的设计与实现。本文实现了两种空间加密数据范围查询算法:Geohash-OPE和FastGeo。Geohash-OPE算法由本文自行设计,首先使用Geo Hash编码对空间点数据建立空间索引,之后通过顺序保留加密算法对Geo Hash值进行加密,最后基于加密后的Geo Hash值实现范围查询;FastGeo算法参考了论文[5]中的设计思想,首先使用加密算法AES-CBC-256和SSW算法分别对空间点数据进行加密,之后将加密后的空间点数据组织成类似于hash表形式的二级索引,通过此hash表减少查询过程中需要筛查的点的数量,提高范围查询效率。（2）空间加密数据KNN查询算法的设计与实现。本文也实现了两种对空间加密数据进行KNN查询的算法,两种KNN查询算法初始执行时均通过圆形扩张的方式将KNN查询转换为范围查询,之后分别使用上述两种不同的范围查询算法实现KNN查询的功能。（3）CryptDB中集成空间加密数据查询算法的设计与实现。在CryptDB原有功能的基础上,将本文实现的两种对空间加密数据进行范围查询和KNN查询的算法集成进CryptDB当中,使得应用层可以方便地对CryptDB中的空间加密数据进行存储和查询操作。最后,本文在虚拟机中搭建了原型系统,采用空间随机点数据集,进行了空间数据录入性能测试、空间加密点数据范围查询算法和KNN查询算法性能测试,并将实验结果与My Sql在明文空间点数据下的范围查询与KNN查询性能测试结果进行了对比。实验结果表明,本文实现的空间加密数据库原型系统达到了预期的设计目标,可以满足实际应用中大部分场景的需求。

聂沛^[5]（2020）在《空间数据分布式存储与并行处理方法研究及其在林业领域的应用》文中研究表明森林资源涉及的一系列环节都离不开客观、现实、准确的数据,然而,传统的森林资源监测和调查方法已不能满足快速准确的数据需求,3S与计算机技术等现代化的分析管理技术在森林调查管理上扮演着愈发重要的作用。随着3S技术的快速发展,全球每天都在集成大量的空间数据,地理空间大数据时代已经到来,对海量空间数据进行高效组织存储及快速处理成为研究热点,遥感影像及空间矢量作为典型的空间数据,已被广泛应用于林业、军事、测绘、交通等领域,许多研究者对这两种空间数据展开分布式存储与并行处理研究,取得了一定的成果,但在当前研究中,没有很好地结合数据特性设计存储结构,更鲜有在优化存储的基础上加速并行处理,因而当面向体量更大的数据及实时性要求更高的应用时,当前研究将到达瓶颈。本文针对遥感影像及空间矢量数据在分布式存储以及并行处理研究中的不足之处,基于大数据云计算技术,开展遥感影像及空间矢量数据分布式存储与并行处理方法研究,提出了高效快速的空间数据存储模型及并行处理方法,并设计实现了数据存储到处理的接口,最后将研究成果应用到林业领域,并行反演森林植被覆盖度。本文研究内容如下:（1）研究遥感影像分布式存储模型。为解决当前存储系统层次复杂、分块策略固定等问题,基于HDFS设计实现一种高效的面向遥感影像分布式存储模型-MapImage,模型存储充分考虑影像像元数据、影像金字塔、元数据之间的联系,同时针对处理算法访问特性,提供按波段、按矩形块、按行、按列的数据分片策略以供选择,提高了系统的可用性。（2）研究空间矢量数据分布式存储模型。当前的存储模型数据访问I/O延时大,且没有考虑矢量瓦片金字塔及其元数据,为解决上述问题,基于内存分布文件系统Alluxio设计实现一个兼容矢量瓦片金字塔的内存级矢量分布式存储模型-VectorTileStore,模型支持矢量瓦片及其元数据的存储,存储时对数据进行网格索引,从而提供内存级快速数据访问接口。（3）研究空间数据并行处理方法。为加速空间数据处理,开展空间数据并行处理研究,首先对于数据金字塔构建耗时这一问题,利用Spark进行影像金字塔和矢量瓦片金字塔的并行构建及并行载入分布式存储模型;接着针对分布式存储模型的特点,设计实现相应的并行输入格式,基于并行输入格式,Spark按需读取存储模型,过滤与算法无关的数据,加速并行处理,本文实现了空间矢量并行查询算法和遥感影像并行镶嵌算法。（4）设计实现空间数据分布式存储与并行处理接口。在空间数据分布式存储模型及并行处理研究基础上,设计实现遥感影像及空间矢量存储、访问、处理接口,阐述接口使用规则,形成一个从空间数据分布式存储到并行处理的通用框架。（5）研究植被覆盖度遥感并行反演方法。在提出的遥感影像分布式存储模型及并行处理方法基础上,结合植被覆盖度反演的理论与方法,以东北林业大学帽儿山林场MODIS影像为研究对象,并行反演森林植被覆盖度,提升反演时间效率。通过研究及实验分析表明,本文开展的空间数据分布式存储与并行处理方法研究,能有效结合分布式存储、并行计算技术理论与方法,实现遥感影像及空间矢量数据的分布式存储与并行处理,较现有研究具有明显优势,其中MapImage存取效率提升25.4%及36.9%,VectorTileStore存取效率提升11.4%及40.6%。最后将研究成果应用到林业领域,开展森林植被覆盖度遥感并行反演研究,提供一个新的林业信息化解决方案。

刘峰^[6]（2019）在《高精度惯性定位定向/地图信息匹配导航技术研究》文中提出经典的陆用定位导航技术,如惯性导航以及惯性与里程信息、地标信息、零速停车信息、卫星信息的组合导航技术等,在满足长时间大范围工作情况下机动、快速、自主导航定位的作战使用需求时,都有着各自的技术缺陷。为了突破陆用导航领域传统技术方案,本文对高精度惯性定位定向地图信息匹配导航技术进行研究,提出了采用地图匹配辅助惯性定位定向方法,提高长航时大半径情况下的自主定位精度,对提升快速自主精确能力并降低保障要求与成本具有重要意义。论文的主要研究内容包括:1.针对军用国产化的嵌入式平台资源、性能特点,及数字矢量地图路网的数据结构,提出了一种适用于嵌入式导航计算机的自主可控空间索引方法——基于空间网格的Hilbert-R树索引方法。解决了相关技术依靠国外软件二次开发平台的问题,实现了海量数字矢量地图快速索引。经验证,该索引方法较普通遍历搜索方法索引效率提高80%以上。2.针对数字地图路网结构的特点和地图匹配的难点,提出了一种基于计算几何理论的惯性定位定向系统行驶轨迹与数字地图道路几何特性的“线到线”型地图匹配方法。实现了基于定位定向信息的路径匹配,有效解决了道路纵向匹配误差得不到有效抑制的技术难题,具有较高的准确性和鲁棒性。3.通过分析惯性导航力学编排和误差原理,提出了一种自主可控的惯性/里程计/地图匹配组合导航方案,建立精确的误差模型,采用滤波技术进行信息融合,利用地图匹配导航结果提高惯性定位定向系统自主定位精度。经验证,利用地图匹配信息修正惯性定位定向系统在长航时、大作战半径情况下可将定位误差控制在45m以内。4.针对惯性定位定向系统可用的嵌入式系统的硬件资源、运算处理能力有限的问题,提出了一种基于嵌入式系统的软硬件平台实现方案。完成了硬件系统、软件架构工程设计,具备在有效的资源中实现地图动态分块动态加载、道路检索、匹配解算、惯性定位定向/地图信息匹配融合与非道路行驶识别等功能,并在惯性定位定向系统中首次实现惯性定位定向/地图匹配导航技术工程应用。

胡玉龙^[7]（2017）在《云环境下城市短时交通流预测关键技术研究》文中研究说明交通作为人类生活中最常用、最普遍,也是最复杂、最具挑战性的内容之一,从古到今,一直在随着时代的不断变迁和社会的不断进步发生着变化。面对当今世界全球化、信息化发展趋势,传统的交通技术和手段已不适应经济社会发展的要求。智能交通系统是交通事业发展的必然选择,是交通事业的一场革命。交通控制与诱导系统是智能交通系统研究的热门核心课题,而实现交通控制与诱导的关键问题之一是实时准确的短时交通流预测,即如何有效地利用实时交通数据信息去滚动预测未来几分钟至十几分钟内的交通状况。本文研究云环境下的城市短时交通流预测的关键技术及算法实现。主要解决城市复杂路网环境下短时交通流预测的准确度和预测速度两个问题。针对城市交通流的时空相似性,提出一种基于交通流时空相似性的K近邻非参数回归预测模型（K-Nearest Neighbors model based on Spatio-Temporal Similarity of Traffic based,STS-KNN）,该模型改进了非参数回归模型中用于搜索邻域的状态向量和距离度量函数,能够更准确的描述交通流的时空特征,从而提高预测的准确度。然后为了解决STS-KNN模型搜索历史交通流数据的性能瓶颈问题,提出一种云存储环境下基于改进四叉树编码方法的分布式空间索引——M-Quadtree（M:Modified）索引,使多维的浮动车轨迹数据能够在一维的云存储环境中高效存储和查询。最后为了解决针对交通大数据的处理速度问题,以M-Quadtree索引为基础,设计一钟通用的基于MapReduce的交通数据并行挖掘框架（MapReduce Framework for Traffic Data Parallel Mining,MF-TDPM）,并利用该框架实现 STS-KNN模型的并行化,开发一钟基于MapReduce的多路段短时交通流预测并行算法MSTS-KNN。具体研究如下:（1）提出一种基于交通流时空相似性的K近邻非参数回归预测模型STS-KNN。改进传统非参数回归预测模型中的状态向量和距离度量函数等关键要素,借助图论的基础理论,提出“交通流时空相似性”和“流量相似度”等概念,设计基于交通流时空相似性的状态向量STSV（Spaial-Temporal State Vector）,定义基于交通流时空状态向量的时空相似距离STD（Spatial-Temporal Distance）。在此基础上,提出一种基于交通流时空相似性的非参数回归预测模型——STS-KNN模型。该模型具有两点优势:（1）相对于其他参数化的预测方法,该模型没有固定的参数,完全由历史数据驱动,且不依赖总体的分布形式,适合城市不同区域复杂的路网环境;（2）相对于现有的非参数回归预测方法,该模型不仅从时空维度上考虑了过去时段和周围路段对目标路段交通状态的影响,还使用“流量相似度”度量了周围路段的影响权重,并作为一个重要因素引入了预测模型中,取得了较好的预测结果。（2）提出一种云存储环境下基于改进四叉树编码方法的分布式空间索引M-Quadtree。基于数据驱动的短时交通流预测需要频繁的从海量的历史交通数据中搜索与当前状态匹配的数据,搜索的性能会严重影响预测算法的时间效率。本文利用云存储管理浮动车轨迹数据,提高交通流的存储查询效率。首先根据云存储环境对数据均衡性的要求,将传统四叉树划分的4种编码拓展为12种,设计一种M-Quadtree划分方法。基于此划分方法,提出一种适用于云存储环境下的分布式空间索引——M-Quadtree索引。该索引立足于解决基于“键-值”模型的云存储环境仅支持简单的关键字查询,不支持多维空间查询的问题;并改进传统的多维索引——四叉树索引需要递归建立的缺陷,使四叉树索引能够在云环境中并行建立,从而提高多维时空轨迹数据的查询搜索效率。（3）提出一种基于MapReduce的城市短时交通流预测并行算法MSTS-KNN。为了解决在面对城市交通大数据时,短时交通流预测算法的搜索性能瓶颈问题,针对城市浮动车数据的特点,在M-Quadtree分布式空间索引的基础上,设计一套通用的基于MapReduce的交通数据并行挖掘框架MF-TDPM,并将STS-KNN模型在MF-TDPM框架下实现,开发一种多路段短时交通流预测并行算法——MSTS-KNN算法。实验结果表明,该算法可以使短时交通流预测满足城市交通管理者和出行者的实时性需求。同时MF-TDPM框架和MSTS-KNN算法也为其他类似算法在云环境下的并行化提供参考。

喻凯^[8]（2017）在《基于搜索引擎的地理编码系统的设计与实现》文中研究指明地理编码实现了包含地址语义的属性信息和空间信息的关联,通过正向地理编码可以将各部门的包含地址语义的非空间信息映射到地理空间,实现了城市管理数据的统一管理,同时可以利用空间分析知识对数据进行充分有效的数据挖掘,在智慧城市的建设中起到关键作用。逆向地理编码可以提供高效的邻近范围查询,是移动互联网的基础设施,是实现高效可用的LBS（基于位置的服务）应用的关键。当前可用的地理编码系统主要由GIS软件厂商和在线地图网站提供,其使用需要付费授权或者限制性的免费,同时需要接入互联网,增加了 GIS系统的建设成本,同时限制了 GIS系统的使用范围。针对这一问题,本文在深入研究了地理编码系统的关键原理和相关开源技术的基础上,提出了基于Elasticsearch开源搜索引擎的地理编码系统建设方案,并对其进行了设计和实现,以提供高效可用、免费离线的地理编码服务。本文首先对地理编码系统的关键原理进行了研究分析,探究了地理编码数据库的建库理论和常用技术,研究了正向地理编码中中文地址分词和地名地址匹配的理论和技术,重点分析了逆向地理编码中空间索引的相关理论;然后,本文对搜索引擎的相关原理进行了分析介绍,对当前的主流开源搜索引擎技术进行了研究对比,确定使用Elasticsearch搜索引擎来实现地名地址匹配功能,并对该引擎的空间数据支持做了研究探讨;再者,本文对研究的地理编码系统进行了需求分析,设计了基于Elasticsearch搜索引擎和Geohash空间索引的系统建设技术路线,对系统进行了总体设计、详细设计和数据结构设计。最后对系统进行了实现,同时对系统提供的功能进行了详细说明和演示。

赵星源^[9]（2016）在《云环境下GIS并行空间连接关键技术研究》文中研究指明空间连接（Spatial Join）操作是地理信息系统（Geographic Information System,GIS）空间数据库中最基本和最重要的操作之一。庞大的数据量导致空间数据读写和传输需要耗费较多的I/O资源；复杂的空间数据结构使得空间数据的连接操作大多基于计算几何的相关算法,算法复杂度较高,需要的计算资源也较多。鉴于以上原因,空间连接运算成为空间查询中最耗时、最复杂的操作,空间连接效率对于空间数据库的整体查询效率起决定作用。近些年,随着对地观测技术、传感器技术以及计算机技术的迅速发展,人们获取空间数据的手段不断丰富并日趋成熟,空间数据的数据量规模也突飞猛涨、与日俱增。如何对海量空间数据进行高效空间连接成为GIS的关键问题之一。云计算技术为解决这一问题提供了有效的支持：利用分布式存储技术可以缓解海量空间数据带来的存储压力；利用并行计算技术可以高效完成空间连接过程中复杂的计算几何算法。因此,将云计算技术应用于空间连接成为当前GIS领域的研究热点和未来的发展方向。空间数据划分是并行空间连接的前提和基础。在并行空间连接算法中,连接条件判定是耗时最长的步骤,这要求前期的数据划分结果具有尽量少的冗余数据,避免工作节点进行无效的空间连接操作。此外,在数据划分时需要对空间数据均衡划分,以使得不同的工作节点处理的任务量大体相当,提高系统的并行化性能。针对并行空间连接的数据划分需求,本文提出一种两轮映射的数据划分方法（Two Rounds Map Partitioning Method,TRM）,能够有效地减少划分过程产生的冗余数据,同时使划分结果具备较好的数据量均衡性；然后,在此划分方法的基础上,基于MapReduce框架,提出一种基于两轮映射划分的多重筛选MapReduce并行空间连接算法（Parallelizing Spatial Join with Multiple Filter based TRM, TRMMFSJ）,能够有效提高大数据量空间数据的空间连接效率；最后,将TRMMFSJ算法应用于Top-k空间连接查询中,并针对Top-k空间连接应用提出一种优化查询算法。具体研究内如下：（1）提出一种两轮映射的空间数据划分方法。分析现有空间数据划分方法的特点及其应用于并行空间连接时的适用性,针对现有并行空间连接中数据划分方法的不足——难以使划分结果保持低冗余、高均衡的特性,提出一种两轮映射数据划分算法TRM。该方法具有两点优势：1)在第一轮映射中通过充分利用划分对象的空间属性来减少冗余数据,通过合理设置阈值来均衡划分数据；2)在第二轮映射中通过动态映射机制,进一步提高划分结果的数据量均衡度。实验表明,TRM可以有效抑制冗余数据的产生,并大幅提高划分结果的数据量均衡度,同时具备较高的划分效率,具有很强的实用性。（2）提出一种基于两轮映射划分的多重筛选MapReduce并行空间连接算法。分析现有MapReduce框架下的空间连接算法原理,针对其数据划分和空间连接过程存在的问题,提出一种基于两轮映射划分的多重筛选MapReduce并行空间连接算法TRMMFSJ.该方法具有三点优势：1)两轮映射划分方法能够得到理想的数据划分结果,有利于后续并行空间连接算法的高效运行；2)并行空间连接过程中,采用多重筛选的空间连接策略,能够有效减少候选集中的对象数,从而降低精炼阶段的计算资源消耗;3)提出网格单元定位的冗余避免算法,能够在并行空间连接的过程中完全消除冗余任务,避免后续无效空间连接操作,提高算法运行效率。实验结果表明TRMMFSJ算法相比于MapReduce并行空间连接算法（Parallelizing Spatial Join with MapReduce,SJMR）具有更高的空间连接效率。（3）提出一种并行Top-k空间连接优化查询算法。Top-k空间连接是在空间连接基础上进行的一类特殊查询,返回前七个交叠/包含数最多的空间对象。利用Top-k空间连接可以从海量数据中迅速提取出重要信息,如交通高峰时段查询此时包含汽车数量最多的k个街区,即可得到交通拥堵区域。将TRMMFSJ算法应用于Top-k空间连接查询中,并针对Top-k空间连接的应用需求提出一种优化查询算法。该算法通过两步优化实现Top-k空间连接的高效操作：1)通过计数器完成对空间对象交叠／包含数的局部统计,并将局部统计结果替换空间对象作为输出数据,从而降低数据传输的资源消耗；2)将全局统计和Top-k结果获取整合到一个MapReduce作业中完成,避免了启动多个MapReduce任务对系统资源的消耗,提高了算法效率。实验结果表明应用TRMMFSJ进行Top-k空间连接能够显着降低查询耗时,同时优化查询算法具有更好的Top-k空间连接效率。

吴琰^[10]（2016）在《我国林地“一张图”数据存储模型与查询分析并行计算技术研究》文中进行了进一步梳理林地资源数据反映了全国林地的现状和变化情况,是林业部门和相关企业进行管理和综合决策的重要依据。全国林地“一张图”系统从开始建设至今,已经拥有包括遥感影像、落界数据、林地变化数据、DEM（Digital Elevation Model）数据等,这些数据经过预处理后约33TB,成为我国林业有史以来最大的空间数据库。随着调查的进一步展开和应用类型的丰富,全国林地“一张图”所容纳的数据量越来越大,数据类型也越来越多。面对如此大量的数据,现有的管理方式在效率、可用性和可扩展性上存在的问题越来越突出,目前的研究中也没有合适的整体方案来解决现存问题。在此背景下,本文对大规模的空间数据在分布式系统中的组织方式和查询、分析手段进行深入探讨和研究。本文深入分析了传统GIS架构和已有分布式GIS研究中在部署和运行中存在的问题,结合全国林地“一张图”的数据特点,设计了适用于分布式空间数据存储、空间查询和空间分析的系统架构,对其中使用的主要技术进行详细阐述,并实现了原型系统对相关技术进行验证。验证结果表明原型系统的空间查询、空间分析和并发空间访问都有较高的效率,能够满足对全国林地“一张图”系统对查询时间的需求。本文所做研究工作如下:（1）分析了全国林地“一张图”系统的数据内涵和应用需求,在理论上建立了全国林地“一张图”系统的分布式架构,并提出了架构中的三个核心问题:分布式空间数据存储模型、分布式空间查询与空间分析算法、分布式空间运算任务调度;（2）分布式空间存储模型研究:通过设计键值数据在HDFS（Hadoop Distributed File System）中的组织结构、基于内存的分布式数据库架构、基于分布式数据库的空间数据组织结构、基于散列码的分布式空间索引,实现了空间数据在分布式架构的存储模型,避免了已有研究中存储分布式空间数据时对空间关系的破坏。测试结果表明这种存储模型能将空间查询速度提升到传统方式的17-70倍;（3）分布式空间查询与空间分析算法:使用Hadoop的MapReduce分布式运算框架实现了基于MapReduce的分布式空间分析的基础逻辑,并实现了一些典型空间分析的具体算法。测试结果表明这种方法能够减少复杂空间分析对系统性能的需求,并在运算量较大时能够极大提升空间分析的效率;（4）分布式空间运算任务调度算法:基于用户运算量最低配额的思想设计分布式空间运算任务的调度算法,保证空间运算任务的基本运算量,并尽可能将运算任务分配到数据所在的运算节点。测试证明该算法比MapReduce的默认算法平均响应时间提升了35-40%,任务平均耗时提高了15%-20%,运算过程中本地数据的运算任务百分比提高了5%-10%。本文的创新点如下:（1）设计了能够满足空间数据分布式存储和分布式空间查询与空间分析需求的系统架构;（2）设计了空间数据在分布式文件系统中的物理存储模型、逻辑存储模型和分布式空间索引;（3）设计了空间查询与空间分析在分布式运算框架中的基本逻辑和一些典型分布式空间分析算法;（4）设计了空间运算任务在分布式系统架构中的调度流程。

二、浅谈几种空间数据的索引原理（论文开题报告）

（1）论文研究背景及目的

此处内容要求：

首先简单简介论文所研究问题的基本概念和背景，再而简单明了地指出论文所要研究解决的具体问题，并提出你的论文准备的观点或解决方法。

写法范例：

本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。

（2）本文研究方法

调查法：该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法：用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法：通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法：通过调查文献来获得资料，从而全面的、正确的了解掌握研究方法。

实证研究法：依据现有的科学理论和实践的需要提出设计。

定性分析法：对研究对象进行“质”的方面的研究，这个方法需要计算的数据较少。

定量分析法：通过具体的数字，使人们对研究对象的认识进一步精确化。

跨学科研究法：运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法：这是社会科学用来分析社会现象的一种方法，从某一功能出发研究多个方面的影响。

模拟法：通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

三、浅谈几种空间数据的索引原理（论文提纲范文）

（1）基于Cesium的大规模三维场景瓦片构建与可视化（论文提纲范文）

摘要

ABSTRACT

第1章绪论

1.1 研究背景以及意义

1.2 国内外研究现状

1.2.1 三维瓦片构建技术研究现状

1.2.2 Cesium可视化技术研究现状

1.3 研究目标与研究内容

1.3.1 研究目标

1.3.2 研究内容

1.4 文章结构

第2章 Cesium框架与3D Tiles数据规范

2.1 Cesium框架

2.2 glTF模型格式

2.3 3DTiles数据格式

2.3.1 瓦片集数据

2.3.2 瓦片数据

2.4 本章小结

第3章基于八叉树的三维瓦片构建技术

3.1 三维场景分割

3.1.1 模型场景分割

3.1.2 带约束条件的三角形折叠算法

3.1.3 点云场景分割

3.1.4 基于曲率的泊松碟采样

3.1.5 多细节层次表达

3.2 三维瓦片构建

3.2.1 瓦片数据生成

3.2.2 调度文件组织

3.2.3 3D Tiles生成

3.3 本章小结

第4章海量三维空间数据可视化技术

4.1 场景裁剪技术

4.2 LOD调度策略

4.3 海量数据的加载调度

4.4 本章小结

第5章可视化平台设计与实现

5.1 平台架构设计

5.2 可视化需求分析

5.3 主要功能模块设计与实现

5.3.1 地图显示模块

5.3.2 数据可视化模块

5.3.3 数据分析功能模块

5.4 系统测试结果

5.4.1 地图功能测试

5.4.2 数据可视化测试

5.4.3 数据分析功能测试

5.5 工程应用

5.5.1 晋祠博物馆数字化平台

5.5.2 遵义会议纪念馆文物数字化展示系统

5.5.3 地质博物馆数字化系统

5.6 本章小结

第6章总结与展望

参考文献

附录

致谢

（2）基于多层Voronoi图索引的城市地质环境空间数据高效查询技术研究（论文提纲范文）

作者简历

摘要

Abstract

第一章绪论

1.1 选题背景

1.1.1 选题来源

1.1.2 选题意义

1.1.3 选题目的

1.2 拟解决的关键科学问题

1.3 主要研究内容和技术路线

1.4 主要创新点

1.5 论文的组织结构

第二章国内外研究现状

2.1 城市地质环境空间数据的特点与管理技术

2.2 空间索引技术

2.3 空间查询技术

2.4 分布式空间数据库

2.5 存在问题分析

第三章支持高效空间近邻查询的多层Voronoi图索引

3.1 问题概述

3.2 相关研究

3.2.1 kd-tree索引

3.2.2 R-tree索引

3.2.3 VoR-tree索引

3.2.4 Best-First Search算法

3.2.5 VR-kNN算法

3.3 提出的方法

3.3.1 Voronoi图与Delaunay三角网

3.3.2 MVD索引及其构建方法

3.3.3 基于MVD的最近邻查询方法

3.3.4 MVD的动态更新维护方法

3.3.5 算法流程

3.4 实验分析

3.4.1 实验环境与相关设定

3.4.2 通用实验结果分析

3.4.3 项目专题实验结果分析

3.5 本章小结

第四章基于圆锥曲线判别法的空间反向近邻查询方法

4.1 问题概述

4.2 相关研究

4.2.1 Six-region算法

4.2.2 TPL算法

4.2.3 SLICE算法

4.2.4 VR-RkNN算法

4.3 提出的方法

4.3.1 圆锥曲线判别法

4.3.2 基于Voronoi图的候选集生成方法

4.3.3 算法流程

4.3.4 单色RkNN查询的实现

4.4 实验分析

4.4.1 实验环境与相关设定

4.4.2 通用实验结果分析

4.4.3 项目专题实验结果分析

4.5 本章小结

第五章基于边界点识别的空间区域查询方法

5.1 问题概述

5.2 相关研究

5.2.1 Multi-step算法

5.2.2 Oracle Spatial PIP算法

5.3 提出的方法

5.3.1 空间数据点的分类

5.3.2 对内边界点的检索

5.3.3 对绝对内部点的检索

5.3.4 算法流程

5.4 实验分析

5.4.1 实验环境与相关设定

5.4.2 通用实验结果分析

5.4.3 项目专题实验结果分析

5.5 本章小结

第六章城市地质环境空间数据引擎的建设与应用实践

6.1 原始数据分析与预处理

6.2 空间数据服务引擎总体架构

6.3 系统模型与实现

6.3.1 数据服务接口层

6.3.2 数据模型及业务逻辑层

6.3.3 数据持久化层

6.4 系统应用与实践

6.5 本章小结

第七章结论与展望

7.1 主要结论

7.2 研究展望

致谢

参考文献

（3）基于HBase数据库的时空大数据存储与索引研究（论文提纲范文）

摘要

Abstract

第一章绪论

1.1 研究背景与意义

1.1.1 研究背景与意义

1.1.2 研究项目依据

1.2 国内外研究现状

1.2.1 时空数据存储模式研究现状

1.2.2 时空大数据的索引研究现状

1.3 研究内容及技术路线

1.3.1 研究目标

1.3.2 研究内容

1.4 论文组织结构

1.5 本章小结

第二章相关理论与技术介绍

2.1 相关技术概述

2.1.1 Hadoop生态圈

2.1.2 非关系性数据库

2.1.3 CDH环境

2.2 时空数据存储与技术概述

2.2.1 时空数据的存储模型概述

2.2.2 时空数据的存储技术概述

2.2.3 并行存储技术框架概述

2.3 索引概述

2.3.1 时空索引概述

2.3.2 索引方式及原理

2.4 本章小结

第三章基于Hbase的时空大数据的存储

3.1 数据转换

3.2 地理时空数据数据存储模型设计

3.2.1 Rowkey的设计

3.2.2 列族的设计

3.2.3 预分区的设计

3.3 地理时空数据存储技术设计

3.4 本章小结

第四章基于Hbase的索引管理

4.1 基于Hbase索引表原理与设计

4.1.1 时空索引设计原理

4.1.2 基于属性查询的索引表的设计

4.1.3 基于空间范围查询的索引表设计

4.2 时空查询方法

4.2.1 基于属性的查询方法

4.2.2 基于时空范围的查询算法

4.3 本章小结

第五章系统原型设计

5.1 系统环境要求

5.1.1 实验环境

5.1.2 实验数据

5.1.3 实验环境运行环境

5.2 实验结果及分析

5.2.1 基于不同预分区的Spark技术框架的存储效率对比分析

5.2.2 有无索引表的查询效率比较

5.2.3 基于时空范围查询的效率比较

5.3 本章小结

第六章结论及展望

6.1 结论

6.2 未来工作展望

致谢

参考文献

附录 A

一、攻读硕士学位期间发表的论文

二、攻读硕士学位期间所获荣誉

三、攻读硕士学位期间参与的科研及工程项目

（4）空间加密数据库关键技术研究（论文提纲范文）

摘要

ABSTRACT

缩略语对照表

第一章绪论

1.1 研究背景与意义

1.2 国内外研究现状

1.2.1 关系型加密数据库研究现状

1.2.2 空间加密数据集合查询算法研究现状

1.3 主要研究内容

1.4 论文组织结构

第二章相关技术概述

2.1 地理空间数据处理概述

2.1.1 地理空间数据

2.1.2 地理空间查询

2.2 关系型加密数据库CryptDB概述

2.2.1 CryptDB系统架构

2.2.2 CryptDB加密策略

2.2.3 CryptDB洋葱存储模型

2.2.4 CryptDB Sql语句重写

2.2.5 CryptDB安全保证

2.3 Geo Hash编码概述

2.3.1 Geohash编码概述

2.3.2 Geohash编码实例

2.3.3 Geohash编码精度

2.4 相关加密算法概述

2.4.1 AES加密算法概述

2.4.2 OPE加密算法概述

2.4.3 SSW加密算法概述

2.5 本章小结

第三章空间加密数据库设计

3.1 系统架构设计

3.2 空间加密数据范围查询算法设计

3.2.1 Geohash-OPE范围查询算法设计

3.2.2 FastGeo范围查询算法设计

3.3 空间加密数据KNN查询算法设计

3.4 CryptDB集成空间加密数据查询算法设计

3.4.1 My Sql-Proxy研究

3.4.2 自定义Sql语句的拦截/重写方法设计

3.4.3 自定义加密算法元数据存储方法设计

3.4.4 自定义密文运算算法设计

3.5 本章小结

第四章空间加密数据库实现

4.1 空间加密数据范围查询算法实现

4.1.1 Geohash-OPE范围查询算法实现

4.1.2 FastGeo范围查询算法实现

4.2 空间加密数据KNN查询算法实现

4.3 CryptDB集成空间加密数据查询算法实现

4.3.1 自定义Sql语句的拦截/重写方法实现

4.3.2 自定义加密算法元数据存储方法实现

4.3.3 自定义密文运算算法方法实现

4.4 本章小结

第五章实验与分析

5.1 实验环境与数据

5.1.1 实验环境

5.1.2 实验数据与方法对比

5.2 数据录入实验

5.3 空间加密数据范围查询算法测试

5.4 空间加密数据KNN查询算法测试

5.5 本章小结

第六章总结与展望

参考文献

致谢

作者简介

（5）空间数据分布式存储与并行处理方法研究及其在林业领域的应用（论文提纲范文）

摘要

Abstract

1 绪论

1.1 研究背景与意义

1.2 国内外研究现状

1.2.1 地理空间大数据时代的到来

1.2.2 遥感影像分布式存储及并行处理研究现状

1.2.2.1 遥感影像分布式存储研究现状

1.2.2.2 遥感影像并行处理研究现状

1.2.3 空间矢量数据分布式存储及并行处理研究现状

1.2.3.1 空间矢量数据分布式存储研究现状

1.2.3.2 空间矢量数据并行处理研究现状

1.2.4 空间矢量数据索引研究现状

1.2.5 当前研究不足之处

1.3 论文研究内容与技术路线

1.3.1 研究内容

1.3.2 技术路线

1.4 论文组织结构

2 相关技术介绍

2.1 分布式文件系统

2.1.1 HDFS

2.1.2 Alluxio

2.2 并行计算技术

2.2.1 MapReduce

2.2.2 Spark

2.3 本章小结

3 遥感影像分布式存储模型

3.1 遥感影像特性分析

3.1.1 影像数据模型

3.1.2 遥感影像数据访问

3.2 遥感影像分布式存储模型的设计与实现

3.2.1 HDFS小文件问题

3.2.2 键值对容器

3.2.3 索引后的键值对容器

3.2.4 影像数据块编号

3.2.4.1 矩形块划分编号

3.2.4.2 行划分编号

3.2.4.3 列划分编号

3.2.5 遥感影像分布式存储模型-MapImge

3.2.6 模型存取接口

3.3 实验与分析

3.3.1 实验环境与实验数据

3.3.2 实验结果与分析

3.4 本章小结

4 空间矢量数据分布式存储模型

4.1 矢量数据模型

4.1.1 空间关系型矢量数据

4.1.2 面向对象型矢量数据

4.1.3 矢量瓦片金字塔

4.1.4 矢量瓦片格式-mvt

4.2 矢量数据分布式存储模型的设计与实现

4.2.1 矢量空间索引

4.2.2 内存键值对容器

4.2.3 矢量数据分布式存储模型-VectorTileStore

4.2.4 模型存取接口

4.3 实验与分析

4.3.1 实验环境与实验数据

4.3.2 实验结果与分析

4.4 本章小结

5 空间数据并行处理

5.1 遥感影像金字塔并行构建及加载

5.1.1 数据预处理

5.1.2 并行构建及加载流程

5.1.3 实验与分析

5.2 矢量瓦片金字塔并行构建及加载

5.2.1 数据预处理

5.2.2 并行构建及加载流程

5.2.3 实验与分析

5.3 存储模型并行输入格式

5.3.1 InputFormat抽象类

5.3.2 MapImage并行输入格式

5.3.3 VectorTileStore并行输入格式

5.3.4 实验与分析

5.4 矢量空间并行查询

5.4.1 空间查询

5.4.2 并行查询流程

5.4.2.1 第一层过滤

5.4.2.2 第二层过滤

5.4.2.3 空间连接并行查询

5.4.3 实验与分析

5.5 遥感影像并行镶嵌

5.5.1 数据预处理

5.5.2 并行镶嵌流程

5.5.3 实验与分析

5.6 空间数据并行处理接口

5.7 本章小结

6 植被覆盖度遥感并行反演

6.1 研究区域与数据

6.2 影像分布式存储

6.3 数据预处理与植被覆盖度反演模型

6.3.1 数据预处理

6.3.2 植被覆盖度反演模型

6.4 植被覆盖度并行反演流程

6.5 实验与分析

6.5.1 实验环境与实验数据

6.5.2 实验结果与分析

6.6 本章小结

结论

参考文献

攻读学位期间发表的学术论文

致谢

（6）高精度惯性定位定向/地图信息匹配导航技术研究（论文提纲范文）

摘要

Abstract

第一章绪论

1.1 课题研究的背景和意义

1.1.1 研究背景

1.1.2 研究意义

1.2 惯性定位定向系统现状及发展

1.2.1 国外定位定向系统发展

1.2.2 国内定位定向系统发展

1.3 地图匹配技术发展及现状

1.3.1 地理信息数据现状及发展

1.3.2 地图匹配算法现状及发展

1.3.3 地图空间索引技术现状及发展

1.4 惯性基信息融合技术

1.5 论文主要内容和章节安排

1.5.1 主要内容及贡献

1.5.2 章节安排

第二章地图匹配方法及关键因素分析

2.1 地图匹配基本原理

2.1.1 地图匹配过程分析

2.1.2 地图匹配关键因素

2.2 传统地图匹配算法

2.2.1 传统地图匹配算法介绍

2.2.2 传统地图算法分析

2.3 地图匹配误差分析

2.3.1 地图数据误差

2.3.2 路网模型误差

2.3.3 地图匹配算法误差

2.3.4 其他误差

2.4 本章小结

第三章数字矢量地图空间索引技术

3.1 数字地图数据库分析

3.1.1 数字地图空间数据结构

3.1.2 Shapefile格式中道路信息存储

3.2 基于惯性信息的地图索引建立

3.2.1 R树索引

3.2.2 基于Hilbert曲线编码的网格索引

3.2.3 路网拓扑关系

3.2.4 基于空间网格的Hilbert-R树地图索引方法

3.3 空间索引效率评估

3.4 本章小结

第四章基于惯性定位轨迹和路径特征的地图匹配算法研究

4.1 候选路径选取

4.1.1 检索框确定候选路段集

4.1.2 深度遍历确定候选路径

4.2 匹配路径确定

4.2.1 道格拉斯-普克法处理定位轨迹

4.2.2 Frechet距离比较道路相似性

4.3 基于曲线几何特征的地图匹配算法

4.3.1 曲线曲率特征分析

4.3.2 特征路段匹配

4.4 地图匹配算法设计流程

4.5 仿真验证

4.5.1 仿真条件

4.5.2 仿真结果

4.5.3 结果分析

4.6 本章小结

第五章惯性/里程计/地图匹配组合导航技术

5.1 惯性导航系统数学模型

5.1.1 坐标系定义及坐标转换

5.1.2 惯性系统误差模型

5.1.3 航位推算算法

5.2 惯性/里程计/地图匹配组合导航技术

5.2.1 卡尔曼滤波方程

5.2.2 惯性/里程计组合导航

5.2.3 惯性/里程计/地图匹配组合导航

5.3 仿真验证

5.3.1 仿真条件

5.3.2 仿真结果

5.3.3 结果分析

5.4 本章小结

第六章嵌入式组合导航系统设计及试验验证

6.1 嵌入式系统硬件设计

6.2 嵌入式系统软件设计

6.2.1 软件功能说明

6.2.2 软件框架设计

6.3 车载试验验证

6.3.1 试验准备

6.3.2 试验结果

6.3.3 结果分析

6.4 本章小结

第七章结论与展望

7.1 研究工作总结

7.2 主要创新

7.3 后期工作展望

致谢

参考文献

作者在学期间取得的学术成果

附录A 随发射车跑车试验结果统计

（7）云环境下城市短时交通流预测关键技术研究（论文提纲范文）

摘要

Abstract

第1章绪论

1.1 研究背景

1.2 本文研究的意义

1.3 国内外研究现状与发展趋势

1.3.1 浮动车轨迹数据挖掘的相关研究现状

1.3.2 短时交通流预测的研究现状

1.3.3 云环境下轨迹数据处理的研究现状

1.4 问题的提出

1.5 论文研究目标和内容

1.5.1 研究目标

1.5.2 研究内容

1.6 论文的章节介绍

第2章云计算与智能交通系统

2.1 云计算概述

2.1.1 分布式存储HDFS

2.1.2 分布式计算MapReduce

2.2 基于云计算的智能交通系统

2.2.1 智能交通系统的云需求

2.2.2 云计算在智能交通系统中的应用

2.3 城市交通流

2.3.1 交通流的基本参数

2.3.2 城市交通流的特征

2.4 短时交通流预测的方法

2.4.1 时间序列预测法

2.4.2 回归分析预测法

2.4.3 基于BP神经网络的预测方法

2.5 本章小结

第3章基于交通流时空相似性的短时交通流预测

3.1 非参数回归方法概述

3.1.1 基本原理

3.1.2 适用条件

3.1.3 算法流程

3.1.4 原理对比

3.1.5 关键问题

3.2 城市交通流时空相似性分析

3.2.1 交通流的时间相似性

3.2.2 交通流的空间相似性

3.2.3 流量相似度

3.3 基于交通流时空相似性的状态向量

3.3.1 时间状态向量TSV

3.3.2 时空状态向量STSV

3.4 相似性度量函数

3.4.1 时间相似距离TD

3.4.2 时空相似距离STD

3.5 基于秩次加权的预测函数

3.6 基于STS-KNN模型的短时交通流预测

3.7 评价指标

3.8 实验与结果分析

3.8.1 实验准备

3.8.2 实验步骤

3.8.3 影响STS-KNN模型的因素分析

3.8.4 历史数据规模的影响

3.8.5 浮动车数量的影响

3.8.6 模型的适用性

3.8.7 模型对比

3.8.8 多步预测

3.9 本章小结

第4章云环境下城市浮动车数据空间索引方法

4.1 研究云环境下时空索引的必要性

4.2 M-Quadtree索引方法

4.2.1 空间数据划分

4.2.2 本地索引

4.3 索引构建算法

4.4 索引查询算法

4.4.1 范围查询

4.4.2 K近邻查询

4.5 索引更新算法

4.5.1 数据插入

4.5.2 数据删除

4.6 实验与结果分析

4.6.1 实验环境与数据

4.6.2 M对索引效率的影响

4.6.3 空间数据划分效率分析

4.6.4 并发环境下索引查询效率分析

4.6.5 索引更新效率分析

4.7 本章小结

第5章基于MapReduce的城市短时交通流预测并行算法

5.1 并行计算相关概念

5.2 基于MapReduce的交通数据并行挖掘框架

5.3 浮动车数据并行预处理

5.3.1 浮动车历史数据

5.3.2 交通流参数计算

5.4 基于MF-TDPM框架的短时交通流预测并行算法

5.4.1 STS-KNN模型的并行性分析

5.4.2 算法设计与实现

5.4.3 时间复杂度分析

5.4.4 并行算法性能评估指标

5.5 实验与结果分析

5.5.1 实验准备

5.5.2 加速比验证实验

5.5.3 可扩展性验证实验

5.5.4 性能对比实验

5.6 本章小结

第6章总结与展望

6.1 本论文研究工作总结

6.2 本论文主要创新点

6.3 展望

参考文献

发表的科研成果目录

致谢

（8）基于搜索引擎的地理编码系统的设计与实现（论文提纲范文）

摘要

ABSTRACT

第一章绪论

1.1 研究背景和意义

1.2 国内外研究和应用现状

1.2.1 研究现状

1.2.2 应用现状

1.3 研究目的与意义

1.4 研究内容

1.5 论文结构安排

第二章地理编码系统的关键原理

2.1 地理编码数据库的建库特点

2.1.1 标准地名地址模型

2.1.2 空间数据库技术

2.2 正向地理编码原理

2.2.1 中文分词基本原理

2.2.2 开源中文分词器

2.2.3 地名地址匹配原理

2.3 逆向地理编码原理

2.3.1 基于距离过滤的逆向地理编码

2.3.2 基于空间索引的逆向地理编码

第三章搜索引擎的关键原理

3.1 倒排索引

3.2 开源搜索引擎技术的分析与比较

3.2.1 Lucene

3.2.2 Solr

3.2.3 Elasticsearch

3.2.4 搜索引擎选型分析

3.3 Elasticsearch对空间数据的支持

3.3.1 支持的空间数据类型

3.3.2 支持的空间数据操作

3.3.3 对Geohash空间索引的支持

3.3.4 对邻近查询的支持

第四章系统分析与设计

4.1 需求分析

4.1.1 总体目标

4.1.2 详细需求

4.2 设计原则

4.3 系统技术路线

4.4 总体架构设计

4.4.1 应用层

4.4.2 服务层

4.4.3 数据层

4.5 系统数据流

4.6 模块详细设计

4.6.1 数据处理模块

4.6.2 功能服务模块

4.7 数据结构设计

4.7.1 地理编码数据库表设计

4.7.2 Elasticsearch引擎文档结构设计

第五章系统实现

5.1 开发环境

5.2 系统部署

5.2.1 部署环境

5.2.2 部署过程

5.3 功能展示

5.3.1 服务功能展示

5.3.2 原型应用系统功能展示

第六章总结与展望

6.1 总结

6.2 展望

参考文献

致谢

（9）云环境下GIS并行空间连接关键技术研究（论文提纲范文）

博士学位论文创新点

摘要

Abstract

第一章绪论

1.1. 研究背景与意义

1.2. 空间连接的研究现状及发展趋势

1.3. 研究内容

1.4. 论文的章节安排

第二章云计算基本原理与框架

2.1. 云计算概述

2.2. 云环境下的分布式存储技术

2.2.1 HDFS简介

2.2.2 HDFS读文件流程

2.2.3 HDFS写文件流程

2.3. 云环境下的并行计算技术

2.3.1 MapReduce简介

2.3.2 MapReduce工作流程

2.4. 云环境下的GIS空间连接

2.4.1 并行空间连接的基本原理

2.4.2 云环境下并行空间连接概述

2.5. 本章小结

第三章并行空间连接的数据划分方法

3.1. 空间数据划分方法

3.1.1 Oracle Spatial划分方法

3.1.2 R树索引划分

3.1.3 四叉树索引划分

3.1.4 网格划分

3.2. 空间填充曲线

3.2.1 空间填充曲线概述

3.2.2 Hilbert曲线

3.3. 两轮映射数据划分方法

3.4. 实验与分析

3.4.1 实验数据

3.4.2 评价指标和对比方法

3.4.3 实验一

3.4.4 实验二

3.4.5 实验三

3.5. 本章小结

第四章并行空间连接算法

4.1. 空间连接算法概述

4.1.1 粗选步骤

4.1.2 精炼步骤

4.2. 云环境下的并行空间连接算法

4.2.1 Map端并行空间连接算法

4.2.2 Reduce端并行空间连接算法

4.3. 基于两轮映射数据划分方法的多重筛选MapReduce并行空间连接算法

4.3.1 数据划分

4.3.2 并行空间连接

4.3.3 冗余避免策略

4.4. 实验与分析

4.4.1 实验数据

4.4.2 空间对象近似表达模型实验

4.4.3 并行空间连接实验

4.5. 本章小结

第五章云环境下并行Top-k空间连接查询及优化

5.1. Top-k空间连接查询

5.1.1 Top-k空间连接概述

5.1.2 基于R树的Top-k空间连接

5.2. 云环境下的Top-k空间连接

5.2.1 并行空间连接

5.2.2 空间连接结果统计

5.2.3 Top-k空间连接结果获取

5.3. 云环境下Top-k空间连接的优化

5.3.1 局部统计

5.3.2 全局统计和Top-k空间连接结果获取

5.4. 实验与分析

5.4.1 实验数据与环境

5.4.2 对比方法与实验过程

5.4.3 实验结果与分析

5.5. 本章小结

第六章总结与展望

6.1. 本论文研究工作总结

6.2. 本论文主要创新点

6.3. 展望

参考文献

攻博期间发表的科研成果目录

致谢

（10）我国林地“一张图”数据存储模型与查询分析并行计算技术研究（论文提纲范文）

摘要

Abstract

第一章绪论

1.1 研究背景

1.2 研究目的意义

1.3 项目来源与经费支持

1.4 国内外研究现状

1.4.1 林业GIS研究

1.4.2 并行计算与分布式计算的发展

1.4.3 并行GIS与分布式GIS的研究和应用

1.4.4 存在问题与分析

1.5 研究目标和主要研究内容

1.5.1 研究目标

1.5.2 主要研究内容

1.6 研究技术路线

1.7 论文结构

第二章分布式空间查询与空间分析系统架构研究

2.1 林地一张图数据内涵

2.1.1 内容

2.1.2 特征

2.1.3 需求分析

2.1.4 应用特点

2.2 全国林地“一张图”现有架构分析

2.2.1 系统架构

2.2.2 拓扑结构

2.2.3 负载均衡策略

2.2.4 空间查询流程

2.2.5 存在问题及分析

2.3 现有分布式GIS架构分析

2.3.1 分布式空间存储

2.3.2 分布式空间运算

2.4 全国林地“一张图”系统分布式系统架构设计

2.4.1 整体架构

2.4.2 关键技术

2.4.3 系统拓扑结构

2.4.4 系统总体运行逻辑

2.5 本章小结

第三章分布式空间数据存储模型研究

3.1 空间数据存储方式

3.1.1 空间数据库的概念和发展

3.1.2 空间索引

3.2 空间数据访问执行流程

3.2.1 关系数据库数据组织结构

3.2.2 属性条件查询的执行流程

3.2.3 空间条件查询的执行流程

3.2.4 影响空间查询效率的因素与分析

3.3 物理存储模型

3.3.1 分布式文件系统HDFS

3.3.2 数据在HDFS中的存储方式

3.3.3 键值存储文件结构设计

3.3.4 数据库服务器集群设计

3.4 空间数据逻辑存储模型

3.4.1 存储结构设计

3.4.2 空间索引设计

3.4.3 属性索引设计

3.4.4 空间数据访问流程

3.5 本章小结

第四章分布式空间查询与空间分析算法研究

4.1 传统空间分析算法

4.1.1 单机式系统空间分析流程

4.1.2 基于并行计算和分布式运算的空间分析流程

4.1.3 存在问题及分析

4.2 基于Hadoop的分布式算法

4.2.1 Map Reduce原理

4.2.2 分布式运算逻辑

4.2.3 存在问题及分析

4.3 分布式空间分析查询与空间分析算法设计

4.3.1 输入/输出格式设计

4.3.2 数据输入类设计

4.3.3 数据输出类设计

4.3.4 Mapper类设计

4.3.5 Combiner类设计

4.3.6 Reducer类设计

4.3.7 分布式空间分析算法总体流程

4.4 典型空间分析的分布式算法设计

4.4.1 空间统计

4.4.2 空间要素合并与缓冲区分析

4.4.3 空间要素分类

4.4.4 空间要素可视化

4.4.5 空间要素叠加分析

4.4.6 复合空间分析类型

4.5 本章小结

第五章空间查询与分析的任务分配与调度研究

5.1 传统GIS系统的并发任务处理机制

5.1.1 CPU调度

5.1.2 内存调度

5.1.3 磁盘调度

5.1.4 存在问题及分析

5.2 Hadoop的任务调度机制

5.2.1 调度算法

5.2.2 掉队者判定和推测执行机制

5.3 空间查询与空间分析任务的动态调度算法设计

5.3.1 节点的计算能力

5.3.2 节点负载能力的动态调整

5.3.3 用户作业资源配额

5.3.4 用户作业队列

5.3.5 最优任务选择

5.3.6 慢节点处理

5.3.7 总体流程

5.4 本章小结

第六章技术实现与验证

6.1 测试环境介绍

6.1.1 实验数据

6.1.2 硬件配置与部署

6.1.3 软件配置

6.2 技术实现

6.2.1 分布式空间数据库服务实现

6.2.2 任务调度服务设计与实现

6.2.3 Web应用程序设计与实现

6.2.4 测试程序设计与实现

6.3 验证与分析

6.3.1 空间要素写入效率

6.3.2 空间条件查询效率

6.3.3 非空间条件查询效率

6.3.4 空间分析效率

6.3.5 并发空间运算任务调度

6.4 本章小结

第七章总结与展望

7.1 本文总结

7.2 展望

参考文献

在读期间的学术研究

致谢

四、浅谈几种空间数据的索引原理（论文参考文献）

[1]基于Cesium的大规模三维场景瓦片构建与可视化[D]. 孟天杭. 北京建筑大学, 2021(01)
[2]基于多层Voronoi图索引的城市地质环境空间数据高效查询技术研究[D]. 李旸. 中国地质大学, 2021
[3]基于HBase数据库的时空大数据存储与索引研究[D]. 蒋叶林. 昆明理工大学, 2021(01)
[4]空间加密数据库关键技术研究[D]. 王久旺. 西安电子科技大学, 2020(05)
[5]空间数据分布式存储与并行处理方法研究及其在林业领域的应用[D]. 聂沛. 东北林业大学, 2020(01)
[6]高精度惯性定位定向/地图信息匹配导航技术研究[D]. 刘峰. 国防科技大学, 2019(01)
[7]云环境下城市短时交通流预测关键技术研究[D]. 胡玉龙. 武汉大学, 2017(06)
[8]基于搜索引擎的地理编码系统的设计与实现[D]. 喻凯. 武汉大学, 2017(06)
[9]云环境下GIS并行空间连接关键技术研究[D]. 赵星源. 武汉大学, 2016(02)
[10]我国林地“一张图”数据存储模型与查询分析并行计算技术研究[D]. 吴琰. 中国林业科学研究院, 2016(01)

标签：空间数据论文; 大数据论文; 空间分析论文; 分布式存储系统论文; 并行处理论文;

浅谈几种空间数据的索引原则

一、浅谈几种空间数据的索引原理（论文文献综述）

二、浅谈几种空间数据的索引原理（论文开题报告）

（1）论文研究背景及目的

此处内容要求：

写法范例：

（2）本文研究方法

三、浅谈几种空间数据的索引原理（论文提纲范文）

（1）基于Cesium的大规模三维场景瓦片构建与可视化（论文提纲范文）

（2）基于多层Voronoi图索引的城市地质环境空间数据高效查询技术研究（论文提纲范文）

（3）基于HBase数据库的时空大数据存储与索引研究（论文提纲范文）

（4）空间加密数据库关键技术研究（论文提纲范文）

（5）空间数据分布式存储与并行处理方法研究及其在林业领域的应用（论文提纲范文）

（6）高精度惯性定位定向/地图信息匹配导航技术研究（论文提纲范文）

（7）云环境下城市短时交通流预测关键技术研究（论文提纲范文）

（8）基于搜索引擎的地理编码系统的设计与实现（论文提纲范文）

（9）云环境下GIS并行空间连接关键技术研究（论文提纲范文）

（10）我国林地“一张图”数据存储模型与查询分析并行计算技术研究（论文提纲范文）

四、浅谈几种空间数据的索引原理（论文参考文献）

猜你喜欢