一、HDTV成像与电影成像的总体性能比较(论文文献综述)
温昕[1](2020)在《基于深度学习的脑功能连接挖掘方法及脑老化应用研究》文中进行了进一步梳理随着人口老龄化的加剧,老年人的健康不仅是社会关注的热点,也是神经科学、临床医学以及计算机科学等领域学者重点关注的研究方向。功能磁共振成像(fMRI)作为一种无创的脑成像技术现已广泛应用于挖掘老化过程中大脑的功能变化。然而,目前fMRI功能连接的相关研究大多采用针对相对较小样本的传统统计分析方法,这可能使得脑功能连接信息挖掘不够深入,会忽略一些脑老化功能改变的重要信息。考虑到深度学习和大数据分析对于传统统计分析方法的优势,将深度学习与神经影像学大数据相结合有望实现对脑老化信息的深度挖掘,有利于进一步加深研究者对脑老化机制的理解。本文主要基于深度学习方法,围绕大数据视角,针对功能磁共振成像数据,发展脑功能连接挖掘方法与行为评分预测方法,并将这些方法初步用于脑老化过程中的脑机制研究,发现并推测脑老化中基底节网络可能存在的代偿机制。本文的各项工作总结如下:(1)提出一种新的功能连接分析方法,用于脑老化的功能连接分析研究。基于传统方法的功能连接分析研究中,由于样本相对较少,可能导致对脑老化功能连接分析不足,从而忽略了一些功能网络改变的重要基础信息,因此本文提出了一种新的功能连接分析方法,Deep neural network with Autoencoder pretrained Functional connectivity Analysis(DAFA),以深入挖掘功能磁共振影像在脑老化过程中一些重要的功能连接变化。该方法基于自编码机与深度神经网络并充分考虑了数据中潜在的复杂关系,能够更深入地挖掘出正常老化过程中功能连接网络变化的重要信息。研究表明,相比于年轻人,老年人的带状盖网络内部,以及带状盖网络与枕叶网络、小脑网络间的功能连接降低;默认模式网络与带状盖网络、枕叶网络、小脑网络间的功能连接升高。因此推测:在脑老化中可能存在两种神经回路分别对应功能性协调损失和代偿机制:1)功能连接降低的回路,位于带状盖网络与枕叶网络、小脑网络之间;2)功能连接升高的回路,位于默认模式网络与带状盖网络、枕叶网络、小脑网络之间。该方法具有潜在的应用前景,有望在阿尔茨海默症和精神分裂症等疾病的功能磁共振成像研究中挖掘更多重要的功能连接改变信息。(2)提出一种新的预测方法与特征可视化策略,用于脑老化相关的流体智力预测与特征可解释性探索。本文建立了一种新的流体智力预测方法。该方法提出空间自编码机,并在此基础上使用局部功能连接密度和局部功能活动的四维时空一致性指标,将深度神经网络与集成学习方法进行充分结合,对流体智力进行预测。相比于神经影像领域最为常用的预测模型-连接组学预测模型,所提出方法的预测值与真实值之间的皮尔逊相关值提高了约10%。进一步,本文还基于空间自编码机,并结合深度神经网络训练中Dropout的策略对其得到的特征进行了可视化研究,以期提高结果的可解释性。研究表明,基于空间自编码机的特征可视化策略有效地反映了用于预测流体智力的脑功能活动空间模式,进而有助于加深深度神经网络特征的内涵,有效地提升了特征模式的可解释性,加深了脑老化功能、行为学指标与特征间的联系。(3)从局部功能连接角度研究脑老化,发现基底节网络的代偿机制。脑老化过程中功能网络内的功能连接降低可能是由于认知功能的广泛减弱引起的,而功能网络之间功能连接升高可能是由于功能网络中的代偿机制造成的。但是,目前功能网络的毕生变化内在机制仍不清楚,尤其是这种潜在的补偿机制是如何在毕生变化中运行的仍处于探索阶段。本文最后采用静息态下的局部功能连接密度和局部功能活动的四维时空一致性指标,初步研究探索了局部功能连接在毕生中的变化。研究表明,随着年龄增加,认知功能下降,视觉网络、感觉运动网络和默认模式网络内的功能连接降低,而基底节网络内的功能连接有所增高。因此推测基底节网络可能在老化过程中发挥着一定的调节作用,以补偿其他功能系统的功能障碍与损伤。
万照麟[2](2020)在《基于感知信息的图像质量评价方法研究》文中进行了进一步梳理随着在线社交媒体的蓬勃发展和移动设备的普及,数字图像已成为人们日常生活沟通和交流的重要载体。各大在线服务提供商每天产生、传输、存储不计其数的数字图像。为了节省资源并降低消耗,所有图像在上述过程中都不可避免地受到各种各样的失真干扰。然而,预想达到良好的用户体验则需要较高质量的图像。这就使得如何在现有带宽条件约束下,寻找最优的视觉质量成为当今多媒体领域面临的一项重大考验。因为图像的最终接收者是人,所以图像质量评价的目的是验证该评价结果是否与人类视觉系统的主观感受相一致。因此,如何建立符合人眼视觉特性的客观图像质量评价方法对多媒体领域的应用和发展具有重要的意义和作用。研究者从人类视觉系统特性出发,将部分影响主观感知的视觉特性和视觉因素应用于图像质量评价算法模型,并且已取得一定成效。但是,图像质量评价仍然存在着缺乏有效的视觉感知模型、提取的图像特征与图像质量相关性不高、未充分考虑视觉特性和自然场景统计特性之间的关系等问题。而对于立体图像质量评价,更应面向其特有的质量问题,充分考虑人眼双目视觉特性。本文以视觉特征为核心,结合稀疏表示理论,针对上述问题进行深入研究,提出了一系列基于视觉特征与自然场景统计的二维图像和立体图像质量评价算法。本文的研究内容主要包括以下三个部分:第一,提出了基于稀疏表示的部分参考的二维图像和立体图像质量评价方法。一方面,稀疏编码理论能够很好地表示哺乳动物初级视觉皮层简单细胞感受野的空间局部性、方向性和带通性。另一方面,稀疏表示的过程与人类视觉感知的多层渐进过程也有高度联系,大脑会逐步地处理视觉信息,从最基础的到包含一定结构的最后再处理富含丰富细节的信息。因此,我们利用人类视觉稀疏编码特性,提出了基于稀疏表示的部分参考的二维图像和立体图像质量评价方法。在该方法中,我们首先用一组自然图像训练出一个通用字典,并将字典中的基元视为视觉感知单元。根据视觉基元在视觉表示中的特性和图像重构过程中的视觉重要性,我们将字典中的所有基元可以被分为三类。利用分类的视觉基元重构图像时的概率分布计算视觉信息,称为分类基元熵。对于立体图像,使用左视点的分类基元熵,右视点的分类基元熵和两个视点的分类基元互信息共同来表示视觉信息。其中,使用最大值机制用来决定在不同稀疏等级下的视觉信息。使用原始图像和失真图像的视觉信息差异作为图像质量特征,通过支持向量回归(SVR)来预测图像质量。实验结果证明了所提模型的有效性,在不同图像质量评价数据库上能够达到与主观评价的高度一致性。第二,提出了基于稀疏表示和自然场景统计的非对称失真立体图像的部分参考质量评价算法。一个理想的图像质量评价模型应该可以模拟大脑视觉区的特性以保证与人类对图像质量评价的一致性。大脑视觉区不断进化以期能够为图像寻找一种有效的、去相关的表示方法,并且能够“匹配”自然图像的统计信息。一方面,研究表明稀疏表示类似于大脑的初级视觉皮层表示自然图像所采取的方案。另一方面,自然场景统计推动了人类视觉系统的进化,也促进了对视觉感知的理解和模拟。基于以上观察,针对立体图像非对称失真质量评价问题,本文提出了基于稀疏表示和自然场景统计的部分参考质量评价算法以期模拟人脑视觉感知。所提算法中,稀疏表示中的分类基元的分布统计信息用来衡量视觉信息,因其与多层渐进的视觉感知过程相关。局部归一化的亮度系数的统计分布被用来衡量因失真导致的自然性的损失。视觉信息和自然场景统计信息被用来预测立体图像的质量分数。实验结果表明,在多个非对称立体图像质量评价数据库上,我们的算法取得了比现有算法更好的预测性能。第三,提出了一系列参考信息可变的部分参考图像质量评价算法。因为部分参考质量评价方法只需要原始图像的部分信息,而算法的预测性能往往会随着所需原始图像信息的减少而下降,在所需原始图像信息和预测性能间寻找较好的平衡点对于设计部分参考质量评价算法来说非常重要且必要。大多数部分参考质量评价算法只能固定所需原始图像信息,而现实应用中的带宽条件往往根据不同任务而有所改变,所以设计一个所需参考信息可变并且预测性能良好的算法在实际应用中有十分重要的意义。因此,本文提出了一系列根据所需原始特征数量变化而参考信息可变的部分参考图像质量评价算法,该算法所需特征数量范围为一至字典基元的总数。用户可根据特定任务和带宽条件选择相应合适特征数量的算法,十分灵活实用。本文提出使用稀疏卷积受限玻尔兹曼机来训练字典,该方法可对数据进行有效的内在分布式表示。我们假设字典中的基元是视觉感知的基本单元,它包含一定的图像结构和视觉信息。不同基元的组合可以代表不同程度、不同等级的结构和视觉信息。所以我们可以使用多级分类基元熵来表示图像的质量特征,并用其训练质量预测模型。实验结果表明所提模型可以提供一系列所需原始图像信息可变并保证预测性能良好的算法,解决了用同一模型适应不同带宽条件和特定任务的问题。综上,本文以模拟人类视觉系统特性为基础,利用稀疏表示模型计算分类基元熵,提出了基于感知信息的部分参考图像质量评价模型,充分发掘了感知信息在图像质量评价中的应用潜力,切实解决了客观图像质量评价与主观感受的一致性问题,提高了预测性能,具有很高的实际意义。
林敬昊(LIM Kyongho)[3](2020)在《新型显示技术的视觉感知和工效研究》文中提出随着信息产业的发展,显示器件在材料与设计工艺等核心技术上取得了巨大的突破。其中,基于薄膜晶体管(Thin-Film Transistors,TFT)技术的显示器件随着TFT技术和相关材料性能的提高,器件性能不断向着高分辨率、高动态范围(High Dynamic Range,HDR)、大色域和高刷新率方向高速发展。从视觉设计层面来看,柔性显示初期阶段的曲面显示技术已经商用化,并且向趋于成熟的真正柔性显示技术发展。在如今的信息化时代,通过显示器件再现的信息形态已经从以文本为核心的静态图像转变为以视频和游戏为代表的动态图像。因此,显示器件的质量和性能将对包含文本工作、信息交换、游戏等应用工作产生巨大的影响。为了更加直接地体现观看者的主观感受,显示产品的质量和性能评价应该以使用者(观看者)为中心进行,但是目前大部分的显示器件以生产者为中心进行评价。所以为了满足消费者的实际需求,显示产品的评价方式应转变为基于消费者实际使用环境中的视觉感官体验。因此,在现代显示器设计生产中,特别是针对柔性显示和高动态范围显示等先进显示技术,从人因工程学的角度通过对感知画质、视觉工作执行度、视疲劳度等方面对器件表现进行研究具有很大的意义。本论文立足于新型显示技术,全方位研究显示器曲率、光亮度(Luminance)、响应速度等屏幕参数对人类视觉工作执行度、视疲劳度、感知画质等评价参数的影响,以及基于人眼感知亮度的高动态范围技术中技术评估方法的开发和影像处理研究。本论文的主要工作与成果可以归结为以下五个方面:第一、采用人因功效研究分析了弯曲的计算机显示器的曲率对用户在执行视觉任务过程中影响,设计提出了实验方案和评价方法及参数,得出的屏幕曲率变化对视觉性能、疲劳和情感图像质量的影响差异。对曲面显示器的特性进行了比较并分析了不同的曲率,以调查曲面显示器与平板显示器相比在使用便利性方面是否显示出改进。评估后的显示器的视觉性能结果可根据其响应时间分为三组,即(2000R=2500R)>(3000R)>(3800R=4500R=平面)。在搜索任务期间,平均瞳孔大小的视疲劳结果对于平板而言为3.468毫米,对于2000R为3.355毫米。这意味着在执行相同的视觉搜索任务时,发现2000R曲面显示器比平面显示器更易于使用,因此产生的视疲劳更少。其实验结果为凹型曲面显示提供了设计参考与特征参数标准。结果还表明,随着曲率的增加,视觉表现改善,视疲劳显着降低。在这项研究中,当考虑到34英寸21:9弯曲显示器的图像失真时,导出了1700R的曲率极限,并且发现在大于2000R的曲率下,感知画质质量没有差异。第二、根据在显示屏周边视觉(Peripheral Vision)的光亮度和刺激大小对视亮度(Brightness)视觉感知实验,得出感知亮度随周边视觉场亮度的变化关系。之前已经有大量的研究工作通过改善显示器的亮度来提高显示器的感知亮度。但是,研究表明,人类视觉系统(Human Visual System,HVS)不仅受屏幕物理亮度的影响,还受其他因素的影响,例如对周围亮度的适应性。因此,仅提高最大显示亮度不是最佳解决方案。在第二项研究中,我们使用史蒂文斯的亮度函数,研究了周边视觉的光亮度(PVL)水平和视场角(FOV)对观察者感知的显示器亮度的影响,而与适应周围亮度无关。对实验结果的分析表明,感知到的显示器亮度与显示器上的周边视觉觉亮度水平成反比。虽然FOV的增加导致绝对亮度值的增加,但是它减小了PVL对感知的显示器亮度的影响。这项研究的结果将为优化图像信号的显示规格提供有用的基础数据。第三、研究动态图像在不同显示屏幕上视觉工作的完成情况,提出了有效的功效评价方案,并研究对比了在观看运动图片时4K有机发光二极管(OLED)和液晶显示器(LCD)电视对视觉任务性能和疲劳的影响。在实验中,要求受试者在四种运动态图像速度,屏幕图标总数276个中定位35个图标。结果表明与LCD电视(非自发光型)相比,OLED电视(自发光型)在命中率和误报率方面具有优越性。为确定疲劳水平而进行的模拟器疾病调查表的评估结果还表明,与LCD电视相比,OLED电视在10ppf(pixel per frame)或更高的快速运动态图像速度下诱发的疲劳相对较少。因此,这项研究证实,鉴于其超快的响应时间特性,OLED电视在运动图像方面优于LCD电视。该方案可以有效的适用于不同类型显示的评测。第四、基于人眼感知亮度的高动态范围技术评估和测量方法的开发,得到了最佳显示器的动态范围,提出了高动态范围技术评估方法并已写入国际和国内标准化文件。人眼实际所能感受到的光亮度范围非常大(约为10-3cd/m2~106cd/m2),但是目前现有的显示器上只能显示出比人眼实际看到的值小的标准动态范围(Standard Dynamic Range,SDR),高动态范围技术的开发可进一步满足视觉感受效果。因此,评估高动态范围的动态范围的本质很重要,必须使用新方法来评估这些技术。本研究提出新的高动态范围显示屏评价方法,创新性和再现性得到认可,于2019年已经写入在中国国家电子行业标准和IEC国际标准中。第五、基于人眼亮度的感知特性,优化了视频处理功能设计在实现高动态范围同时具有出色的低灰度和色彩表现。现有的图像处理功能使用平均图片级别(Average Picture Level,APL)来扩展输入图像的动态范围。但是,这种方法没有根据图像的灰度分布显示出应用效果,会出现削波问题。因此,本研究提出了一种功能,以有效地将图像的分布扩展到低和高灰度级,从而最小化灰度级的饱和度。实验证实通过图像渲染提出的新功能具有很高的图像动态范围,并可以进一步扩展,从而实现不但具有高动态范围而且具有出色的低灰度和色彩表现效果。
周雅[4](2020)在《图像重定向与质量评价》文中进行了进一步梳理随着移动设备的普及和立体显示技术的发展,人们已不再满足于视觉上的可获得性,而更加追求视觉上的高享受性。图像重定向因其能够自适应地调整多媒体内容以满足不同终端的需求,而被广泛关注和研究。为了在满足设备显示硬需求的同时,兼顾用户视觉体验的软需求,质量评价往往被许多成熟的产业链考虑在内。因此,本文讨论图像重定向和质量评价之间的辅成关系。一方面,研究图像重定向的质量评价;另一方面,研究质量评价指导下的图像重定向技术。关于立体图像重定向的研究相对匮乏,亦没有公开的数据集。为了填补这块空白,我们建立了首个立体重定向图像的主观数据集SIRD。其涉及单算子、多算子在内的四种典型的立体重定向方法,包含图像质量、视觉舒适度、深度感和总体质量在内的四种立体感知评价维度,有着较强的代表性和较高的置信度。为了评估用户在观看立体重定向图像时的安全性,模拟人眼系统的双目感知机制,我们设计了首个基于混合失真聚合的视觉舒适度评价模型Hi-VCA。针对立体重定向中经常出现的结构失真、信息丢失、双目冲突和语义失真,我们分别设计了四种度量以全面地描述重定向对舒适度的影响。尤其是在双目冲突度量中,我们考虑包括视觉舒适区、双目竞争、窗口冲突和聚焦辐合冲突在内的异常双目感知机制,以更彻底地分析诱导视觉不舒适的因素。最后,实验结果表明,Hi-VCA模型不仅对于立体重定向图像,而且对于普通立体图像,均有着较好的舒适度评价能力,这在相关模型中极具竞争力和实用性。为了解决质量评价中数据量少、标注成本高这一难题,我们提出了基于主动学习的质量评价方案。对于传统的质量评价模型,我们设计了基于聚类的采样策略。而对于基于深度学习的质量评价模型,我们首先设计了一个双路的立体图像质量评价网络,然后提出了基于感知相似性的采样策略。实验结果表明,尽管缩减大约一半的标注代价,但能实现与使用所有样本点相媲美的性能。为了实现质量评价对图像重定向的反向优化,我们设计了基于强化学习的质量感知的多算子图像重定向框架SAMIR。首先,我们将多算子重定向任务模拟成马尔可夫决策过程。然后,提出了语义和美学感知度量作为强化学习中的奖励函数,一方面保证图像信息的正确传递,另一方面保证图像的视觉质量。最终,在不需要任何标注数据和低复杂度的情况下,实现了多步算子的自适应选择。SAMIR框架亦给用户提供了一定的创作空间,通过设计动作空间,调整重定向方向和比例,可以根据需求实现更为多样化的效果。
陈晨[5](2021)在《基于人脑磁共振图像的个体认知参数的多标签预测研究》文中研究说明基于人脑磁共振图像的个体认知参数定量估计一直是认知神经科学领域的一个研究热点,这类研究不仅可以探究大脑结构和功能的个体差异性,也有助于神经精神类疾病的辅助诊断与早期预警。然而目前大部分研究都是基于单标签技术而不是多标签技术,而多标签学习考虑了标签之间的相关关系,可以提供更丰富的信息,从而提高预测的准确率。目前的个体认知参数定量估计研究大多还是基于静息状态功能磁共振图像(fMRI)开展的,近期研究表明自然状态fMRI在多个关键方面均优于静息状态fMRI,但使用自然状态fMRI对认知参数进行定量估计的研究还存在空缺。因此,本研究引入多标签学习技术来开展个体的多个认知参数的预测,并分别基于静息状态fMRI和观影状态fMRI进行了系统探究。具体地,本文主要开展了以下三项工作:(1)基于偏最小二乘回归(PLSR)的多个认知参数预测研究。该项工作系统地探究了PLSR在基于静息状态fMRI预测个体认知参数的表现,特别是在同时预测多个认知参数上的性能。我们分别使用基于偏相关和基于全相关的静息状态功能连接(RSFC)作为特征,估计了共计十个认知参数。研究结果表明,PLSR在单标签和多标签学习中均表现良好,并且有助于挖掘预测背后的生理意义。此外,该项工作还发现基于100、200和300个感兴趣区(ROI)之间RSFC预测的精度高于基于15、25和50个ROI之间RSFC的预测准确性;使用偏相关计算的RSFC的预测精度高于基于全相关计算的RSFC的预测精度。(2)基于典型关联分析(CCA)及其变式的认知参数的多标签预测。该项工作提出了三种CCA结合岭回归的多标签预测模型,并将基于偏相关和全相关计算的RSFC作为特征,使用两组不同的标签集探究了模型的泛化性能。研究结果表明,三种模型在基于静息状态fMRI的认知参数的多标签学习中表现较好,且加入核函数的预测模型效果最佳。此外,这项研究结果再次表明高分辨率的ROI以及使用偏相关的RSFC均有助于提升预测精度。(3)基于观影状态fMRI的认知参数定量评估研究。该项研究中引入了三种成熟的脑功能特征(FC、ISC、ISFC)和两种新型脑功能特征(自然刺激响应幅度和残余信号功能连接特征),进而结合PLSR算法来进行观影状态下的认知参数的多标签预测。研究结果表明,五种脑功能特征在不同程度上都有利于个体认知参数的定量预测,其中FC和残余信号功能连接特征更加适用于认知参数的多标签预测。本研究的创新性在于:(1)系统地探究了PLSR在认知参数多标签预测中的性能,并证明了该算法可获得高预测精度且具有普适性;(2)将CCA结合岭回归的多标签学习模型应用于多个认知参数预测,并取得较高预测精度;(3)率先基于观影状态fMRI探究了认知参数的多标签学习,并提出新型的脑功能特征用于认知参数预测。
王世豪[6](2020)在《基于运动补偿的视频超分辨技术研究》文中研究说明视频超分辨是将细节粗拙的低分辨率视频进行处理,获得对应的具备更好视觉质量和细节信息的高分辨率视频的技术。运动补偿是视频超分辨技术中一种常用的对低分辨视频帧进行处理的方法,其目的是更好地利用相邻视频帧中的相似区域,以获得更高的视频超分辨质量。如何对低分辨视频中相邻帧的信息进行有效的提取和利用,是视频超分辨技术的重点,也是国内外研究的热点。本论文针对该问题,借助深度学习和卷积神经网络,开展了如下工作:1.分析视频超分辨的主要技术路线和研究历史,查阅大量资料,结合近年来图像处理领域研究最为集中的卷积神经网络,提出了一种对视频中多个相邻帧进行特征提取和融合的多帧融合网络。通过设计一个多支路的卷积神经网络,对输入网络的低分辨视频相邻帧分别进行特征提取和融合,提高了超分辨视频的连贯性和质量。2.针对视频帧中常常同时存在大尺度物体和小尺度物体的特点,提出多尺度残差网络。该网络块可以增强视频超分辨网络对不同尺度物体的超分辨能力,实现超分辨网络总体性能的提高。3.针对常规视频超分辨方法在初始特征提取阶段进行单一的卷积操作,不能很好地对多尺度特征进行提取的问题,提出多分支的初始感知模块,增强超分辨神经网络对图像特征的初始提取能力。4.针对光流法对时间跨度较大的视频相邻帧不适用,存在较大误差,进而影响超分辨性能的现象,提出渐进运动补偿策略,有效降低运动补偿误差。5.针对卷积神经网络难以提取空间跨度较大的相似图像块信息的现象,在初始特征提取阶段引入非局部神经网络,实现高效的空间特征提取。6.针对传统卷积神经网络简单地将组成网络的构建块进行级联,使得模型多尺度映射能力差、感受野单一的情况,提出多尺度网络架构作为网络的基础构建形式,可以嵌入多种多样的构建块,在不改变构建块结构的情况下,赋予神经网络多尺度映射能力,进一步提高了视频超分辨网络的性能。综合上述技术,本文构建了一个端到端的卷积神经网络。实验表明,整体神经网络的视频超分辨性能达到当下的先进水平。
尉婉丽[7](2020)在《3D视觉舒适度预测技术研究》文中提出三维(Three Dimension,3D)多媒体服务能给用户带来逼真的视觉体验,是多媒体技术的发展趋势之一。然而当前市场上的3D图像/视频质量参差不齐,人们在观看3D图像/视频时常会产生一定程度的视觉不舒适,因此需要对其进行感知舒适度评价。由于人眼主观判定3D图像/视频舒适度费时费力,所以人们须探求对其进行客观舒适度预测的方法,并在此基础上改善3D图像/视频的视觉感知舒适度。现有的3D视觉客观舒适度预测方法大多基于空域和时域信息,未能结合压缩域(频域)信息,这些方法尚未充分挖掘3D图像/视频的可用信息。基于上述研究背景,本学位论文主要研究如何有效地利用压缩域(频域)信息建立3D图像/视频舒适度的客观预测模型,并对3D视频进行舒适度提升。本文主要工作内容如下:1)提出了一个基于DCT变换的3D图像舒适度预测模型(3D-Ms DCT)。由于二维离散余弦变换(Discrete Cosine Transform,DCT)被广泛应用于图像/视频压缩中,因此本文对视差图进行多尺度DCT变换,从多尺度变换系数中提取出3D视觉舒适度特征。该模型定义了三类多尺度视觉舒适度特征,分别是8种不同尺度下的基本视差强度特征、7种尺度下的视差梯度能量特征和8种尺度下的视差纹理复杂度特征,然后采用随机森林回归算法训练融合23个多尺度视觉舒适度特征,从而获取最终的3D图像视觉舒适度预测值,率先实现了利用压缩域信息进行3D图像视觉舒适度的精确预测。2)以3D图像舒适度预测中提取的三类频域特征为基础,提出了一个空域、频域特征相结合的3D图像舒适度预测算法(3D-SF)。为充分挖掘3D图像的视觉不舒适因素,本文基于视差图的空间分布特性,提取了视差幅值、视差梯度、视差最大值与视差范围4个传统特征,归为空域低级视差特征。在此基础上,本文又将影响3D视觉舒适度的图像复杂度、目标边界突变、目标横向距离以及左、右边界视差这5个新参数作为影响视觉舒适度的空域高级视差特征,然后联合单尺度下的3个频域视差特征,共计12个舒适度特征进行3D图像舒适度预测。在特征融合中,本文采用了极端随机树回归模型来训练学习。实验结果表明该算法能提高预测的效率和准确度。3)提出了一个多维特征融合的3D视频舒适度预测算法(3D-SFT)。在3D场景中,由于物体运动特性是影响人眼观看3D视频舒适度的关键因素,所以本文挖掘了3D视频中目标物体在纵深方向运动的深度变化信息和物体在二维空间上的运动信息来衡量3D舒适度。之后通过结合视差图DCT变换后的频域特征和空域舒适度特征来进行3D视频舒适度预测。实验结果表明该算法提升了3D视频舒适度预测的准确度。此外,本文还提出了一种基于深度调整的3D视频舒适度改善方法,实验结果显示该方法能在一定程度上改善3D视频的舒适度。
宇欣[8](2019)在《兼容传输四原色宽色域视频图像的方法研究》文中指出近年来宽色域视频图像技术取得了较大发展,通过采用更加饱和的三原色的成像与显示技术以及采用多原色背光或多原色彩色滤光阵列的多原色成像与显示技术大大提高了色域覆盖范围。本论文对目前扩展色域的三原色及多原色数字成像与显示技术进行了广泛研究与分析,并针对当前多原色宽色域成像系统的图像信号无法在现有标准三原色通道传输和多原色宽色域显示系统没有多原色图像源的问题,设计并实现了与三原色标准相兼容的四原色宽色域视频图像颜色空间编解码方案,验证了其对主流视频图像编码标准的适用性,主要内容包括:1、设计了基于四边形分解的四原色视频图像颜色编解码方案,解决了额外传输第四原色色度分量,造成数据量极大增加的问题。由四原色构成的四边形被分解为两个三角形,位于每个三角形内的复合色光可以由三原色进行唯一地表达。2、提出了两种与YUV格式相兼容的四原色视频图像颜色表达方法。在图像中,对可以由通用三原色,即红色R、绿色G和蓝色B(RGB)混色而成的像素区域采用标准颜色编码方程,编码为亮度信号和两个色差信号(YUV)的格式;对不能由RGB三原色而可以由G、B和第四原色X(XGB)混色而成的像素区域采用不同的颜色编码方法,编码为伪YUV信号格式。3、实现了YUV信号来源的盲识别,即识别其来源于RGB三原色还是XGB三原色。本论文首先采用通用RGB解码方程解码YUV信号,如果YUV信号由XGB三原色混色而成,解出的原色信号值存在负值,而由RGB三原色混色而成的YUV信号不会出现这种情况。以此来实现盲识别YUV信号的三原色来源,进而达到正确传输与显示四原色视频图像的目的。4、验证了四原色视频图像颜色表达方法对于主流视频图像压缩算法JPEG以及基于Main-RExt框架的HEVC/H.265的适用性。实验结果表明,本论文提出的四原色视频图像颜色空间编解码方案可以基于三原色通道正确表达与传输四原色视频图像内容,有效地提高了编码效率,并且在图像压缩率、峰值信噪比、结构相似度和运行时间各方面提升了图像压缩性能。
刘何雁[9](2019)在《论影视技术对纪录片的双重作用 ——兼谈“影像茧房”的建构》文中进行了进一步梳理电影的发明是从纪录电影开始的,一部影视技术发展史就是一部包含纪录影像在内的影视艺术发展史。技术是带有双面性的,影视技术对纪录片的作用必然是双重的。恰如其分、相得益彰的技术使用,可以在逼真反映客观现实的基础上产生准确认知,提高认知能力,并进一步形成审美意象,扩展审美空间,提升审美境界,使人破茧而出,飞向自由王国;如果应用得不好,则容易在逼真的外衣下制造假象,或流于自然主义的纪录,或技术主义的炫耀使用,则会抑制审美意象的形成,使人作茧自缚。影视技术具有逼真纪录、揭示和再现客观现实世界的能力,这种优势在通向更高艺术境界的道路上不应该成为前进的障碍与桎梏。当下,人成为主体并日益以图像的方式来把握世界。影视技术的首要功能在于纪录和揭示,然后才是基于此之上艺术想象力的放飞。本文基于对影视技术发展规律性和必然性的考察,结合纪实美学,提出了“影像茧房”的概念。具体路径是:首先,在实践上,“影像茧房”概念的形成得益于VR纪录片创作中周围沉浸式的视觉感受;在理论上,结合技术哲学、唐·伊德的技术现象学、梅洛-庞蒂的知觉现象学、格式塔心理学等理论层层推进和展开,在“人—技术—世界”关系的梳理中,根据唐·伊德提到的“技术蚕茧”,结合桑斯坦的“信息茧房”理论,推导出“影像茧房”的概念。在“人-影像-世界”的关系中,“影像茧房”是居间的中介技术系统,“影像茧房”作为中介体现了两个向度:一是“人的本质力量的对象化”,二是“自然向人的生成”,影视技术正是沿着人的延伸、具身、仿生、人性化、以人为尺度、全感官的参与、物质现实的复原等几个维度发展的。其次,本文从“影视技术对纪实美学的推动及规律性”,“‘影像茧房’的分层、功能与纪录片的关系”,“具体影视技术对纪实‘影像茧房’的推动与构建”三个方面展开论证,认为“影像茧房”是“完整电影”与时俱进的技术性呈现。它既是传播内容,也是传播渠道,还是传播终端;既是实体的,又是虚拟的;既是抽象的,又是具象的;体现了物质和精神、主体和客体的辩证统一。“影像茧房”的内核和基础就是纪录片影像,它以具身的方式进行高效准确的社会认知,纪录片得以成为人类生存之镜,纪实“影像茧房”也成为人们舒适栖息的小生境。最后,本文从视听意象的审美境界入手,解析了纪录片存在的矛盾与伦理困境,批判技术异化带来的负面影响,提出纪实影像能够深化人与环境之间关系的能力,不断提升人生境界。“影像茧房”作为人与世界双向互动的中介,消融了二元对立,呈现出主客一体,天人合一,人在大地上诗意栖居的美丽景象。
高鑫[10](2018)在《裸眼3D显示系统优化设计及性能提升的研究》文中认为在历史的发展长河中,人们从未停止过对显示技术的探索和追求。从黑白显示技术到彩色显示技术,从CRT显示技术到液晶显示技术再到今天的OLED显示技术,人们对显示的需求在不断地提高。现如今,人们在工作、生产和研究过程中往往需要获取物体的三维信息来进行精准地判断和分析,然而当今主流的显示方式都是基于平面的二维显示,它丢失了真实世界物体的深度信息,给人们的工作和生产带来了极大的不便。因此,裸眼3D显示技术被认为是下一代显示技术的主要发展方向。为了实现这个目的,科学家们提出了各种各样的方案来完成3D图像的再现。然而,这些裸眼3D显示系统还存在着许多问题需要去克服和解决,例如3D图像的清晰度低、观看视角窄、显示深度小及视点间存在串扰等。为了实现高质量的3D图像显示,针对上述问题,本文对提升裸眼3D显示系统显示性能的关键技术进行了研究。论文的主要研究内容和创新点如下:(1)正面投影显示系统光学系统的分析及优化设计研究要点1:基于柱面透镜阵列的正面投影显示系统由于透镜像差的原因导致了视点之间严重的串扰,也降低了 3D图像的清晰度。为了解决这个问题,本文基于赛德尔初级像差理论提出了增大透镜单元曲率半径或减小单元口径来降低视点间串扰的方案,通过仿真和实验证明了提出的方案能够在观看视角为48°的范围内将最大串扰程度由90%降低到10%以下。这种方案虽然降低了系统的串扰,但同时也减小了系统的观看周期。为了解决这个矛盾,本文利用像差平衡算法优化设计了一种月凸型非球面柱镜阵列,仿真和实验数据证明提出的结构在不减小系统观看周期的前提下将观看视角为48°范围内的最大串扰程度由90%降低到10%以下。(2)光场显示系统光学系统的分析及优化设计研究要点2:基于LCD与定向扩散屏的光场显示系统存在3D图像亮度不均匀且清晰度低的问题。本文针对第一个问题利用光能传播理论分析了这类显示系统光能利用率与系统参数之间的关系,提出了一种具有偏心光瞳的菲涅尔透镜阵列,实验证明提出的结构改善了3D图像的亮度均匀性并且将观看视角由41.9°增大到了 59.7°。针对第二个问题,本文在上一步的基础上提出了基于非球面基底和等效面型的结构,为提升3D图像的清晰度奠定了基础。(3)集成成像显示系统光学系统的分析及优化设计研究要点3:集成成像显示系统存在视点信息少、观看视角窄的问题。通过增大透镜单元的尺寸虽然能够提升系统的视点信息和观看视角,但是透镜单元之间的间隙和颗粒感会严重影响系统的3D显示效果。同时,透镜单元尺寸的增大也带来了更加严重的成像像差,并且随着出屏距离和观看视角的增大,再现3D图像的清晰度将进一步恶化。为了解决上述问题,本文在集成成像的基础上提出了一种基于天塞型复合透镜阵列和全息功能屏的悬浮3D显示系统,基于提出的系统,实现了显示尺寸为23.6英寸、观看视角为45°,出屏深度大于20cm,视点数为7744个且具有高清晰度的全视差悬浮3D显示效果。(4)360°裸眼3D显示系统光学系统的分析及优化设计研究要点4:为了实现一个以LCD显示源为基础且具有高清晰度的360°裸眼3D显示系统,本文提出了一种基于三重复合型透镜阵列和全息功能屏的360°裸眼3D显示系统。在讨论中,本文首先分析了提出的显示系统在单透镜阵列情况下的像差特点及其对显示效果的影响;其次,根据显示系统环形视区的特点设计了一种三重复合型透镜阵列来抑制系统的像差,保证了观看视区范围内的MTF曲线值大于0.6。最后,基于设计的透镜阵列和全息功能屏实现了一个最大单侧径向观看视角为30°,视点数为7744个且具有高清晰度的3D显示效果。
二、HDTV成像与电影成像的总体性能比较(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、HDTV成像与电影成像的总体性能比较(论文提纲范文)
(1)基于深度学习的脑功能连接挖掘方法及脑老化应用研究(论文提纲范文)
摘要 |
ABSTRACT |
符号说明 |
缩略词 |
第1章 绪论 |
1.1 研究背景及意义 |
1.2 国内外研究现状 |
1.2.1 功能磁共振成像 |
1.2.2 静息态与自然刺激范式 |
1.2.3 功能磁共振分析方法 |
1.2.4 深度学习在fMRI研究中的应用 |
1.2.5 脑老化功能连接 |
1.2.6 脑老化神经影像大数据 |
1.3 本文主要创新工作 |
1.4 本文章节内容安排 |
第2章 研究方案及关键技术 |
2.1 研究方案 |
2.1.1 数据收集 |
2.1.2 功能磁共振数据预处理 |
2.2 关键技术 |
2.2.1 一般线性模型 |
2.2.2 自编码机 |
2.2.3 深度神经网络 |
2.2.4 集成学习 |
第3章 基于深度学习的脑老化功能信息挖掘研究 |
3.1 引言 |
3.2 数据与方法 |
3.2.1 数据描述与处理 |
3.2.2 DAFA概述 |
3.2.3 自编码机 |
3.2.4 标签重建 |
3.2.5 Search-back分析 |
3.3 实验结果 |
3.3.1 DAFA参数学习 |
3.3.2 脑老化功能连接分布 |
3.3.3 脑老化功能连接变化 |
3.3.4 行为评分相关分析 |
3.4 讨论 |
3.4.1 方法可行性 |
3.4.2 fMRI大数据视角 |
3.4.3 脑老化功能连接 |
3.5 本章小结 |
第4章 基于深度学习的流体智力预测研究 |
4.1 引言 |
4.2 数据与方法 |
4.2.1 数据描述与处理 |
4.2.2 空间自编码机 |
4.2.3 预测模型构建 |
4.3 实验结果 |
4.3.1 参数学习 |
4.3.2 预测性能 |
4.3.3 特征可视化 |
4.4 讨论 |
4.4.1 自然刺激范式 |
4.4.2 方法可行性 |
4.4.3 特征可解释性 |
4.5 本章小结 |
第5章 基于局部脑功能信息的脑功能毕生演化研究 |
5.1 引言 |
5.2 数据与方法 |
5.2.1 数据描述与处理 |
5.2.2 一般线性模型 |
5.3 实验结果 |
5.3.1 局部功能连接变化 |
5.3.2 lFCD相关阈值分析 |
5.3.3 性别差异分析 |
5.3.4 行为评分相关分析 |
5.4 讨论 |
5.4.1 毕生局部功能连接变化 |
5.4.2 脑网络补偿机制 |
5.5 本章小结 |
第6章 总结与展望 |
6.1 总结 |
6.2 展望 |
参考文献 |
附录A AAL模版脑区中英文对照 |
附录B Dosenbach's ROI信息 |
攻读学位期间科研成果 |
致谢 |
(2)基于感知信息的图像质量评价方法研究(论文提纲范文)
摘要 |
Abstract |
第1章 绪论 |
1.1 课题背景及研究目的和意义 |
1.2 2D(二维)图像质量评价 |
1.2.1 主观质量评价 |
1.2.2 客观质量评价 |
1.3 3D(立体)图像质量评价 |
1.3.1 影响3D视觉质量的因素 |
1.3.2 主观质量评价 |
1.3.3 客观质量评价 |
1.4 图像质量评价指标 |
1.5 论文的主要研究内容及章节安排 |
第2章 国内外研究现状 |
2.1 部分参考质量评价研究现状 |
2.1.1 2D(二维)图像质量评价方法的研究现状 |
2.1.2 3D(立体)图像质量评价方法的研究现状 |
2.2 基于稀疏表示的质量评价研究现状 |
2.2.1 2D(二维)图像质量评价方法的研究现状 |
2.2.2 3D(立体)图像质量评价方法的研究现状 |
2.3 基于自然场景统计的质量评价研究现状 |
2.3.1 2D(二维)图像质量评价方法的研究现状 |
2.3.2 3D(立体)图像质量评价方法的研究现状 |
2.4 本章小结 |
第3章 基于分类基元熵的部分参考二维图像与立体图像质量评价 |
3.1 引言 |
3.2 稀疏表示理论 |
3.3 基于分类基元熵的二维图像质量评价 |
3.3.1 二维图像的视觉感知信息 |
3.3.2 实验结果 |
3.4 基于分类基元熵的立体图像质量评价 |
3.4.1 立体图像的视觉感知信息 |
3.4.1.1 分类基元熵 |
3.4.1.2 分类基元互信息 |
3.4.1.3 最大值机制 |
3.4.1.4 基于SVR的质量预测 |
3.4.2 实验结果 |
3.5 本章小结 |
第4章 基于稀疏表示和自然场景统计的立体图像质量评价 |
4.1 引言 |
4.2 基于稀疏表示与自然场景统计的部分参考立体图像质量评价 |
4.2.1 视觉感知信息 |
4.2.2 自然场景统计 |
4.2.3 质量评价模型 |
4.3 实验结果 |
4.3.1 实验设置 |
4.3.2 性能测试 |
4.4 本章小结 |
第5章 基于稀疏表示的感知信息模型的图像质量评价 |
5.1 引言 |
5.2 基于稀疏表示的感知信息模型的部分参考图像质量评价 |
5.2.1 基于稀疏卷积受限玻尔兹曼机的字典学习 |
5.2.2 视觉基元分类 |
5.3 实验结果 |
5.3.1 实验设置 |
5.3.2 性能测试 |
5.4 本章小结 |
结论 |
参考文献 |
攻读博士学位期间发表的论文及其它成果 |
致谢 |
个人简历 |
(3)新型显示技术的视觉感知和工效研究(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 研究背景及目的 |
1.2 相关研究状况 |
1.2.1 工作执行度和视疲劳度相关研究 |
1.2.2 感知画质相关研究 |
1.2.3 人眼感知亮度相关研究 |
1.2.4 运动伪影相关研究 |
1.2.5 高动态范围关键技术及相关标准 |
1.3 论文内容安排 |
第二章 研究涉及的理论背景 |
2.1 人眼视觉系统 |
2.1.1 人眼构造 |
2.1.2 视细胞 |
2.1.3 眼球运动 |
2.2 现代显示技术特性 |
2.2.1 曲面显示 |
2.2.2 有机发光二极管显示 |
2.2.3 高动态范围 |
2.3 心理物理实验 |
2.3.1 Weber定律 |
2.3.2 Fechner定律 |
2.3.3 Stevens定律 |
2.3.4 实验方法 |
2.4 统计处理方法 |
2.4.1 一致性系数 |
2.4.2 Kendall认可系数 |
2.4.3 变异系数 |
2.4.4 皮尔森相关系数 |
2.5 颜色外观 |
2.5.1 术语定义 |
2.5.2 颜色外观现象 |
2.6 本章小结 |
第三章 屏幕曲率对视觉工作执行度、视疲劳度以及感知画质产生的影响研究 |
3.1 研究内容和方法 |
3.1.1 实验环境 |
3.2 如何评估视觉工作执行度和视疲劳度 |
3.2.1 工作内容 |
3.2.2 如何评估视觉工作执行度 |
3.2.3 眼睛疲劳度定量性评价方法 |
3.3 如何评价感知画质 |
3.4 实验结果和分析 |
3.4.1 视觉工作执行度结果分析 |
3.4.2 视疲劳定量结果分析 |
3.4.3 感知画质评价结果分析 |
3.4.4 考虑屏幕大小的最佳曲率分析 |
3.5 本章小结 |
第四章 环境亮度和刺激大小对感知亮度影响研究 |
4.1 研究内容与方法 |
4.1.1 实验设置和图像 |
4.1.2 实验方法 |
4.2 实验结果和分析 |
4.2.1 屏周边视觉的光亮度强度引起的观测视亮度的变化 |
4.2.2 显示屏上随着视场的大小的视亮度变化 |
4.2.3 从显示屏上根据周边视觉的强度和FOV大小得出视亮度幂指数 |
4.2.4 显示屏中周边视觉的光亮度强度和感知亮度的关系 |
4.3 本章小结 |
第五章 动态图像在OLED和 LCD的视觉工作影响研究 |
5.1 研究内容与方法 |
5.1.1 实验环境设置 |
5.1.2 实验图像设置 |
5.1.3 视觉工作执行度评价方法 |
5.1.4 通过模拟器不适感调查表视疲劳度测量方法 |
5.2 实验结果和分析 |
5.2.1 视觉工作执行度 |
5.2.2 视疲劳度 |
5.3 本章小结 |
第六章 基于人眼感知亮度的高动态范围技术评估方法的开发 |
6.1 高动态范围技术的现状 |
6.1.1 高动态范围显示屏现状 |
6.2 评估高动态范围显示屏的必要性 |
6.2.1 标准动态范围和高动态范围在人类视亮度认知方面的差异 |
6.2.2 动态范围与变换函数的关系 |
6.2.3 现有显示屏评价方法存在的问题 |
6.3 提出新的高动态范围显示屏评价方法 |
6.3.1 高动态范围覆盖范围测定图案 |
6.3.2 高动态范围覆盖范围函数 |
6.3.3 高动态范围覆盖范围偏差率函数 |
6.3.4 适用显示屏评价方法的结果 |
6.4 本章小结 |
第七章 基于感知亮度认知的影像处理研究 |
7.1 高动态范围技术 |
7.1.1 光亮度调整 |
7.1.2 光电/电光转换函数标准 |
7.1.3 图像增强算法现状 |
7.2 新影像处理函数的必要性 |
7.2.1 现有影像处理函数 |
7.2.2 现有影像处理函数的问题 |
7.3 新的影像处理函数方案 |
7.3.1 新的影像处理函数 |
7.3.2 提出的新函数应用效果 |
7.4 本章小结 |
第八章 总结与展望 |
8.1 总结 |
8.2 展望 |
参考文献 |
致谢 |
作者简介 |
(4)图像重定向与质量评价(论文提纲范文)
摘要 |
ABSTRACT |
第1章 绪论 |
1.1 研究背景 |
1.2 研究现状 |
1.2.1 2D图像重定向 |
1.2.2 立体图像重定向 |
1.2.3 2D重定向图像质量评价 |
1.2.4 立体重定向图像质量评价 |
1.2.5 影响视觉舒适度的因素 |
1.3 论文内容与结构 |
1.3.1 研究内容 |
1.3.2 章节安排 |
第2章 立体重定向图像主观数据集 |
2.1 原始立体图像的选取 |
2.2 立体重定向图像的生成 |
2.2.1 Stereo cropping处理 |
2.2.2 Stereo seam carving处理 |
2.2.3 Stereo scaling处理 |
2.2.4 Stereo multi-operator处理 |
2.2.5 视差调整 |
2.3 主观评价实验 |
2.3.1 实验环境 |
2.3.2 实验说明 |
2.3.3 打分模式 |
2.4 实验数据的处理与分析 |
2.5 本章小结 |
第3章 基于混合失真聚合的视觉舒适度评价模型 |
3.1 局部结构失真度量 |
3.2 信息丢失度量 |
3.3 双目冲突度量 |
3.3.1 视差范围特征 |
3.3.2 感知交替特征 |
3.3.3 视差强度分布特征 |
3.4 语义失真度量 |
3.5 实验验证 |
3.5.1 实验设置和评价指标 |
3.5.2 实验结果 |
3.6 本章小结 |
第4章 基于主动学习的质量评价模型 |
4.1 主动学习用于传统的质量评价 |
4.1.1 采样策略 |
4.1.2 实验结果 |
4.2 主动学习用于基于深度学习的质量评价 |
4.2.1 采样策略 |
4.2.2 实验结果 |
4.3 本章小结 |
第5章 基于强化学习的质量感知的多算子图像重定向模型 |
5.1 多算子重定向任务的建模 |
5.2 Agent的设计 |
5.3 Reward的设计 |
5.3.1 语义感知度量 |
5.3.2 美学感知度量 |
5.4 训练过程 |
5.5 实验验证 |
5.5.1 实验设置 |
5.5.2 性能比较 |
5.5.3 消融实验 |
5.5.4 分析讨论 |
5.6 本章小结 |
第6章 总结与展望 |
6.1 总结 |
6.2 展望 |
参考文献 |
致谢 |
在读期间发表的学术论文与取得的研究成果 |
(5)基于人脑磁共振图像的个体认知参数的多标签预测研究(论文提纲范文)
致谢 |
摘要 |
ABSTRACT |
1 引言 |
1.1 基于静息状态fMRI的人脑功能研究 |
1.2 基于自然状态fMRI的人脑功能研究 |
1.3 基于人脑磁共振图像的个体认知参数预测 |
1.4 个体认知参数的多标签预测研究 |
1.5 本文工作及章节安排 |
2 基于偏最小二乘回归算法的多个认知参数预测 |
2.1 引言 |
2.1.1 偏最小二乘回归算法 |
2.1.2 核偏最小二乘回归算法 |
2.1.3 常用于认知参数预测的机器学习算法 |
2.2 数据与方法 |
2.2.1 实验数据与预处理 |
2.2.2 个体认知指标的多标签集 |
2.2.3 脑功能连接分析 |
2.2.4 偏最小二乘回归预测模型 |
2.2.5 评估RSFC的贡献 |
2.3 实验结果及分析 |
2.3.1 基于PLSR的多标签和单标签的预测结果 |
2.3.2 PLSR预测结果与以往研究结果对比 |
2.3.3 PLSR超参数、ROI定义和RSFC评价策略的影响 |
2.3.4 生理意义探究 |
2.3.5 基于KPLSR的多标签预测预测结果 |
2.3.6 样本家庭结构因素探究 |
2.4 本章小结 |
3 基于典型关联分析算法的认知参数多标签预测 |
3.1 引言 |
3.1.1 典型关联分析算法 |
3.1.2 正则典型关联分析算法 |
3.1.3 基于核的典型关联分析算法 |
3.2 数据与方法 |
3.2.1 实验数据与预处理 |
3.2.2 个体认知指标的多标签集 |
3.2.3 脑功能连接分析 |
3.2.4 三种典型关联分析的预测模型 |
3.3 实验结果及分析 |
3.3.1 基于CCA及变式的多标签预测结果 |
3.3.2 CCA及变式的单标签与多标签预测结果对比 |
3.3.3 与以往研究对比 |
3.3.4 RSFC评价策略对结果的影响 |
3.3.5 ROI数量对结果的影响 |
3.3.6 rCCA的正则项系数对结果的影响 |
3.4 本章小结 |
4 基于自然状态fMRI的认知参数多标签预测 |
4.1 引言 |
4.1.1 自然状态fMRI的优点 |
4.1.2 基于自然状态fMRI的脑功能研究现状 |
4.2 数据与方法 |
4.2.1 实验数据与预处理 |
4.2.2 个体认知指标的多标签集 |
4.2.3 脑功能连接分析 |
4.2.4 不同的脑功能特征提取 |
4.2.5 个体认知参数预测模型的构建 |
4.3 实验结果及分析 |
4.3.1 基于FC特征的多标签预测结果 |
4.3.2 基于ISC特征的多标签预测结果 |
4.3.3 基于ISFC特征的多标签预测结果 |
4.3.4 基于自然刺激的响应幅度特征的多标签预测结果 |
4.3.5 基于残余信号的功能连接特征的多标签预测结果 |
4.4 本章小结 |
5 总结与展望 |
参考文献 |
作者简历及攻读硕士学位期间取得的研究成果 |
学位论文数据集 |
(6)基于运动补偿的视频超分辨技术研究(论文提纲范文)
摘要 |
abstract |
第一章 绪论 |
1.1 研究内容的研究背景及意义 |
1.2 国内外研究历史与现状 |
1.2.1 基于插值的方法 |
1.2.2 基于重构的方法 |
1.2.3 基于学习的方法 |
1.3 本论文的研究内容 |
1.4 本论文的结构安排 |
第二章 超分辨技术基本理论 |
2.1 超分辨技术基本理论 |
2.1.1 图像分辨率 |
2.1.2 单图像超分辨和多帧图像超分辨 |
2.2 超分辨图像评价指标 |
2.3 基于深度学习的超分辨技术 |
2.3.1 人工神经网络基本结构 |
2.3.2 卷积神经网络 |
2.3.3 基于卷积神经网络的超分辨技术 |
2.4 运动补偿与视频超分辨 |
2.4.1 运动补偿与超分辨 |
2.4.2 空间变换网络 |
2.4.3 视频超分辨中的运动补偿 |
2.5 本章小结 |
第三章 基于多帧融合策略和多尺度残差网络的视频超分辨技术 |
3.1 应用于视频超分辨的多帧融合网络 |
3.1.1 早融合与晚融合 |
3.1.2 多帧融合网络 |
3.2 多尺度残差网络 |
3.2.1 残差连接和残差学习 |
3.2.2 感受野 |
3.2.3 多尺度残差网络 |
3.3 多帧融合视频超分辨网络 |
3.3.1 多帧融合视频超分辨网络架构 |
3.3.2 神经网络的训练及实验数据 |
3.4 实验对比 |
3.4.1 网络总体性能对比 |
3.4.2 有效性验证 |
3.5 本章小结 |
第四章 基于运动估计的多尺度视频超分辨网络 |
4.1 光流 |
4.1.1 光流的基本概念 |
4.1.2 光流基本约束方程 |
4.1.3 Horn-Schunck光流模型 |
4.1.4 Lucas-Kanade光流模型 |
4.2 初始感知模块 |
4.3 主旁融合网络 |
4.4 基于运动估计的多帧融合视频超分辨网络 |
4.5 实验结果 |
4.5.1 网络总体性能对比 |
4.5.2 有效性验证 |
4.6 本章小结 |
第五章 基于渐进运动补偿的视频超分辨网络 |
5.1 渐进运动补偿策略 |
5.2 非局部神经网络 |
5.3 多尺度网络架构 |
5.4 基于渐进运动补偿的视频超分辨网络 |
5.5 实验对比 |
5.5.1 网络总体性能对比 |
5.5.2 有效性验证 |
5.6 本章小结 |
第六章 全文总结与展望 |
6.1 全文总结 |
6.2 后续工作展望 |
致谢 |
参考文献 |
攻读专业硕士学位期间取得的成果 |
(7)3D视觉舒适度预测技术研究(论文提纲范文)
摘要 |
ABSTRACT |
第1章 绪论 |
1.1 选题背景与意义 |
1.2 国外研究现状 |
1.2.1 3D图像舒适度预测研究 |
1.2.2 3D视频舒适度预测研究 |
1.2.3 3D视觉舒适度改善研究 |
1.3 国内研究现状 |
1.3.1 3D图像舒适度预测研究 |
1.3.2 3D视频舒适度预测研究 |
1.3.3 3D视觉舒适度改善研究 |
1.4 论文主要内容及安排 |
1.4.1 论文主要内容 |
1.4.2 论文结构安排 |
第2章 双目视觉及3D视觉舒适度影响因素 |
2.1 双目视觉原理 |
2.1.1 人眼构造 |
2.1.2 视觉神经 |
2.1.3 双目视觉 |
2.2 立体显示 |
2.2.1 立体成像原理 |
2.2.2 立体显示技术 |
2.3 3D视觉舒适度关键影响因素 |
2.3.1 双目视差 |
2.3.1.1 水平视差 |
2.3.1.2 垂直视差 |
2.3.1.3 运动视差 |
2.3.1.4 视差变化 |
2.3.2 辐辏与调节 |
2.3.2.1 辐辏 |
2.3.2.2 调节 |
2.3.2.3 辐辏调节不一致 |
2.3.3 双目竞争 |
2.3.3.1 亮度感知 |
2.3.3.2 色度感知 |
2.3.3.3 边缘感知 |
2.3.4 心理因素 |
2.3.4.1 视觉注意机制 |
2.3.4.2 视觉内在推导 |
2.4 本章小结 |
第3章 使用多尺度DCT特征的3D图像舒适度预测 |
3.1 算法模型架构概述 |
3.2 图像DCT原理 |
3.3 特征提取 |
3.3.1 基础视差强度(BDI) |
3.3.2 视差梯度能量(DGE) |
3.3.3 视差纹理复杂度(DTC) |
3.4 特征融合 |
3.4.1 线性回归 |
3.4.2 非线性回归 |
3.5 实验结果与分析 |
3.5.1 性能指标 |
3.5.2 回归模型分析 |
3.5.3 交叉验证 |
3.5.4 性能比较 |
3.5.5 特征性能 |
3.5.6 多尺度贡献 |
3.6 本章小结 |
第4章 基于空域与频域特征的3D图像舒适度预测 |
4.1 算法模型架构概述 |
4.2 特征提取 |
4.2.1 空域低级视差特征 |
4.2.2 空域高级视差特征 |
4.2.2.1 图像复杂度 |
4.2.2.2 目标边界突变 |
4.2.2.3 目标横向距离 |
4.2.2.4 左、右边界视差 |
4.2.3 频域视差特征 |
4.3 特征融合 |
4.4 实验结果分析 |
4.4.1 特征贡献度 |
4.4.2 性能比较 |
4.4.3 回归模型分析 |
4.4.4 交叉验证 |
4.5 本章小结 |
第5章 基于多域特征的3D视频舒适度预测与改善 |
5.1 算法模型架构概述 |
5.2 特征提取与融合 |
5.2.1 空域及频域特征提取 |
5.2.2 时域特征提取 |
5.2.2.1 纵深方向深度运动时域特征 |
5.2.2.2 二维空间运动方向时域特征 |
5.2.3 特征融合 |
5.3 基于深度调整的3D视频舒适度改善 |
5.3.1 深度与视差 |
5.3.2 深度调整 |
5.3.2.1 深度滤波 |
5.3.2.2 深度去纹理 |
5.4 实验结果与分析 |
5.4.1 性能指标 |
5.4.2 舒适度预测性能分析 |
5.4.3 特征贡献度 |
5.4.4 舒适度改善性能分析 |
5.5 本章小结 |
第6章 结束语 |
6.1 全文总结 |
6.2 研究展望 |
致谢 |
参考文献 |
附录 作者在读研期间发表的术论文及参加的科研项目 |
(8)兼容传输四原色宽色域视频图像的方法研究(论文提纲范文)
摘要 |
abstract |
第1章 绪论 |
1.1 课题研究背景与意义 |
1.2 宽色域视频图像技术及其研究进展 |
1.2.1 传输“负”值色光信号 |
1.2.2 采用饱和度更高的三原色 |
1.2.3 多原色成像技术 |
1.2.4 多原色显示技术 |
1.3 论文主要工作和章节安排 |
第2章 宽色域视频图像技术相关基础理论 |
2.1 色彩空间 |
2.1.1 1931 CIERGB色彩空间 |
2.1.2 1931 CIEXYZ和 CIE xy Y色彩空间 |
2.1.3 1976 CIE LUV色彩空间 |
2.2 颜色变换方法 |
2.2.1 YCbCr |
2.2.2 YCoCg |
2.2.3 GrBrR |
2.3 YUV采样格式 |
2.3.1 YUV 4: 4: 4 |
2.3.2 YUV 4: 2: 2 |
2.3.3 YUV 4: 2: 0 |
2.3.4 YUV 4: 1: 1 |
2.4 相关参数 |
2.4.1 色域覆盖率 |
2.4.2 图像压缩率 |
2.4.3 视频图像质量评价标准 |
2.4.4 运行时间 |
2.5 小结 |
第3章 基于三原色通道的四原色视频图像颜色编解码方案设计 |
3.1 传输方法 |
3.1.1 直接方法 |
3.1.2 四边形分解方法 |
3.2 盲识别方案 |
3.3 RGB颜色空间的编解码方法 |
3.3.1 HDTV色度系统的颜色编解码方法 |
3.3.2 UHDTV色度系统的颜色编解码方法 |
3.4 XGB1 颜色空间的编解码方法 |
3.5 XGB2 颜色空间的编解码方法 |
3.6 小结 |
第4章 方案评价与分析 |
4.1 方案对JPEG适用性的评价分析 |
4.1.1 JPEG编解码流程 |
4.1.2 性能参数评价 |
4.2 方案对HEVC适用性的评价分析 |
4.2.1 HEVC编解码流程 |
4.2.2 性能参数评价 |
4.3 主观实验结果 |
4.4 小结 |
第5章 总结与展望 |
5.1 工作总结 |
5.2 不足与展望 |
参考文献 |
发表论文和参与科研情况说明 |
致谢 |
(9)论影视技术对纪录片的双重作用 ——兼谈“影像茧房”的建构(论文提纲范文)
摘要 |
Abstract |
绪论 |
第一节 选题提出与研究意义 |
一、问题的提出 |
二、理论意义 |
三、实践意义 |
第二节 核心概念的界定 |
一、技术的概念 |
二、影视技术的概念 |
三、“影像茧房”的概念 |
第三节 文献综述 |
一、核心文献综述 |
二、直接相关文献综述 |
三、间接相关文献综述 |
第四节 研究框架、思路方法与创新点难点 |
一、研究框架 |
二、研究资料与研究方法 |
三、创新点、难点与不足 |
第一章 “影像茧房”的理论来源及纪实美学的支撑 |
第一节 技术哲学视阈下的技术与影视技术 |
一、马克思的技术哲学思想及启示 |
二、卡普的“器官投影说”及启示 |
三、唐·伊德的技术具身理论及启示 |
第二节 技术、身体与知觉 |
一、诗性智慧与具身认知思维 |
二、梅洛-庞蒂的知觉现象学及启示 |
三、格式塔心理学及启示 |
第三节 纪实美学理论对“影像茧房”的支撑 |
一、“完整电影”对“影像茧房”的支撑 |
二、“物质现实的复原”对“影像茧房”的支撑 |
三、技术复制对“影像茧房”的支撑 |
第四节 技术美学与技术艺术学视角下的透视 |
一、技术美学对技术的透视 |
二、技术艺术学对影视技术的透视 |
三、技术与艺术的统一性和相异性 |
第二章 影视技术对纪实美学的推动及其规律性 |
第一节 从纪录片史看影视技术对纪实美学的推动 |
一、影视技术对早期纪实美学的直接推动 |
二、影视技术对真实电影和直接电影的直接推动 |
三、影视技术的快速发展对纪实风格多样化的推动 |
第二节 从影视媒介史看影视技术的促进作用 |
一、摄影技术与精确写真 |
二、电影技术与照相的外延 |
三、电视技术及数字化趋势 |
第三节 从影视技术的规律性看“影像茧房”的必然性 |
一、跨时空的具身认知 |
二、全感官的具身认知 |
三、重量和质量的具身认知 |
第三章 “影像茧房”的分层、功能与纪录片的关系 |
第一节 “影像茧房”的分层结构 |
一、外部结构:人—影像—世界 |
二、内部分层:意义链的延伸 |
三、影像茧房的中心:受众 |
第二节 纪录片影像与社会认知 |
一、生存之镜:纪录片的社会认知 |
二、微相学:形神兼备的直观 |
三、VR全景纪录片与虚拟认知 |
第三节 数字技术对真的解构与反证 |
一、数字技术对真实的挑战与解构 |
二、解构的反证:拼贴与蒙太奇 |
三、真实的过程、后台及注脚 |
第四章 前沿影视技术对纪实“影像茧房”的推动与构建 |
第一节 前期拍摄技术的应用 |
一、镜头:电影眼睛 |
二、视角:时空的改变 |
三、运动:辅助设备的使用 |
第二节 后期制作技术的应用 |
一、非线编技术与非线性思维 |
二、动画CG对情景再现的推动 |
三、媒资系统对文献纪录片的推动 |
第三节 影视传播技术的应用 |
一、媒介融合下的多渠道传播 |
二、媒介融合下的多屏幕收看 |
三、媒介融合下的网络化生存与传播 |
第五章 作茧自缚与化茧为蝶 |
第一节 镜子到艺术:诗意的提升 |
一、视听意象:官止神行 |
二、审美思辨与朴素之美 |
三、天人合一的审美境界 |
第二节 纪录片的矛盾与伦理困境 |
一、真实与伦理的矛盾 |
二、真实与审美的矛盾 |
三、真实与意识形态的矛盾 |
第三节 对技术异化的批判 |
一、生物技术与人工智能 |
二、技术代码与编码 |
三、危险与拯救 |
结语 |
参考文献 |
作者简历 |
致谢 |
(10)裸眼3D显示系统优化设计及性能提升的研究(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 引言 |
1.2 立体视觉感知原理 |
1.3 立体内容采集 |
1.4 立体显示技术发展概况 |
1.4.1 助视3D显示技术 |
1.4.2 VR/AR显示技术 |
1.4.3 基于狭缝光栅的裸眼立体显示技术 |
1.4.4 基于柱镜光栅的裸眼3D显示技术 |
1.4.5 基于微透镜阵列的集成成像显示技术 |
1.4.6 基于指向光源的裸眼3D显示技术 |
1.4.7 基于全息元件的裸眼3D显示技术 |
1.5 裸眼3D显示系统光学系统优化设计的意义 |
1.6 论文主要内容与结构安排 |
参考文献 |
第二章 裸眼3D显示的相关光学理论基础 |
2.1 理想光学系统 |
2.1.1 光学系统的一阶参数 |
2.1.2 组合光学系统参数计算 |
2.1.3 光学系统的光阑 |
2.2 光学系统的像差 |
2.2.1 像差的级数展开式 |
2.2.2 初级像差的表达式 |
2.3 光学系统的波动像差 |
2.4 非球面光学系统 |
2.5 光学系统的像质评价 |
2.6 本章小结 |
参考文献 |
第三章 正面投影显示系统优化设计及性能提升的研究 |
3.1 正面投影显示系统的分析 |
3.1.1 显示原理及参数分析 |
3.1.2 光路分布和投影阵列的排布 |
3.1.3 柱镜光栅的像差分析 |
3.1.4 仿真验证 |
3.1.5 实验结果与分析 |
3.2 基于非球面柱镜光栅的正面投影显示系统 |
3.2.1 非球面柱镜光栅的设计优化 |
3.2.2 光路仿真与像质评价 |
3.2.3 制造工艺与公差分析 |
3.3 结合柱镜光栅和孔径光阑阵列的正面投影显示系统 |
3.3.1 系统结构与光路分布 |
3.3.2 像差分析与优化 |
3.3.3 实验结果与分析 |
3.4 本章小结 |
参考文献 |
第四章 光场显示系统优化设计及性能提升的研究 |
4.1 基于投影仪阵列的光场显示系统 |
4.1.1 显示原理分析 |
4.1.2 存在的问题及解决方案 |
4.2 基于LCD和定向扩散屏的高亮度光场显示系统 |
4.2.1 基于LCD的光场显示系统的原理和存在的问题 |
4.2.2 具有偏心光瞳的菲涅尔透镜阵列 |
4.2.3 照度分析与实验验证 |
4.2.4 观看视角的分析 |
4.2.5 系统的像差分析及优化设计 |
4.3 本章小结 |
参考文献 |
第五章 集成成像显示系统优化设计及性能提升的研究 |
5.1 基于波动像差理论的显示景深分析 |
5.1.1 集成成像体像素与液晶显示器像素之间的关系 |
5.1.2 集成成像显示系统的衍射场分布 |
5.1.3 集成成像显示系统的景深分析 |
5.1.4 实验结果与分析 |
5.2 基于天塞透镜阵列和全息功能屏的悬浮显示系统 |
5.2.1 悬浮显示系统的近轴光路分析 |
5.2.2 全息功能屏的原理分析 |
5.2.3 悬浮显示系统的像差分析 |
5.2.4 天塞型透镜阵列的优化设计 |
5.2.5 实验结果与分析 |
5.3 本章小结 |
参考文献 |
第六章 360°裸眼3D显示系统优化设计及性能提升的研究 |
6.1 基于非球面离轴菲涅尔透镜的360°裸眼3D显示系统 |
6.1.1 系统结构及相关参数分析 |
6.1.2 离轴菲涅尔透镜的设计 |
6.2 基于三重复合型透镜阵列的360°裸眼3D显示系统 |
6.2.1 显示系统的结构及显示原理 |
6.2.2 显示系统的像差分析 |
6.2.3 复合透镜的优化设计 |
6.2.4 实验结果与分析 |
6.3 本章小结 |
参考文献 |
第七章 结论 |
7.1 研究内容与创新 |
7.2 不足与下一步研究方向 |
攻读博士期间发表的论文及发表专利 |
致谢 |
四、HDTV成像与电影成像的总体性能比较(论文参考文献)
- [1]基于深度学习的脑功能连接挖掘方法及脑老化应用研究[D]. 温昕. 太原理工大学, 2020
- [2]基于感知信息的图像质量评价方法研究[D]. 万照麟. 哈尔滨工业大学, 2020(02)
- [3]新型显示技术的视觉感知和工效研究[D]. 林敬昊(LIM Kyongho). 东南大学, 2020(01)
- [4]图像重定向与质量评价[D]. 周雅. 中国科学技术大学, 2020(01)
- [5]基于人脑磁共振图像的个体认知参数的多标签预测研究[D]. 陈晨. 北京交通大学, 2021(02)
- [6]基于运动补偿的视频超分辨技术研究[D]. 王世豪. 电子科技大学, 2020(07)
- [7]3D视觉舒适度预测技术研究[D]. 尉婉丽. 杭州电子科技大学, 2020(02)
- [8]兼容传输四原色宽色域视频图像的方法研究[D]. 宇欣. 天津大学, 2019(01)
- [9]论影视技术对纪录片的双重作用 ——兼谈“影像茧房”的建构[D]. 刘何雁. 南京艺术学院, 2019(01)
- [10]裸眼3D显示系统优化设计及性能提升的研究[D]. 高鑫. 北京邮电大学, 2018(10)