硕士论文网/国内首批论文服务机构

当前位置:硕士论文网首页 > 土木工程 > 土木工程监理的图像标注和R树指标优化方法

土木工程监理的图像标注和R树指标优化方法

时间:2020-12-14 22:53 | 栏目:土木工程 | 浏览:

硕士论文网第2020-12-14期,本期硕士论文写作指导老师为大家分享一篇土木工程文章《土木工程监理的图像标注和R树指标优化方法》,供大家在写论文时进行参考。
  本篇论文是一篇土木工程硕士论文范文,对于这些数据的索引和检索进行了优化,本文通过对 R 树的节点分裂方式进行了改进,提出了一种结合谱聚类的 SCS 节点分裂算法,在实验中展现了比对照方法更好的索引效率。同时,结合词向量方法的改进检索算法也有效提升了相比传统方法更好的检索查全率。 

  第 1 章  绪论

  1.1  研究背景及意义
  近年来,土木工程随着国家经济的高速发展也有了令人瞩目的增长。但是很多以往未发现的土木工程施工不规范等问题也随着工程数量的增长逐渐暴露出来,国家相关部门为了规范土木工程相关行业,在已有基础上借鉴国内外经验,大力推行土木工程监理制度。土木工程监理制度是指在一个土木工程在实施的过程中,不仅仅只有建设单位(招标方)和建筑单位(施工方),还要有一个经过认证的监理单位参与。其职责是保证建筑单位能够按照建设单位相关要求(如材料选择,施工标准等)施工的同时,符合国家和地方的相关标准,从而保证了整个工程的安全合乎规范,杜绝了各种隐患。土木工程监理的信息化也随着相关行业的快速发展,成为一个发展的趋势,但是同样因为土木工程监理行业的特殊性,面临了很多问题。在与相关土木工程监理公司合作的过程中,本文发现土木工程监理信息化过程中图像内容的处理是一个主要问题,这与当前计算机领域的发展也极为类似。于是,本文针对相关的问题,关键针对如下几点进行研究。首先是土木工程监理工程师在现场往往需要针对各种施工现场进行图片、视频内容的拍摄,以待进行相关施工标准的检验或者在后期监理例会时进行报告展示,但是很多时候因为种种原因,无法对相关的图像内容进行有效处理,在后期随着相关数据的快速增长无法检索,从而造成工作上的损失。其次是针对这些初步标注的图像内容,如果监理工程师在上面加上了如 10 号钢筋砼(钢筋混凝土)不合格等附加标签,后续人员如果搜索混凝土则无法找到这些图像,如何对这些内容进行有效的索引及检索也是一个需要解决的问题。
  1.2  本文研究内容及技术路线
  从上文分析可以看出,现有的主流方法在所述领域已经有了非常好的表现,但是考虑到大多是针对通用模型和大规模数据集,在处理土木工程监理图像时还有一些不足的地方,因此本文参考这些方法,针对土木工程监理图像数据做出了如下的研究。针对土木工程监理图像内容的辅助标注,首先提出了基于 Kmax 映射的注意力图模型迁移方法,通过提高注意力图的映射效率,提升模型迁移的效果;随后提出了针对图像标注模型的 Kmax 映射注意力图迁移算法,在图像模型迁移的基础上增加了整体模型的调整训练,在保证图像标注效果的前提下有效降低了参数量。针对土木工程监理图像的索引和检索,对于土木工程监理图像较为复杂的语义关系,参考相关标准文件,本文给出了土木工程监理图像的基本语义划分;对于土木工程监理图像的索引问题,提出了基于谱聚类节点分裂优化的 SCR 树,提升 R 树在相关数据上的索引速度;对于土木工程监理标注图像的检索,提出R 树节点检索算法,提升了节点的查全率。最后针对上文算法进行了相关实验,针对基于 Kmax 映射的注意力图模型迁移方法,在 CIFAR 数据集上进行了对比实验;针对基于 Kmax 映射  的注意力图图像标注模型迁移方法,在 MS COCO 数据集上进行了对比实验,针对多种指标进行了测试;针对基于谱聚类节点分裂优化的 SCS 算法,在土木工程监理标注图像数据集上进行了不同数据条数和页文件大小的对比实验;针对基于词向量优化的 R 树节点检索算法,进行了查全率指标下的对比实验。
 

  第 2 章  基于 Kmax 映射迁移的图像标注优化

  针对土木工程监理图像标注中对于现场使用的需求,现有的图像标注模型参数量过多,本章主要目标在于借助已有的图像标注模型,在其基础上进行模型迁移,使得新模型在尽可能降低模型参数量的前提下,保证尽可能高的准确度。为了解决问题,本文首先基于 NIC 模型构建了一个基础的图像标注模型,并在此基础上首先针对基于注意力图的模型迁移方法优化,随后将映射迁移方法应用于图像标注模型中,最后使用迁移后的模型对 MS COCO 数据集中部分图片及不同场景下的土木工程监理图像进行标注,并对标注结果进行了分析。
  2.1  基本图像标注模型框架
  在每天的工作生活中,我们都会接触到大量的图像数据,它们来自于电视、互联网、广告或者各种杂志报纸中。这些信息中包含的图像大部分都没有标注,人类能够很容易地获取其中的信息,但是计算机却很难对这些图像内容进行理解并且使得人类能够方便地使用这些信息。基于以上原因,学者对图像标注相关的内容进行了研究。图像标注可以用来进行自动的图像内容检索,这在基于内容的信息检索中至关重要。在多种学科领域和互联网公司中,图像标注都起到了巨大的作用。伴随着深度学习的快速发展,图像标注也迎来了新的发展。自 2014 年Neuraltalk 模型问世,图像标注模型迎来了蓬勃发展,本文基于这些研究,构建了一个基本的图像标注模型,用于进一步的研究。为了简化研究中遇到的问题,本文结合当前主流 NIC 框架,给出了以下基本的图像标注框架,本章针对图像标注的算法都是以此框架为基础。一般而言,神经网络随着层数的加深,其对相关特征的识别能力就会逐渐增强,但是在网络加深的同时,梯度消失、梯度爆炸、网络退化等问题也随之而来。K He 等提出了深度残差网络(Deep Residual Networks)来解决这些影响网络模型训练的主要问题。残差网络的设计思路是,假设每个网络模型都存在一个最优化的层次,其中存在某些网络层是没有起到作用,或者是影响了模型效果的(即造成了梯度消失和梯度爆炸问题),此时需要这些层次进行恒等映射,不对经过该层的网络参数进行修改,即使得经过该层的参数输入输出一致。而需要进行恒等映射的层由网络模型在训练的过程中自行进行判断。一个残差网络的结构如下表所示:
残差网络基本结构
  图 2.1 给出了一个基本的残差网络结构,在 Res Net34 中,则中间省略的卷积层对为 13 对,即 Res Net34 模型包含 16 个卷积层对,一个最初是的图像降维卷积层和最后的全连接层。而对于其中一些常用的辅助层,则不计算在内,在实际的使用汇总,一个残差网络主要包含了如下层次结构:1)  卷积层(Convolutional Layer):用于对图像进行卷积操作,借助卷积核在输入数据上面不断平移,同时对重合位置的矩阵做内积。其局部感受野及权值共享两种机制大幅降低了参数量较大的网络训练难度。2)池化层(Pooling Layer):用于对样本数据下采样,通常放置在卷积层之后。通过对池化窗口中的对应值计算(取均值或最大值),用结果指代区域特征。3)  全连接层(Full Connect Layer):一般放在网络的最后几层,用来对网络中提取到的高维特征进行整合。4) Softmax 层:是一个二分类的多类拓展,用于多分类任务。5)  激活函数层(Activation Layer):是一个非线性的激活函数,能够用来提升模型的表达能力,常见的激活函数有 Re LU、sigmoid 等。其中 Re LU 可以解决 sigmoid 等激活函数的梯度消失问题,使用较多。6) Dropout 层:用于减轻网络训练中的过拟合现象,该层中每层有一定概率被激活并参与训练,从而提升了网络的泛化能力。7)  批量正则化层(Batch Norm Layer,BN):在网络训练阶段对同一批次的样本数据进行正则化操作,消除参数无序扰动的问题,降低网络训练难度。相关研究表明,深度残差网络在图像分类上展示出了非常优秀的结果,虽然后续有如 Dense Net 等模型在部分性能上超过了 Res Net,但是考虑到模型的复杂性和对已有研究的兼容性,本文仍然选用了 Res Net 作为本文模型的图像数据处理模型。相关研究者也给出了几种稳定的残差网络结构,如 Res Net18、Res Net34,基于这些残差网络模型,能够快速地对相关的图像处理任务进行处理,并取得非常优秀的效果。考虑到残差网络的结构较为简单,同时其具有几种稳定的不同层数的模型,本文也主要基于残差网络作为图像标注部分的图像特征提取模型。
  2.2  基于 Kmax 映射注意力图的模型迁移
  随着相关深度学习框架的快速发展,深度学习相关的研究人员都开始基于一种主流的深度学习方法给出自己研究成果的复现,这对于后来的研究者来说有着极大的好处,一方面是能够从实现的角度研究相关论文的模型,另一方面是能够快速利用已有的研究成果,对自己的研究成果进行实验。这个现状也对当前迁移学习的发展产生了一定影响,由于很多如谷歌等大型研究机构或者著名的研究学者拥有大量的相关计算资源,所以他们开源的模型往往会给出相应的训练权重,在某些模型上,如果需要个人训练这些权重几乎是不可能的,因此,将这些开源的模型及模型权重进行利用也称为迁移学习的一个研究方向。本文基于这些现状,并且考虑到土木工程监理图像领域缺乏有效的用于训练的图像识别数据集或者图像标注数据集,因此本节主要研究如何基于已有的研究,提升相关图像标注模型的效果。后文主要在已有的注意力迁移方法的基础上,给出了本文优化的 Kmax 映射方法,并且基于此优化映射方法,给出了针对图像分类模型和图像标注模型的迁移算法。由于深度神经网络中的网络层数越来越多,如何有效提高多层神经网络的效率成为一个亟待解决的问题。注意力机制(Attention Mechanism)便是为了解决这个问题所提出的,注意力机制主要是通过对输入层的数据赋予不同的权重,从而实现对重要的区域提高权重,增强整个模型的效果。注意力机制也依据实现方式等的不同可以主要分成两种,一种是软性注意力机制,一种是硬性注意力机制。软性注意力就是传统的注意力机制,其原理是通过确定性的得分计算来得到得到注意力之后的编码隐状态。由于软性注意力是通过参数的形式起作用的,因此可以进行求导,也可以也可以被嵌入到模型中直接训练,神经网络模型的梯度也可以通过注意力机制模块,反向传播到模型的其他部分。不同于软性注意力,硬性注意力是一个随机的过程,硬性注意力会依据概率采样输入层的状态的一部分参与计算,而不是获取所有的输入层状态。为了实现梯度的反向传播,需要采用蒙特卡罗采样等方法对模块的梯度进行估计。因为可导的原因,软性注意力的应用场景更广,但是硬性注意力也在近年的研究中展示出了非常优秀的结果。相关学者也开始思考注意力机制在迁移学习领域的作用。Sergey Zagoruyko等提出了一种将注意力图(Attention Map)提取并用于模型迁移的方法,它通过一定设计,将注意力机制作为神经网络的一层进行单独处理,从而能在网络迁移的过程中进行抽取出来,用于提升模型迁移的效果。通过注意力图将教师网络(Teacher Network)(可看做迁移学习中的源网络)的权值有选择地转移到学生网络(Student Network)(可看做迁移学习中的目标网络)中,从而使得学生网络也具有教师网络的处理能力。

  第 3 章  土木工程监理图像索引及检索优化

  3.1  基于 R 树的图像索引及检索
  3.2  土木工程监理图像语义数据处理
  3.3  土木工程监理图像 R 树检索
  3.4  本章小结

  第 4 章  实验结果及分析

  4.1  基于 Kmax 映射的模型迁移实验
  4.2  索引及检索实验及分析
  4.3  本章小结

  第 5 章  总结及展望

  针对土木工程监理图像遇到的问题,本文主要针对其中的两点进行深入研究,一是考虑到土木工程监理现场的需求及小型化设备发展的趋势,对在保证图像标注效果下降低模型参数的相关工作进行了深入研究。二是针对复杂的土木工程监理图像,研究如何对其进行索引和检索效率的优化。首先,针对如何降低针对土木工程监理图像标注模型的参数量,本文对迁移学习相关领域进行了深入研究,现有的将模型进行压缩的方法中比较好的两种,一种是知识蒸馏,一种是基于注意力图的模型迁移。在图像处理实验中,基于注意力图的模型迁移方式展现了由于知识蒸馏的效果。考虑到现有的主流模型都是在成熟的图像分类模型上进行各种基于文本生成的优化,因此对图像分类模型进行优化更加具有可行性,因此本文主要基于注意力图进行模型迁移研究。本文基于对已有模型和注意力映射机制的研究,给出了基于 Kmax 映射的方式,在实际的图像分类实验中,其展现了相比于传统方法更好的结果。更重要的是,在本文对比实验中可以看出,相比于直接重新训练层数较少的模型,将多层模型的注意力图进行迁移能够让层数较少的模型取得更少的损失值。随后,针对这种迁移方式,本文将其应用到了图像标注模型上,在降低了一定权重的效果下,图像标注效果并没有损失较多。可以看出,本文相关工作在一定程度上降低了网络模型的参数量,提升了图像标注相对于土木工程监理的实用性。随后,针对标注过的土木共工程监理图像(图像数据包含了现场视频中提取的关键帧及照片)内容,考虑到其内容较为复杂,使用传统的索引方法无法对关键信息进行有效处理,同时在土木工程监理中,监理工程师会对重要的图像数据进行标注,这是一种可以利用的重要数据。基于这些原因,本文主要做了三个方面的工作,一是针对土木工程监理的图像,需要对其监理场景和监理对象进行基本的规范和划分。本文在相关监理工程师的协助下,参考土木工程监理行业的主要规范,给出了土木工程监理图像内容的基本语义划分。二是在此划分的基础上,本文基于这些划分将相关图像的标注进行了基于词向量的处理,并主要基于这些词向量数据对土木工程监理图像内容进行索引,考虑到词向量是高位数据,本文主要在 R 树的基础上对其索引进行了研究,给出了基于谱聚类优化的 R 树节点分裂算法,对 R 树节点分裂方式进行了优化,在实验中相比相关工作,在索引的时间上,有了一定程度的缩减。三是考虑到优化后的 R 树中索引结构主要基于词向量进行构建,其空间关系是包含了语义信息的,因此本文对 R 树的检索方式进行了针对性的优化,将检索语句转换成词向量数据,并设置一定的阈值扩充其检索区域,从而在实际的实验中,相对原始的 R 树检索方式有效提升了检索的查全率。 最后,针对上文给出的优化方法,本文在各自对应的数据集上进行了实验,在图像分类实验中,本文算法相对效果最好的对照算法有最高 1.6%的提升,在图像标注实验中,本文算法相对于对照算法在 CIDEr 指标上提升了约 0.7%,在其他指标上区别不大。在土木工程监理标注图像数据的索引上,本文算法相对于最优的对照算法有了最高约 11%的提升,在相应索引算法的基础上,本文基于词向量优化的检索算法相对于传统的 R 树检索算法在 4kb 页文件大小下有了最高13%的查全率提升。可以认为,本文的相关工作一定程度上改善了土木工程监理图像实际使用中的一些问题,为土木工程监理图像内容的高效使用打下了基础。 在完成本文相关的研究工作之后,本文结合领域相关的最新研究及针对本领域因为时间等原因未能继续的研究做出以下两点展望。 首先是可以尝试在模型迁移的过程中进行增强,主要是研究如何在模型迁移的过程融合多领域的知识,从而提升模型针对不同领域的识别能力。 其次是在索引和检索的过程中,可以结合最新基于神经网络模型索引及检索的研究,在本文中,考虑到模型和数据量的原因没有基于神经网络模型进行改进,但是在一些数据量较大的场景中,神经网络的索引和检索模型在某些方面存在优势,这方面还有较大的研究空间。  
 

以上论文内容是由硕士论文网为您提供的关于《土木工程监理的图像标注和R树指标优化方法》的内容,如需查看更多硕士毕业论文范文,查找硕士论文、博士论文、研究生论文参考资料,欢迎访问硕士论文网土木工程栏目。