治疗白癜风最好的医院 http://yyk.39.net/bj/zhuanke/89ac7.html治疗白癜风最好的医院 http://yyk.39.net/bj/zhuanke/89ac7.html面向疫情防控的无人机关键技术综述 赵伟1王正平1张晓辉2向乾1贺云涛1 (1.北京理工大学宇航学院;2.北京理工大学机电学院) 摘要在国内新型冠状病毒的疫情防控中,无人机及其相关技术发挥了积极的抗疫作用,展现出了巨大的应用潜力。对适用于疫情防控的无人机关键技术进行综述,主要涉及计算机视觉技术、视觉导航技术、混合电动长航时技术,以及机载小型喊话器技术等其它抗疫载荷技术。这些技术对无人机的场景理解、自主导航、续航能力,以及疫情监控效果等具有直接、重要的影响。最后,对所涉及技术的发展现状进行总结,分析相应技术的特点并给出未来的发展趋势,为无人机在疫情防控、紧急灾害救援等任务中的广泛应用指明了技术突破的方向。关键词防疫无人机;计算机视觉;视觉导航;混合电动长航时;红外测温1引 言随着无人机技术的发展,无人机在管线检测、地质勘探、公路巡检以及抢险救灾等领域的应用价值得到了越来越多的体现。新冠疫情期间,为避免疫情传播,各种无人机出现在了楼宇、村庄、城市街道、高速路口等场景,发挥了创新性作用,成为了疫情防控的得力手段。用无人机平台进行“非接触式”疫情防控,可以提高工作效率,降低人员的接触感染风险,开创立体疫情防控模式。目前,防控无人机的应用领域主要包括安全巡查、物资投递、消杀喷雾、热感测温以及防控宣传等。本文针对疫情防控无人机应用的关键技术展开综述,对相关领域近十年的研究状况进行了总结,其中第2章分析了计算机视觉技术的研究现状,第3章分析了无人机视觉导航系统的组成与技术方案,第4章对混合电动长航时技术的研究现状进行分析,第5章对其它抗疫载荷技术进行总结,最后给出面向疫情的无人机需要突破的关键技术及发展趋势。2计算机视觉技术新冠疫情期间,广东肇庆等地使用无人机取代了车辆进行巡检,从高空监测车流、人流情况,将监控视频实时传回公安局指挥部等地,帮助工作人员进行监控和督导。然而,由于人力监控成本较高,容易发生错漏,需要引入计算机视觉技术作为疫情监控的辅助方法。计算机视觉(ComputerVision,CV)是指使用计算机及相关设备模拟人类的观察行为,从而具有通过视觉观察和理解世界的能力。近十年来,计算机视觉技术与无人机技术的结合越来越紧密,为无人机应对感知问题及广泛开发应用解除了根本的技术限制。2.1 图像预处理在实际的生产生活中,无人机搭载的视觉传感器拍摄图像往往因为成像技术、拍摄环境、物体间的相对运动以及相机本身的抖动等问题造成图像退化。噪声和模糊是最典型的图像退化现象,需要经过图像预处理才能投入使用。图像预处理是计算机视觉技术的基石,是基于一定假设条件下的信号重建,具体技术包括图像去噪和图像去模糊等。(1)图像去噪:高斯噪声是去噪最常见的对象,其概率密度函数服从高斯分布。相比于词典学习和稀疏编码等传统方法,基于深度学习的方法在降低图像噪声方面具有明显的优势。基于深度学习的去噪方法主要包括以下两种:去噪卷积神经网络(DenoisingConvolutionalNeuralNetwork,DnCNN)是以卷积神经网络(ConvolutionalNeuralNetwork,CNN)为基础的图像去噪方法的代表,采用残差学习和批量归一化训练一个端到端的CNN网络,是网络能够学习到加性高斯白噪声,模型包括卷积层(ConvolutionalLayer,Conv)、整流线性单元层(RectifiedLinearUnits,ReLU)和批量标准化层(BatchNormalization,BN),并组合成三种层(如图1),可以通过单一模型处理多个低级任务;Guo等提出卷积盲去噪网络模型(ConvolutionalBlindDenoisingNetwork,CBDNet),包括一个噪声估计子网络和一个非盲去噪子网络(如图2),结合了噪声建模和非对称学习等特点,可以实现图像的盲去噪。盲去噪是指未知噪声水平的去噪,将噪声水平的估计值作为可调节的参数输入到网络结构中,可以改变网络结构的性能,提高鲁棒性和实用性。图1DnCNN算法模型[5]Fig.1ModelofDnCNN[5]图2CBDNet盲去噪架构图Fig.2IllustrationofCBDNetforblinddenoising(2)图像去模糊:无人机航拍时,无人机的机械振动、失焦、风力影响以及拍摄目标的快速移动等,都可能影响航拍图像效果,使得图像丢失细节信息而变得模糊,难以进行后续处理。由于无人机抗风能力较差,飞行姿态易受气流影响,因此无人机图像模糊主要是运动图像模糊。除了对硬件设备进行稳像处理以及搭建稳定拍摄控制系统等方法,主要的运动图像去模糊方法是对成像后的图像进行处理,通过对图像运动模糊去除算法的研究,达到图像复原的目的。模糊图像可看作清晰图像和模糊核进行卷积的结果。根据模糊核是否已知,将去模糊方法分为非盲去模糊和盲去模糊。非盲去模糊中,模糊核已知,可直接通过反卷积的方法去除图像模糊;实际应用中,模糊核一般是未知的,使用的多是盲去模糊法,需要求解出模糊核,再利用反卷积的方法去除图像模糊,或将模糊核估计的过程和图像去模糊的过程交替进行,具体包括基于图像梯度分布的方法、基于图像L1范数和L2范数比值的方法等。然而,这些方法的数学模型和求解方法相对复杂,算法鲁棒性不强,很难处理不同数据集和不同因素造成的模糊。基于深度学习的图像去模糊算法可以兼顾图像复原的效果以及网络模型的自适应性,在一般的任务场景中具有明显的优势。其中,基于CNN的盲去模糊方法,其基本思想是将模糊图像和对应的清晰图像作为训练样本,输入CNN进行训练,训练完成后得到优化后的网络模型,使用时将模糊图像作为网络输入,网络输出即为去模糊后的图像。在此基础上,Seungjun等人为解决实测清晰图像和模糊图像对难以获得,以及非均匀模糊图像局部模糊核难以确定的问题,提出了一种多尺度CNN方法,以端到端的方式恢复清晰的图像。在生成对抗网络模型的基础上,Kupyn提出了DeblurGAN模型,这是一种基于感知损失和条件生成对抗网络的端到端模型,改善了视觉效果、峰值信噪比和结构相似性指标。但使用DeblurGAN进行单张图片的动态场景去模糊时,会出现棋盘效应和色块偏移等问题,Shao等对此设计了一种基于反向信道的判别先验器,以及代替DeblurGAN中原始生成器的自动编码器,这种方法被命名为DeblurGAN+,这是单张图片动态场景去模糊的最新技术。2.2 目标检测目标检测是泛身份识别(如人群计数)领域的基础性的算法,是智能化疫情监控系统的核心部分。目标检测的任务是对目标位置进行定位,同时获得该目标的类别信息,方法可大致分为传统检测方法与基于深度学习的检测方法,年以前,目标检测主要利用梯度直方图、局部二值模式等基于特征的方法;年以后,基于深度学习的目标检测方法逐渐占据主导地位,并使目标检测算法实现了质的提升。根据技术路径,目标检测可分为单阶段检测算法与两阶段检测算法(如图3)。图3基于深度学习的目标检测算法发展路线图Fig.3Aroadmapofobjectdetectionbasedondeeplearning两阶段检测多为基于分类的检测算法,此类方法的核心思想是将候选区域与CNN相结合,将目标检测问题通过分类进行解决。这类方法检测精度较高,检测速度较慢。单阶段检测多为基于回归的检测算法,相比于两阶段检测,单阶段检测降低了部分精度,但很好地提高了目标检测算法的实时性。单阶段算法将整张图片作为输入,使得目标框及目标类别信息从给定图像的多个位置直接回归得出,同时进行分类和回归也使完整的单次训练得以实现特征共享,实现了端到端的检测过程。单阶段算法在保证精度的同时,明显提升了计算速度。目标检测效果的评价指标通常为平均精度均值(meanAveragePrecision,mAP)。平均精度(AveragePrecision,AP)用于衡量检测器在每个类别上的检测性能,mAP是得到每个类别的平均精度值后再取所有类别的平均值,用于评价多目标的检测器性能。表1为几种目标检测算法在COCO数据集上的检测精度和速度对比。由表可得,YOLOv3系列算法兼顾了准确度和实时性,检测效果最好。表1目标检测算法检测性能对比Table1Comparisonofdifferentobjectdetectionalgorithms此外,疫情防控无人机多为低空或超低空无人机,搭载的视觉传感器为低空视角,需要针对具体的任务场景建立数据集。2.3 密度估计与人群计数在视频监视、交通监控和公共安全等领域,密度估算与人群计数有着广泛的应用,相关技术也可推广用于车辆计数等领域。新冠疫情防控期间,有关部门持续加大监控力度,出动了许多无人机在小区和村庄等地进行巡逻督查和防疫宣传。但是,单纯依靠人力监视管控依然存在局限性。如果能充分利用视频监控的密度估计和人群计数技术,一方面可以大量节省人力物力,另一方面也可以对一些紧急情况进行高效地分析、预防和处理。影响人群计数的因素主要包括遮挡、密度差异、光照不均和视角变化等。传统的依赖人为设计特征的方法通常局限于人流密集程度较低和目标尺度变化较小的情况,难以进行实际应用。相对于传统方法,基于CNN的方法可以广泛应用于复杂的场景,如不同密集程度,目标尺度变化,视角透视,目标遮挡的场景。单张图像的人群计数问题目前主要有两种解决途径:一是根据输入的图像,经由某一特定算法,直接得到预估的整张图像中包含的人数;二是先由输入的图像生成对应的密度图,再将密度图的各像素值累加并得到总人数。基于密度图的人群计数方法不仅可以获取总人数,从密度图中还能直观地得到人群分布信息,这对于许多应用场景都有极大的意义,也适用于疫情监控。基于密度图的人群计数算法流程(如图4)为:输入的图像经过CNN网络计算,得到对应的密度图像,通过密度图像可以清晰地看出人群分布特征、密集和稀疏的区域等信息,并将像素值累加得到总人数。图4基于密度图的人群计数流程图Fig.4Workflowchartofcrowdcountbasedondensitymap对于基于密度图的人群计数方法,多尺度特征表达和高分辨率密度图构建是两个关键问题。Zhang等提出了一种多列结构的CNN模型MCNN,通过使用多个卷积核大小不同的网络来捕捉不同尺度的目标特征信息,以增强模型的稳定性,适应人群的尺度变化。Sindagi等提出了CP-CNN模型,通过在模型中引入局部和全局的上下文信息来抑制背景响应,减小了估计误差。Sam等考虑到图像中不同区域的差异性提出了Switching-CNN模型,在多个独立的回归模型中为每块区域选择一个最优模型进行密度估计。Liu等提出了一个仅需要点监督的新深度检测网络PSSDN,可以同时检测人体头部的大小和位置并计数,且不需要复杂的边界框注释。在这些工作基础上,Sam等提出了LSC-CNN模型,采用多列体系结构,具有自上而下的反馈处理功能,能可靠地检测稀疏人群以及密集人群中人体头部以执行人群计数任务,并在多种分辨率下均可生成精确的预测,解决了多尺度人群检测和高分辨率密度图构建的问题,是目前密度估计与人群计数的最新方法。3视觉导航技术视觉导航(Vision-BasedNavigation,VBN)是一种利用可见光与不可见光成像技术进行导航的方法,已广泛应用于无人机(如图5)、各类巡航导弹、深空探测器以及室内外机器人等领域。随着计算机视觉与无人机控制技术的发展,将计算机视觉技术应用于无人机视觉导航是目前研究的趋势。无人机视觉导航,本质是通过计算机视觉技术对周围环境进行图像采集,经过处理后输出有指导意义的导航信息,具有快速灵活、自主性强、不易受干扰等优点,是实现无人机长航时自主导航飞行的重要技术。在新冠疫情的防控工作中,许多政府工作部门增加了无人机的采购数量,却缺少成熟的无人机操作人员,影响了无人机的实际应用。视觉导航技术,可以减少工作人员的培训时间,降低无人机的操作难度,还可在工作人员的视距外和弱GPS环境下进行工作,有利于疫情防控工作的展开和工作区域的拓展。图5无人机视觉导航技术的应用 Fig.5ApplicationofUAVvisual-basednavigation 3.1 视觉导航系统组成无人机视觉导航系统有两种构成方式,一种是将计算单元安放于地面,另一种是将图像处理算法计算单元安装在飞行器上。对于第一种方式,无人机上需要安装远距离无线高速图像传输装置,并且存在时延和信号干扰问题,存在一定技术障碍。对于第二种方式,可将英伟达JetsonTX1和JetsonNano等板载计算机(如图6)作为图像处理算法计算单元,直接与图像采集设备进行硬件线路的连接,这种方法几乎没有延时,可以通过优化算法等方式满足实时性要求。图6英伟达板载计算机示例 Fig.6On-board
|