内刊访谈

[特别策划] 海洋大数据环境下的智能信息融合研究探讨

发表时间:2019-08-16 10:27:19

文/刘俊 薛安克 彭冬亮

 

  刘俊:杭州电子科技大学通信信息传输与融合技术国防重点学科实验室信息融合团队教授

  薛安克:电子科技委委员,杭州电子科技大学通信信息传输与融合技术国防重点学科实验室信息融合团队教授

  彭冬亮:杭州电子科技大学通信信息传输与融合技术国防重点学科实验室信息融合团队教授


 

  提话:海洋大数据环境下的信息融合是一种多层次、多方面的海洋大数据或信息综合处理过程,它既是海洋网络信息体系应用的核心环节,也是安全自主可控海洋网络信息体系的建设瓶颈,是各种海洋应用急需的关键技术,是提升海洋电子信息能力的有效途径,是目前及今后很长一段时间世界各国急需研究解决的难点和热点。


 

  海洋大数据智能信息融合既是海洋网络信息体系应用的核心环节,也是安全自主可控海洋网络信息体系的建设瓶颈。本文从信息融合、大数据处理和人工智能角度,对海洋大数据智能信息融合研究的目的意义、研究现状、研究体系架构、科学问题及关键技术、近期发展重点建议等问题进行了简单分析和讨论。

 

  引言
 

  目前,海洋已经成为复杂物理环境和人类活动组合而成的巨系统,具有大数据、复杂性和不确定性高的特点。海洋大数据环境下的信息融合是一种多层次、多方面的海洋大数据或信息综合处理过程,就是通过组合或融合来自不同信息源(水下、陆、海、空、天、电磁和赛博)的海洋大数据信息,并在多种海洋应用场合,如问题求解、决策和估计等,利用信息融合得到的更高质量的海洋信息,得以满足:(1)增强海洋应用系统的检测性能、可信度、鲁棒性、可靠性和生存能力需求;(2)提升态势感知、推理能力和响应时间需求;(3)提高精度、降低不确定性和模糊性需求;(4)扩展时空覆盖能力和降低成本需求等。

  海洋大数据环境下的信息融合既是海洋网络信息体系应用的核心环节,也是安全自主可控海洋网络信息体系的建设瓶颈,是各种海洋应用急需的关键技术,是提升海洋电子信息能力的有效途径,是目前及今后很长一段时间世界各国急需研究解决的难点和热点。

 

  海洋大数据特征分析
 

  1.大容量(Volume)。海洋大数据主要有源自于星载、机载、无人机载、舰载、车载、地面、岛屿/岛礁、港口、码头、浮标、水面、水下、数据库系统等多平台的VTS、AIS、VHF、视频监控数据(可见光、红外、高光谱、多光谱、微光、SAR等)、雷达、声呐、海洋环境观测数据、海洋生化数据、船舶数据库等多源异构传感器获取的数据,数据量大。

  2.多样性(Variety)。从海洋目标多样性角度看,有分布广阔海面的各种舰船、濒海小目标、海面固定/移动目标等;有水下潜艇、AUV/UUV等;有各种(舰载/岸载)飞机/无人机;有遥感卫星等。从海洋数据类型角度看,不仅有文本、数字等结构化数据,还有图片、文字、语义、音频、视频、文电、信号、位置信息、网络日志等非结构化数据。从数据的获取和处理方式来看,既包括动态(流式/增量式/线上)实时数据,也包括静态(线下数据)/非实时数据。从数据的关联特征来看,既有无关联/简单关联数据(键值记录型数据),也有复杂关联数据(图数据)。

  3.时效性(Velocity)和Veracity(准确性),即数据处理速度快,处理结果精度高。不同海洋应用对于时效性和准确性的要求也不一样:战略级应用,保障时延应达到小时级,保障精度应明确区域和方向;战役级应用,保障时延应达到分钟级,保障精度应达到海里级;战术级应用,保障时延应达到毫秒/秒级,保障精度应达到米级。

  4.价值(Value),即数据价值密度低。价值密度的高低与数据总量的大小成反比。数据的价值在于将正确的信息在正确的时间交付到正确的人手中。今后,如何结合海洋网络信息体系的应用实际,构建强大的并行化机器学习、数据挖掘和信息融合方法,更迅速地完成数据的价值“提纯”,成为目前海洋大数据背景下亟待解决的信息融合难题。

  5.复杂性(Complexity)。从海洋物理环境角度看,海洋覆盖了海面、水下、濒海陆地(岛屿)、空、天、电磁和赛博等全维空间;从水文气象环境角度看,海洋受台风、内波等因素影响,普遍存在海况复杂、气象多变、海杂波复杂、大气相应多变、电磁波及声波衰减变化等复杂环境,加之前述5V的存在,使得针对海洋大数据的处理和分析更艰巨,传统的很多处理手段和方法已经不再适宜,需要根据不同的海洋应用业务场景,采取不同的处理方式和工具。

 

  信息融合发展现状
 

  1.信息融合概念

  信息融合(information fusion)起初被称为数据融合(data fusion),起源于1973年美国国防部资助开发的声纳信号处理系统。信息融合是一个信息综合处理过程,以获取精确的目标位置估计和完整的目标身份估计,以及对态势、威胁及其重要程度进行适度估计或推理决策,以得到高品质的有用信息为目的。

  2.信息融合结构模型演变

  随着信息融合由低级数据融合向高级信息融合扩展,信息融合功能模型的大致演变过程为:(1)1987年首次提出的三级结构JDL模型;(2)1998年五级结构JDL修订模型;(3)2004年五级结构JDL推荐模型;(4)六级结构JDL融合过程顶层模型;(5)七级DFIG模型;(6)六级结构“用户-融合”模型。目前主流的信息融合模型,其资源管理功能以及与信息融合过程之间的关系描述并不具体或不清晰,基本上是一种逐级递进的开环结构,没有动态反映需求的变化和融合性能的优化,很难适应复杂任务和环境的高不确定性。杭电薛安克老师团队,从用户需求→各级融合产品需求→信息获取资源反馈控制和信息融合过程动态优化的顺序,设计资源管理模块,并在参考JDL模型的基础上,提出了反馈融合闭环结构模型。信息融合在概念、功能、方法和应用上,大数据驱动融合过程的比重逐渐增加,智能化程度在逐渐提升,态势与威胁估计能力得到不断增强,人的智能在感知环中的作用越来越大,从而使大数据分析和智能化成为信息融合当前的主要发展方向。

  3.美国信息融合研究

  美国从上世纪70年代就已重点关注海洋信息融合研发,大致演变过程为:(1)1973年声纳信号处理;(2)80年代海上信息融合系统;(3)90年代CEC系统;(4)21世纪海上力量设想;(5)2010年“心灵之眼”;(6)指挥官虚拟参谋(CVS)、数字企业多源开发助手(MEADE)、指南针(COMPASS)、算法战跨职能小组(AWCFT,即Maven项目)等。美国按照21世纪“网络中心战”NCW思想,依托全球信息栅格GIG,已基本实现一体化和实用化的信息融合系统,主要包括:全球海洋实时观测网计划(ARGO)、全球海洋观测系统(GOOS)、一体化海洋观测系统(IOOS)、NEPTUNE海底事件监测预警系统、新泽西州海洋环境监测感知系统、数字海洋原型系统、海网Seaweb研究项目等。近年来,DARPA重点支持一大批基于人工智能、大数据分析、博弈论以及评估方法等先进技术的信息融合研究项目,用于解决大数据归集、情报分析自动化、感知和认知、有效及时决策等问题。

  4.我国信息融合研究

  结合海洋网络信息体系应用需求,从3个维度分析:(1)从应用维度来看,如何从“管、控”到“服务”是海洋大数据环境下智能信息融合发展的重点;(2)从数据维度来看,如何对海洋大数据进行统一管理、信息共享和业务协同应用成为当务之急;(3)从技术维度来看,海洋大数据环境下智能信息融合是未来若干年的必然发展趋势。

 

  海洋大数据环境下智能信息融合几个问题的探讨
 

表1 海洋大数据环境下智能信息融合研究框架


 

  1.研究框架

  从信息融合处理流程出发,在体现海洋大数据环境下研发所涉及的各个层面和问题的同时,又兼顾信息融合学术和应用过程中关注的问题,提出海洋大数据环境下智能信息融合研究框架,如表1所示。

  2.科学问题及关键技术

  海洋大数据环境下智能信息融合的科学问题及关键技术,如图1所示。
 


 

  3.近期发展重点建议

  (1)海洋基础大数据工程建设

  当前,我国海洋环境信息(水文、气象、温度、盐度和密度等)和海洋目标(声、光、电、磁、热等特征)等数据库和资料库的建设,普遍存在格式不兼容、数据量小、完备性差、利用率低、共享性差等问题,难于对大数据环境下的智能信息融合应用提供支持,我们必须立足于自主创新建设,重点解决如下两个方面的问题:1)亟待进一步丰富和完善各种海洋数据库和资料库、尽快出台相关数据集构建标准和规范等;2)开展海洋多源异构大数据云存储技术、海洋多源异构大数据管理与查询技术研究,尽快解决海洋多源异构大数据的统一管理、调度、高效查询与优化问题。

  (2)智能信息融合基础研究

  人机融合智能是智能信息融合研究的主要方向。人机融合智能是由人、机、环境系统相互作用,在与具体应用相关联的海洋环境、社会环境,以及真实和虚拟环境约束下,将人的意向性智能和机器的形式化进行信息融合的智能系统,有效地解决认知与计算融合问题。需重点解决如下两个方面的问题:1)开展深度态势认知基础研究,解决基于任务目标在特定环境下组织系统充分运用各类认知活动的综合能力,实现既能在信息、资源不足情境中运转,也能在信息、资源超载情况下工作的目的;2)尽快开展自主系统基础研究,通过传感器和软件,在较长时间内无需或只需有限通信,无需其他外部干预就能独立完成任务,在未知环境中自动进行系统调节,保持性能的良好过程,用于解决资源动态配置,特别面临对手的反介入/区域拒止活动时;有效整合多传感器、平台和其它多源信息;促使网络信息流智能化、优先排序,为平台和作战人员提供精准决策信息;辅助制定任务计划,实现任务监控与协调活动等问题。

  (3)不确定性智能信息融合基础研究

  受限于不同传感器物理性能、时空覆盖、归属和外界干扰等影响,不确定性主要表现在:1)灰色信息,无法获得目标的全部信息或确切信息;2)模糊信息,无法准确确定目标类型;3)未确知信息,表现为所掌握的信息不足以确定事物的真实状态和数量关系。如果忽略了不确定性信息,或不能对其进行科学的处理,将不能做出正确的决策,更不能科学地研究复杂决策问题。需要重点解决如何利用海洋大数据时空覆盖和个体认知互补的特点,根据具体任务聚焦,从不同角度、不同方面相互印证,彼此照应,实现并行处理,协同一致,以获取更加及时、准确和全面的结果,实现以体系效能换效率的整体优势和增值效应。

  (4)基于反馈控制的智能信息融合基础研究

  在复杂海洋环境条件下,结合人工智能、大数据、机器学习等先进理论和方法,开展反馈信息融合基本原理和关键技术以及工程应用研究,解决现有信息融合技术难于在海洋中有效应用的难题,建立新原理下的海洋反馈信息融合系统、智能异类多源反馈信息融合体系、群岛海域资源感知、智能管控和优化系统。

  (5)智能图像处理和图像融合基础研究

  目前,人工智能的大部分技术,是由深度学习算法进行支撑。深度学习有三大核心要素:深度学习的算法设计、高性能的计算平台和大数据。深度学习和大数据技术方兴未艾,以海洋大数据为基础,重点开展:1)视觉智能研究,在视觉分析中增加感知和认知,辨别和推断这些情景中的动作和行为;2)将视觉和人工智能融入视频采集单元,实现自动识别分析处理,显著提高传感器和采集平台的能力。