物联网信息融合技术及存在的问题研究
王 洪 波1,2
(1. 合肥工业大学 管理学院 合肥 23009;)
(2. 过程优化与智能决策教育部重点实验室 合肥 230009)
摘要:物联网是通过各种传感设备将物品与互联网连接起来的一种新型网络。在物联网信息感知过程中,信息融合已成为一个关键性技术。本文阐述了物联网信息融合技术,包括数据级融合、特征级融合和决策级融合。在此基础上,指出了物联网信息融合过程中存在问题和挑战,分析了有待进一步研究的方向。
关键词:物联网;信息融合;信息感知
中图法分类号: TP301.6 文献标识码: A
Research of Information Fusion Technologies and Existing Problems
in the Internet of Things
WANG Hong-bo1,2
(1. School of Management, Hefei University of Technology, Hefei, 230009, China)
(2. Key Laboratory of Process Optimization and Intelligent Decision-making, Ministry of Education, Hefei,
230009, China)
Abstract:The internet of things is a new network in which things are connected to the internet by various sensing equipments. In the process of information sensing in the internet of things, the information fusion technologies have become critical. In this paper, the information fusion technologies in the internet of things have been presented, including data-level fusion, feature-level fusion and decision-level fusion. On this basis, the problems and challenges existing in the information fusion process in the internet of things have been showed, and the further research directions have also been put forwarded.
Keywords: Internet of Things; Information fusion; Information sensing
一、 引言
物联网(Internet of Things,简称IoT) 概念于1999年由麻省理工学院(MIT )Auto-ID 中心最早提出(Sundmaeker et al. ,2010)。2005年11月,国际电信联盟(International Telecommunication Union ,简称ITU )在信息社会世界峰会(WSIS )上发布了《ITU 互联网报告 2005:物联网》并在报告中正式确定了“物联网”概念(ITU ,2005),报告指出物联网发展所依赖的技术包括:无线射频技术(RFID )、无线传感器技术(WSN )、智能嵌入技术、小型化技术和纳米技术等。
物联网是通过各种传感设备将不同种类的物品与互联网连接起来的一种具有智能化识别、定位、跟踪、监控和管理的网络,以实现人与物、物与物之间的信息交换。在物联网中,信息感知是一个基本功能,它是通过传感器对物联网中物品进行信息收集,根据应用目标的需要对所收集到的信息加以筛选,将有效数据或有价值数据提供给用户进行分析和处理。由于物联网所能提供的传输、处理和分析等资源有限,因此在满足客户需要的条件下,采用信息融合技术对数据进行有必要的处理,以实现对信息的高效感知。 1 王洪波,男,1983年生,博士生,主要研究领域为人工智能、数据挖掘、云计算、决策理论与方法. E-mail :bz308cctv@163.com
随着物联网技术研究不断深入,物联网信息融合技术取得了一定数量的成果,因此需要对该类技术进行一定程度的梳理。本文对物联网信息融合技术的现有研究成果进行归纳,阐述了物联网信息融合的主要技术。首先从信息提取水平角度将融合技术划分三个层次,对现有技术和方法进行归纳和分析;然后,探讨了物联网信息融合研究的热点领域,指出了物联网信息融合所存在的问题和挑战,并展望了未来研究的方向;最后,对全文进行概括和总结。
二、 物联网信息融合技术
信息融合是指在一定准则下利用计算机技术对多源信息分析和综合以实现不同应用的分类任务而进行的处理过程。根据信息提取水平,Nakamura et al.(2007)将物联网中信息融合技术划分为4个层次,主要包括:低等水平融合、中等水平融合、高等水平融合和多级融合。Nakamura 分类方法中多级融合技术是前三种融合技术的综合,故本文认为将数据融合技术划分为3个层次较为合理。对于物联网,数据级融合主要是消除输入数据中的噪声,而特征级融合和决策级融合则侧重于获取与实际应用相关的有价值信息。
(一) 数据级融合技术
数据级融合主要是指在原始数据采集后的融合。该融合的特点是必须在同质信息前提下的融合,不同质信息则不能在此阶段融合。在数据级融合阶段常用的方法多为加权平均法、特征匹配法法和金字塔算法等传统方法。
加权平均法是最简单的融合算法,直接对传感器所获得信息进行线性的加权平均。Mechitov et al.(2003)提出通过对传感器的位置进行加权平均,估计出目标运动轨迹上的各点坐标位置。崔逊学等(2011)则根据计算几何理论,提出基于三圆交集计算二值传感器网络目标的位置。加权平均法具有实现简单、快速的优点,能够有效地抑制噪声,但是其融合结果的对比度相对较低,且无法通过增大权重的方式反映某些信息所具有的突出作用。
特征匹配法就是利用通过特征的匹配关系建立图像间的配准映射变换,最常用的方法是ICP 算法。Besl&Mckey(1992)提出一种基于轮廓特征的点配准方法ICP 。刘繁明、屈昊(2004)提出了对准集合的一种方法,采用对准误差通过非线性最优化算法直接最小化。杨明等(2004)提出一种基于切线的角度直方图的ICP 方法,该方法首先使用M 估计器鲁棒地计算扫描中每点的切线方向,然后使用基于Hough 变换的切线角度直方图计算旋转分量,最后使用迭代切线加权最近点ITCP 计算相对位姿估计。
金字塔算法是采用通过不断地滤波原始图像的方式,形成一个多级塔状结构用以分析和融合图像数据。Burt &Adelson(1983)首先提出拉普拉斯金字塔算法,它是在高斯滤波图像的基础上,与预测图像之间形成一系列误差图像。Toet (1989a ,1989b ,1989c ,1992)则提出了比对度金字塔算法和形态学金字塔算法。Burt (1992)通过利用梯度算子对每层图像进行计算,以实现对图像的分解。Barron &Thomas(2001)通过纹理滤波器对每层图像中不同方向的纹理信息进行提取,获得图像更多细节信息。Chipman et al. (1995)和Li et al. (1995)则分别提出了不同的离散小波变换的融合算法。
(二) 特征级融合技术
特征级融合主要是在对原始数据进行了特征值提取的工作后,运用基于特征值比较的融合方法,其特点为可在不同质信息范围内进行融合,但无法对融合结果进行判别并作出合理决策。在特征级融合技术阶段常使用k 近邻、卡尔曼滤波、聚类算法等方法。
K 近邻算法(V apnik ,1999)是一种简单的分类算法,该算法使用某一种距离度量计算待分类样本与所有训练样本之间的距离,寻找与待分类样本最近的k 个近邻,根据k 个近邻所属的类别来确定待分类样本的类别。Ye et al.(2001)将聚类算法与K 近邻算法相结合,提出了CCA-S (Clustering and Classification Algorithm-Supervised)算法。Rosa et al.(2003)为了快速且有效寻找最优k 值,提出将遗传算法与K 近邻算法相结合。陈黎飞、郭躬德(2011)
提出了一种多代表点的学习算法(Multi-Representativesfor Efficient Classification,简称MEC )用于最近邻分类。金弟等(2010)提出一个基于结构化相似度的网络聚类算法将向量数据集转化成k 邻近网络, 然后用SSNCA (Structural Similarity based Network Clustering Algorithm)对k 邻近网络进行聚类。
卡尔曼滤波是一种最优随机滤波技术,能够较好地消除噪声对信号的干扰,但是经典的卡尔曼滤波和扩展的卡尔曼滤波一般仅限于线性高斯系统。Julier et al.(1997)针对上述问题,提出无迹卡尔曼滤波(Unscented Kalman Filter ,简称UKF )处理非线性非高斯系统的跟踪问题。刘献如、蔡自兴、唐 琎(2010)提出将绝对差值和(SAD )方法、无迹卡尔曼滤波(UKF )和Mean shift算法相结合的混合自主跟踪动态目标的方法。
聚类算法是数据挖掘领域中常见的一种分类技术,常见的聚类算法有基于划分的聚类k-means 。k-means (Hartigan&Wong,1979)的评判标准是以样本与相关聚类中心之间的欧式距离之和为参照标准,将该评判准则最小化以实现数据集的划分。公茂果、王爽、马萌(2011)则提出二阶段聚类算法(two-phase clustering,简称TPC ),该算法不仅能够有效处理复杂分布的数据聚类问题,而且其计算复杂度低于MEC 。陈小全、张继红(2012)提出了一种基于改进的粒子群算法的聚类算法,该算法将k-means 和粒子群算法相结合,提高了k-means 的局部搜索能力。
(三) 决策级融合技术
决策级融合是通过对不同质数据进行预处理、特征值提取和识别、分配可信度作出最优决策,其特点为能对传感器采集的数据做出融合,并可利用融合结果进行分析和判别,形成决策建议。相比较前两个融合,决策级融合是最高层次的信息融合,融合系统不仅容错性能好,而且适用领域广。常见决策级识别方法有专家系统、Bayes 推理法和证据理论法等。
专家系统(Expert system,简称ES )主要是由知识库、推理机、综合数据库、解释器和接口等组成。专家系统有很多种,具有代表性的有基于规则的专家系统、基于框架的专家系、基于模型的专家系统、基于案例的专家系统等,目前大多数智能决策系统都是基于专家系统的。Shortliffe et al.(1976)构建MYCIN 系统用于诊断和治疗血液感染和脑炎感染。Duda et al.(1977)提出经典PROSPCTOR 系统用于地质勘探。王青等(2006)提出一种基于神经网络与专家系统的自学习智能决策支持系统。
Bayes 推理法是基于概率分析、图论的一种不确定性知识表达和推理的方法。Pearl (1998)和Lauritzen (1998)提出贝叶斯网的精确推理方法,即Polytree 和Jmtetion Tree,而Pearl (1987)和Jensen et al. (1995)则提出近似推理方法,即Importnat Sampling 和Gibbs Sampling 。Dean&Kanazawa(1989)提出针对动态时变系统的动态贝叶斯网(Dynmaic Bayesian Networks ,简称DBN )。Wellman (1990)提出定性贝叶斯网(Qualitative Bayesian Networks,简称QBN )。国内学者对Bayes 推理法也有一定的研究,杨小军等(2007)在Bayes 框架下基于粒子滤波器预测和估计目标状态分布,提出一种有效的粒子方法逼近目标状态期望的方差, 实现了传感器的最优选择。
证据理论法(Dempster-Shafer 理论,简称DS 理论)最先由Dempster (1967)提出的,他的学生Shafer (1967)又进一步发展了该理论使之成为一种不确定推理方法。Yager (1987)提出既然无法合理分配冲突证据,那就将冲突系数k 赋给未知域。Smets (1990)提出将冲突证据分配给空集,这样将不会引起错误判断。Lefevre (2002)提出统一信任函数组合规则,该规则核心是根据权重公式将其分配给相关子集。MurPhy (2000)的方法是将证据的基本信任分配取平均值,通过多次迭代取得融合信息。邓勇(2004)提出一种加权平均组合方法,该方法考虑了各证据之间的相关性。林作铨等(2004)提出在Dempster 合成之前,基于未知扰动对mass 函数进行预处理,并通过预处理来解决标准化问题。Nakamura et al.(2005)采用DS 证据理论实现了对网络路由状态的分析和判断,给出了路由是否需要重建的结论。
三、 存在的问题
信息融合能够减少所需要传输的数据量,降低传输过程中数据之间的冲突、减轻物联网中拥塞现象发生次数,合理利用网络资源。因此,信息融合技术已成为物联网的关键技术和研究热点。为了让物联网中的信息融合过程更加快速、有效,现实中还有很多物联网信息融合技术需要完善和改进。
(一) 多源异构信息的融合问题
由于物联网中传感器所采集的信息内容不同、传感器采集的频率不同、传感器所输出信息的表示方式不同、传感器所能感知的物体种类不同以及传感器的数量众多等原因,导致物联网信息融合技术需要处理的信息具有多源异构的特征。此外,由于物联网中网络节点在功能和结构上存在巨大差异,使得在信息融合过程中,不同的网络节点所能处理、传输和存储的信息数量存在很大差异。因此,在物联网针对多源异构信息的融合技术所面临的问题主要为四个方面:(1)由于物联网信息需要在表示方式和语义知识两个方面必须进行统一化处理,因此信息融合过程存在建立统一的表达形式和统一的描述语言问题;(2)由于参与信息融合的网络节点所提供信息的测量维数不同,因此信息融合过程面临多维信息的降维优化问题;
(3)不同网络节点对信息的采样率和时间同步率都不一样,因此信息融合过程存在不确定数据融合的问题;(4)在信息融合过程需要利用大量网络节点进行融合运算,因此信息融合过程存在保证各网络节点间的调度和分配、容错管理以及对数据的高效率存取访问等问题。
(二) 大数据的融合问题
客观世界中物体的种类复杂、形态多样、数量巨大,这导致物联网对信息的采集需要各种传感设备,并且这些设备所采集到的信息具有海量规模。为了有效的从海量信息中发现有价值的知识为物联网用户提供各种领域信息服务,必须对物联网海量信息进行处理。原有的传感器网络的规模一般都比较小,节点数目一般在几十到上百之间,而且所应用的传感器种类相对比较单一,常采集若干种信息。随着物联网规模的不断扩大,网络中节点的数目也出现几何式增长,触感器种类也不断增多,由此所引起的信息数量也具有海量规模。针对大规模传感器网络中信息融合技术的研究目前处于起步阶段,大部分融合技术仅能适应小规模融信息的融合。因此,需要对涉及大数据融合的节点负载均衡、无线网络延迟、算法能量消耗、数据传输可靠性等热点问题进行必要的研究。
(三) 信息融合的安全问题
随着物联网适用范围的不断扩大,物联网中融合技术所涉及到的信息范围也不断扩展,相当一部分信息属于政府、金融等高敏感领域。因此,信息的安全问题也日益成为物联网信息融合需要重视的问题之一。物联网信息融合是信息感知的重要手段。如果海量节点中某一个节点因病毒感染而导致信息被篡改,融合节点将很难分辨出正常信息和恶意信息。由于信息融合节点处于物联网信息感知和交互的中枢位置,从而对融合信息的破坏不但会使融合过程产生混乱,而且还会使物联网用户在错误结论指导下采取错误行为。因此,物联网融合过程中的信息安全必须加以考虑。这就要求融合节点需要具有分辨数据有效性的机制和措施,能够在海量融合信息中快速、准确的判断出信息真伪,使物联网用户的隐私得到保障。
四、 结论
物联网信息融合技术涉及到较多领域内容,虽然物联网的概念出现时间不短,但作为物联网信息感知过程中关键性环节的信息融合技术还有很多方面有待完善。本文重点分析了数据级融合、特征级融合、决策级融合等3类信息融合技术,并讨论了多源异构信息的融合、大数据的融合和信息融合的安全等问题。通过对上述内容的总结和归纳,有助于促进物联网信息融合技术更好地发展和完善。
参考文献
陈黎飞, 郭躬德, 2011:《最近邻分类的多代表点学习算法》, 《模式识别与人工智能》第6期。
陈小全, 张继红, 2012:《基于改进粒子群算法的聚类算法》, 《计算机研究与发展》第z1期。
崔逊学, 周强, 方震, 2011:《基于三圆交集的二值传感器网络目标跟踪快速算法》《, 计算机研究与发展》第2期。
公茂果, 王爽, 马萌, 2011:《复杂分布数据的二阶段聚类算法》, 《软件学报》第11期。
金弟, 刘杰, 贾正雪, 刘大有, 2010:《基于k 最近邻网络的数据聚类算法》, 《模式识别与人工智能》第4期。
林作铨, 牟克典, 韩庆, 2004:《基于未知扰动的冲突证据合成方法》, 《软件学报》第8期。
刘繁明, 屈昊, 2004:《ICP 算法的鲁棒性改进》, 《仪器仪表学报》第4期。
刘献如, 蔡自兴, 唐 琎, 2010:《基于SAD 与UKF -Mean Shift的主动目标跟踪》, 《模式识别与人工智能》第5期。
王青, 祝世虎, 董朝阳, 陈宗基, 2006:《自学习智能决策支持系统》, 《系统仿真学报》第4期。
杨明, 董斌, 王宏, 张钹, 2004:《基于激光雷达的移动机器人实时位姿估计方法研究》, 《自动化学报》第5期。
杨小军, 邢科义, 施坤林, 潘泉, 2007:《传感器网络下机动目标动态协同跟踪算法》, 《自动化学报》第10期。
Burt, P. J., 1992, A gradient pyramid basis for pattern selective image fusion, Proc of the Society for Information Display Conference, San Jose: SID Press, pp. 467-470.
Barron, D. R. and Thomas, O. D. J., 2001, "Image fusion though consideration of texture components", IEEE Trans on Electronics Letters, Vol. 37, No. 12, pp. 746- 748.
Chipman, L. J., Orr, T. M. and Graham, L N., 1995, Wavelets and image fusion, Proc of Int Conf on Image Processing, Los Alamitos: IEEE Computer Society, pp. 248-251.
Dean, T. L. and Kanazawa, K., 1989, "A model of reasoning about persistence and causation", Computational Intelligence , No. 5, No. 3, pp. 142-150.
Dempster, A. P., 1967, "Upper and Lower Probabilities Induced by a Multivalued Mapping", The Annals of Mathematical Statistics, Vol. 38, No. 4, pp. 325-339.
Deng, Y ., Shi, W. K., Zhu, Z. F., and Liu Q., 2004, "Combining Belief Functions Based on Distance of Evidence" , Decision Support Systems, Vol. 38, No. 3, pp. 489-493.
Duda, R. O., 1977, Development of a computer-base consultant for mineral exploration Annual Report,
[ S. .l ]: SRI Project, pp. 5821-5824.
Hartigan, J. A. and Wong, M. A., 1979, "A k-means clustering algorithm", Applied Statistics, Vol. 28, No. 1, pp. 100-108.
International Telecommunication Union (ITU), 2005, ITU Internet Reports 2005: The Internet of Things, Tunis: World Summit on the Information Society (WSIS).
Jensen, C., Kong, A. and Kjaerul, U., 1995, "Blocking gibbs sampling in very large probabilistic expert systems", International Journal of Human Computer Studies. Specia1 Issue on Real-World Applications of Uncertain Reasoning, Vol. 42, No. 6, pp. 647-666.
Julier, S. J. and Uhlmann, J. K., 1997, A new extension of the Kalman filter to nonlinear systems, Proc SPIEInt Soc Opt Eng, Orlando: SPIE, pp. 182-193.
Lauritzen, S. L. and Spiegelhalter, D. J., 1988, "Local computations with Probabilities on graphical Structures and their application to expert systems", Journal of the Royal Statistical Society B, Vol. 50, No. 2, pp. 57-224.
Lefevre, E. and Colot, O., 2002, "Vannoorenberghe P. Belief Functions Combination and Conflict Management" , Information Fusion, Vol. 3, No. 2, pp. 149-162.
Li, H., Manjunath, B. S. and Mitra, S., 1995, "Mult isensor image fusion using the wavelet transform", Graphical Models and Image Process, Vol. 57, No. 3, pp. 235-245.
Mechitov, K., Sundresh, S., Kwon Y. and Agha, G., 2003, Cooperative tracking with binary detection sensor networks, Conference On Embedded Networked Sensor Systems: Proceedings of the 1st international conference on Embedded networked sensor systems, New York: ACM Press, pp. 332-333.
Murphy, C. K., 2000, "Combining belief functions when evidence conflicts", Decision support systems, Vol. 29, No. 1, pp. 1-9.
Nakamura, E. F., Figueiredo, C. M. and Loureiro, A. A., 2005, Information fusion for data dissemination in self-organizing wireless sensor networks, Proceedings of the 4th International Conference on Networking (ICN2005), Reunion, France, pp. 585-593.
Nakamura, E. F., Loureiro, A. A. F. and Frery, A. C., 2007, "Information fusion for wireless sensor networks: Methods, models, and classifications", ACM Computer Survey, Vol. 39, No. 3, pp. 1-55.
Pearl, J., 1987, "Addendum: Evidential Reasoning using stochastic simulation of causal models", Artificial Intelligence , Vol. 33, No. 2, pp. 245-257.
Pearl, J., 1988, Probabilistic Reasoning in Intelligent Systems: Networks of Plausible Inference, Morgan Kaufman, Inc., San Mateo, CA.
Rosa, J. L. A. and Ebecken, N. F. F., 2003, Data Mining for Data Classification Based on the KNN-Fuzzy Method Supported by Genetic Algorithm, Proc of the 5th International Conference on High Performance Computing for Computational Science, Porte, Portugal, pp. 126-133.
Shortliffe, E. H., 1976, Computer-based medical consultation: MYCIN, New York: American Elsevier.
Shafer, G. A., 1967, A Mathematical Theory of Evidence Princeton, USA: Princeton University Press, 1-80. Smets P., 1990, "The Combination of Evidence in the Transferable Belief Model" , IEEE Transon Pattern Analysis and Machine Intelligence, Vol. 12, No. 5, pp. 447-458.
Sundmaeker, H., Guillemin, P., Friess, P. and Woelfflé, S., 2010, Vision and Challenges for Realising the Internet of Things, Luxemborg: Publications Office of the European Union.
Toet A., 1989, "Image fusion by a rat io of low_pass pyramid", Pattern Recognition Letters, Vol. 9, No. 4, pp. 245-253.
Toet, A., Ruyven, L. J. and Valeton, J. M., 1989, "Merging thermal and visual images by a contrast pyramid", Optical Engineering, Vol. 28, No. 7, pp. 789-792.
Toet, A., 1989, "A morphological pyramidal image decomposition" Pattern Recognition Letters, Vol. 9, No. 4, pp. 255- 261.
Toet, A., 1992, "Mult iscale contrast enhancement with applications to image fusion", Optical Engineering, V ol. 31, No. 5, pp. 1026-1031.
Vapnik, V. N., 1999, The Nature of Stat istical Learning Theory, NY: Springer Verlag.
Ye, N. and Li, X. Y., 2001, A Machine Learning Algorithm Based on Supervised Clustering and Classification, Proc of the 6th International Computer Science Conference on Active Media Technology, Hong kong, China, pp. 327-334.
Wellman, M. P.,1990, "Fundamental concepts of qualitative Probabilistic networks", Artificial Intelligence , V ol. 44, No. 3, pp. 257-303.
Yager, R. R., 1987, "On the Dempster-Shafer Framework and New Combination Rules" , Information Sciences: An International Journal, Vol. 41, No. 2, pp. 93-137.
物联网信息融合技术及存在的问题研究
王 洪 波1,2
(1. 合肥工业大学 管理学院 合肥 23009;)
(2. 过程优化与智能决策教育部重点实验室 合肥 230009)
摘要:物联网是通过各种传感设备将物品与互联网连接起来的一种新型网络。在物联网信息感知过程中,信息融合已成为一个关键性技术。本文阐述了物联网信息融合技术,包括数据级融合、特征级融合和决策级融合。在此基础上,指出了物联网信息融合过程中存在问题和挑战,分析了有待进一步研究的方向。
关键词:物联网;信息融合;信息感知
中图法分类号: TP301.6 文献标识码: A
Research of Information Fusion Technologies and Existing Problems
in the Internet of Things
WANG Hong-bo1,2
(1. School of Management, Hefei University of Technology, Hefei, 230009, China)
(2. Key Laboratory of Process Optimization and Intelligent Decision-making, Ministry of Education, Hefei,
230009, China)
Abstract:The internet of things is a new network in which things are connected to the internet by various sensing equipments. In the process of information sensing in the internet of things, the information fusion technologies have become critical. In this paper, the information fusion technologies in the internet of things have been presented, including data-level fusion, feature-level fusion and decision-level fusion. On this basis, the problems and challenges existing in the information fusion process in the internet of things have been showed, and the further research directions have also been put forwarded.
Keywords: Internet of Things; Information fusion; Information sensing
一、 引言
物联网(Internet of Things,简称IoT) 概念于1999年由麻省理工学院(MIT )Auto-ID 中心最早提出(Sundmaeker et al. ,2010)。2005年11月,国际电信联盟(International Telecommunication Union ,简称ITU )在信息社会世界峰会(WSIS )上发布了《ITU 互联网报告 2005:物联网》并在报告中正式确定了“物联网”概念(ITU ,2005),报告指出物联网发展所依赖的技术包括:无线射频技术(RFID )、无线传感器技术(WSN )、智能嵌入技术、小型化技术和纳米技术等。
物联网是通过各种传感设备将不同种类的物品与互联网连接起来的一种具有智能化识别、定位、跟踪、监控和管理的网络,以实现人与物、物与物之间的信息交换。在物联网中,信息感知是一个基本功能,它是通过传感器对物联网中物品进行信息收集,根据应用目标的需要对所收集到的信息加以筛选,将有效数据或有价值数据提供给用户进行分析和处理。由于物联网所能提供的传输、处理和分析等资源有限,因此在满足客户需要的条件下,采用信息融合技术对数据进行有必要的处理,以实现对信息的高效感知。 1 王洪波,男,1983年生,博士生,主要研究领域为人工智能、数据挖掘、云计算、决策理论与方法. E-mail :bz308cctv@163.com
随着物联网技术研究不断深入,物联网信息融合技术取得了一定数量的成果,因此需要对该类技术进行一定程度的梳理。本文对物联网信息融合技术的现有研究成果进行归纳,阐述了物联网信息融合的主要技术。首先从信息提取水平角度将融合技术划分三个层次,对现有技术和方法进行归纳和分析;然后,探讨了物联网信息融合研究的热点领域,指出了物联网信息融合所存在的问题和挑战,并展望了未来研究的方向;最后,对全文进行概括和总结。
二、 物联网信息融合技术
信息融合是指在一定准则下利用计算机技术对多源信息分析和综合以实现不同应用的分类任务而进行的处理过程。根据信息提取水平,Nakamura et al.(2007)将物联网中信息融合技术划分为4个层次,主要包括:低等水平融合、中等水平融合、高等水平融合和多级融合。Nakamura 分类方法中多级融合技术是前三种融合技术的综合,故本文认为将数据融合技术划分为3个层次较为合理。对于物联网,数据级融合主要是消除输入数据中的噪声,而特征级融合和决策级融合则侧重于获取与实际应用相关的有价值信息。
(一) 数据级融合技术
数据级融合主要是指在原始数据采集后的融合。该融合的特点是必须在同质信息前提下的融合,不同质信息则不能在此阶段融合。在数据级融合阶段常用的方法多为加权平均法、特征匹配法法和金字塔算法等传统方法。
加权平均法是最简单的融合算法,直接对传感器所获得信息进行线性的加权平均。Mechitov et al.(2003)提出通过对传感器的位置进行加权平均,估计出目标运动轨迹上的各点坐标位置。崔逊学等(2011)则根据计算几何理论,提出基于三圆交集计算二值传感器网络目标的位置。加权平均法具有实现简单、快速的优点,能够有效地抑制噪声,但是其融合结果的对比度相对较低,且无法通过增大权重的方式反映某些信息所具有的突出作用。
特征匹配法就是利用通过特征的匹配关系建立图像间的配准映射变换,最常用的方法是ICP 算法。Besl&Mckey(1992)提出一种基于轮廓特征的点配准方法ICP 。刘繁明、屈昊(2004)提出了对准集合的一种方法,采用对准误差通过非线性最优化算法直接最小化。杨明等(2004)提出一种基于切线的角度直方图的ICP 方法,该方法首先使用M 估计器鲁棒地计算扫描中每点的切线方向,然后使用基于Hough 变换的切线角度直方图计算旋转分量,最后使用迭代切线加权最近点ITCP 计算相对位姿估计。
金字塔算法是采用通过不断地滤波原始图像的方式,形成一个多级塔状结构用以分析和融合图像数据。Burt &Adelson(1983)首先提出拉普拉斯金字塔算法,它是在高斯滤波图像的基础上,与预测图像之间形成一系列误差图像。Toet (1989a ,1989b ,1989c ,1992)则提出了比对度金字塔算法和形态学金字塔算法。Burt (1992)通过利用梯度算子对每层图像进行计算,以实现对图像的分解。Barron &Thomas(2001)通过纹理滤波器对每层图像中不同方向的纹理信息进行提取,获得图像更多细节信息。Chipman et al. (1995)和Li et al. (1995)则分别提出了不同的离散小波变换的融合算法。
(二) 特征级融合技术
特征级融合主要是在对原始数据进行了特征值提取的工作后,运用基于特征值比较的融合方法,其特点为可在不同质信息范围内进行融合,但无法对融合结果进行判别并作出合理决策。在特征级融合技术阶段常使用k 近邻、卡尔曼滤波、聚类算法等方法。
K 近邻算法(V apnik ,1999)是一种简单的分类算法,该算法使用某一种距离度量计算待分类样本与所有训练样本之间的距离,寻找与待分类样本最近的k 个近邻,根据k 个近邻所属的类别来确定待分类样本的类别。Ye et al.(2001)将聚类算法与K 近邻算法相结合,提出了CCA-S (Clustering and Classification Algorithm-Supervised)算法。Rosa et al.(2003)为了快速且有效寻找最优k 值,提出将遗传算法与K 近邻算法相结合。陈黎飞、郭躬德(2011)
提出了一种多代表点的学习算法(Multi-Representativesfor Efficient Classification,简称MEC )用于最近邻分类。金弟等(2010)提出一个基于结构化相似度的网络聚类算法将向量数据集转化成k 邻近网络, 然后用SSNCA (Structural Similarity based Network Clustering Algorithm)对k 邻近网络进行聚类。
卡尔曼滤波是一种最优随机滤波技术,能够较好地消除噪声对信号的干扰,但是经典的卡尔曼滤波和扩展的卡尔曼滤波一般仅限于线性高斯系统。Julier et al.(1997)针对上述问题,提出无迹卡尔曼滤波(Unscented Kalman Filter ,简称UKF )处理非线性非高斯系统的跟踪问题。刘献如、蔡自兴、唐 琎(2010)提出将绝对差值和(SAD )方法、无迹卡尔曼滤波(UKF )和Mean shift算法相结合的混合自主跟踪动态目标的方法。
聚类算法是数据挖掘领域中常见的一种分类技术,常见的聚类算法有基于划分的聚类k-means 。k-means (Hartigan&Wong,1979)的评判标准是以样本与相关聚类中心之间的欧式距离之和为参照标准,将该评判准则最小化以实现数据集的划分。公茂果、王爽、马萌(2011)则提出二阶段聚类算法(two-phase clustering,简称TPC ),该算法不仅能够有效处理复杂分布的数据聚类问题,而且其计算复杂度低于MEC 。陈小全、张继红(2012)提出了一种基于改进的粒子群算法的聚类算法,该算法将k-means 和粒子群算法相结合,提高了k-means 的局部搜索能力。
(三) 决策级融合技术
决策级融合是通过对不同质数据进行预处理、特征值提取和识别、分配可信度作出最优决策,其特点为能对传感器采集的数据做出融合,并可利用融合结果进行分析和判别,形成决策建议。相比较前两个融合,决策级融合是最高层次的信息融合,融合系统不仅容错性能好,而且适用领域广。常见决策级识别方法有专家系统、Bayes 推理法和证据理论法等。
专家系统(Expert system,简称ES )主要是由知识库、推理机、综合数据库、解释器和接口等组成。专家系统有很多种,具有代表性的有基于规则的专家系统、基于框架的专家系、基于模型的专家系统、基于案例的专家系统等,目前大多数智能决策系统都是基于专家系统的。Shortliffe et al.(1976)构建MYCIN 系统用于诊断和治疗血液感染和脑炎感染。Duda et al.(1977)提出经典PROSPCTOR 系统用于地质勘探。王青等(2006)提出一种基于神经网络与专家系统的自学习智能决策支持系统。
Bayes 推理法是基于概率分析、图论的一种不确定性知识表达和推理的方法。Pearl (1998)和Lauritzen (1998)提出贝叶斯网的精确推理方法,即Polytree 和Jmtetion Tree,而Pearl (1987)和Jensen et al. (1995)则提出近似推理方法,即Importnat Sampling 和Gibbs Sampling 。Dean&Kanazawa(1989)提出针对动态时变系统的动态贝叶斯网(Dynmaic Bayesian Networks ,简称DBN )。Wellman (1990)提出定性贝叶斯网(Qualitative Bayesian Networks,简称QBN )。国内学者对Bayes 推理法也有一定的研究,杨小军等(2007)在Bayes 框架下基于粒子滤波器预测和估计目标状态分布,提出一种有效的粒子方法逼近目标状态期望的方差, 实现了传感器的最优选择。
证据理论法(Dempster-Shafer 理论,简称DS 理论)最先由Dempster (1967)提出的,他的学生Shafer (1967)又进一步发展了该理论使之成为一种不确定推理方法。Yager (1987)提出既然无法合理分配冲突证据,那就将冲突系数k 赋给未知域。Smets (1990)提出将冲突证据分配给空集,这样将不会引起错误判断。Lefevre (2002)提出统一信任函数组合规则,该规则核心是根据权重公式将其分配给相关子集。MurPhy (2000)的方法是将证据的基本信任分配取平均值,通过多次迭代取得融合信息。邓勇(2004)提出一种加权平均组合方法,该方法考虑了各证据之间的相关性。林作铨等(2004)提出在Dempster 合成之前,基于未知扰动对mass 函数进行预处理,并通过预处理来解决标准化问题。Nakamura et al.(2005)采用DS 证据理论实现了对网络路由状态的分析和判断,给出了路由是否需要重建的结论。
三、 存在的问题
信息融合能够减少所需要传输的数据量,降低传输过程中数据之间的冲突、减轻物联网中拥塞现象发生次数,合理利用网络资源。因此,信息融合技术已成为物联网的关键技术和研究热点。为了让物联网中的信息融合过程更加快速、有效,现实中还有很多物联网信息融合技术需要完善和改进。
(一) 多源异构信息的融合问题
由于物联网中传感器所采集的信息内容不同、传感器采集的频率不同、传感器所输出信息的表示方式不同、传感器所能感知的物体种类不同以及传感器的数量众多等原因,导致物联网信息融合技术需要处理的信息具有多源异构的特征。此外,由于物联网中网络节点在功能和结构上存在巨大差异,使得在信息融合过程中,不同的网络节点所能处理、传输和存储的信息数量存在很大差异。因此,在物联网针对多源异构信息的融合技术所面临的问题主要为四个方面:(1)由于物联网信息需要在表示方式和语义知识两个方面必须进行统一化处理,因此信息融合过程存在建立统一的表达形式和统一的描述语言问题;(2)由于参与信息融合的网络节点所提供信息的测量维数不同,因此信息融合过程面临多维信息的降维优化问题;
(3)不同网络节点对信息的采样率和时间同步率都不一样,因此信息融合过程存在不确定数据融合的问题;(4)在信息融合过程需要利用大量网络节点进行融合运算,因此信息融合过程存在保证各网络节点间的调度和分配、容错管理以及对数据的高效率存取访问等问题。
(二) 大数据的融合问题
客观世界中物体的种类复杂、形态多样、数量巨大,这导致物联网对信息的采集需要各种传感设备,并且这些设备所采集到的信息具有海量规模。为了有效的从海量信息中发现有价值的知识为物联网用户提供各种领域信息服务,必须对物联网海量信息进行处理。原有的传感器网络的规模一般都比较小,节点数目一般在几十到上百之间,而且所应用的传感器种类相对比较单一,常采集若干种信息。随着物联网规模的不断扩大,网络中节点的数目也出现几何式增长,触感器种类也不断增多,由此所引起的信息数量也具有海量规模。针对大规模传感器网络中信息融合技术的研究目前处于起步阶段,大部分融合技术仅能适应小规模融信息的融合。因此,需要对涉及大数据融合的节点负载均衡、无线网络延迟、算法能量消耗、数据传输可靠性等热点问题进行必要的研究。
(三) 信息融合的安全问题
随着物联网适用范围的不断扩大,物联网中融合技术所涉及到的信息范围也不断扩展,相当一部分信息属于政府、金融等高敏感领域。因此,信息的安全问题也日益成为物联网信息融合需要重视的问题之一。物联网信息融合是信息感知的重要手段。如果海量节点中某一个节点因病毒感染而导致信息被篡改,融合节点将很难分辨出正常信息和恶意信息。由于信息融合节点处于物联网信息感知和交互的中枢位置,从而对融合信息的破坏不但会使融合过程产生混乱,而且还会使物联网用户在错误结论指导下采取错误行为。因此,物联网融合过程中的信息安全必须加以考虑。这就要求融合节点需要具有分辨数据有效性的机制和措施,能够在海量融合信息中快速、准确的判断出信息真伪,使物联网用户的隐私得到保障。
四、 结论
物联网信息融合技术涉及到较多领域内容,虽然物联网的概念出现时间不短,但作为物联网信息感知过程中关键性环节的信息融合技术还有很多方面有待完善。本文重点分析了数据级融合、特征级融合、决策级融合等3类信息融合技术,并讨论了多源异构信息的融合、大数据的融合和信息融合的安全等问题。通过对上述内容的总结和归纳,有助于促进物联网信息融合技术更好地发展和完善。
参考文献
陈黎飞, 郭躬德, 2011:《最近邻分类的多代表点学习算法》, 《模式识别与人工智能》第6期。
陈小全, 张继红, 2012:《基于改进粒子群算法的聚类算法》, 《计算机研究与发展》第z1期。
崔逊学, 周强, 方震, 2011:《基于三圆交集的二值传感器网络目标跟踪快速算法》《, 计算机研究与发展》第2期。
公茂果, 王爽, 马萌, 2011:《复杂分布数据的二阶段聚类算法》, 《软件学报》第11期。
金弟, 刘杰, 贾正雪, 刘大有, 2010:《基于k 最近邻网络的数据聚类算法》, 《模式识别与人工智能》第4期。
林作铨, 牟克典, 韩庆, 2004:《基于未知扰动的冲突证据合成方法》, 《软件学报》第8期。
刘繁明, 屈昊, 2004:《ICP 算法的鲁棒性改进》, 《仪器仪表学报》第4期。
刘献如, 蔡自兴, 唐 琎, 2010:《基于SAD 与UKF -Mean Shift的主动目标跟踪》, 《模式识别与人工智能》第5期。
王青, 祝世虎, 董朝阳, 陈宗基, 2006:《自学习智能决策支持系统》, 《系统仿真学报》第4期。
杨明, 董斌, 王宏, 张钹, 2004:《基于激光雷达的移动机器人实时位姿估计方法研究》, 《自动化学报》第5期。
杨小军, 邢科义, 施坤林, 潘泉, 2007:《传感器网络下机动目标动态协同跟踪算法》, 《自动化学报》第10期。
Burt, P. J., 1992, A gradient pyramid basis for pattern selective image fusion, Proc of the Society for Information Display Conference, San Jose: SID Press, pp. 467-470.
Barron, D. R. and Thomas, O. D. J., 2001, "Image fusion though consideration of texture components", IEEE Trans on Electronics Letters, Vol. 37, No. 12, pp. 746- 748.
Chipman, L. J., Orr, T. M. and Graham, L N., 1995, Wavelets and image fusion, Proc of Int Conf on Image Processing, Los Alamitos: IEEE Computer Society, pp. 248-251.
Dean, T. L. and Kanazawa, K., 1989, "A model of reasoning about persistence and causation", Computational Intelligence , No. 5, No. 3, pp. 142-150.
Dempster, A. P., 1967, "Upper and Lower Probabilities Induced by a Multivalued Mapping", The Annals of Mathematical Statistics, Vol. 38, No. 4, pp. 325-339.
Deng, Y ., Shi, W. K., Zhu, Z. F., and Liu Q., 2004, "Combining Belief Functions Based on Distance of Evidence" , Decision Support Systems, Vol. 38, No. 3, pp. 489-493.
Duda, R. O., 1977, Development of a computer-base consultant for mineral exploration Annual Report,
[ S. .l ]: SRI Project, pp. 5821-5824.
Hartigan, J. A. and Wong, M. A., 1979, "A k-means clustering algorithm", Applied Statistics, Vol. 28, No. 1, pp. 100-108.
International Telecommunication Union (ITU), 2005, ITU Internet Reports 2005: The Internet of Things, Tunis: World Summit on the Information Society (WSIS).
Jensen, C., Kong, A. and Kjaerul, U., 1995, "Blocking gibbs sampling in very large probabilistic expert systems", International Journal of Human Computer Studies. Specia1 Issue on Real-World Applications of Uncertain Reasoning, Vol. 42, No. 6, pp. 647-666.
Julier, S. J. and Uhlmann, J. K., 1997, A new extension of the Kalman filter to nonlinear systems, Proc SPIEInt Soc Opt Eng, Orlando: SPIE, pp. 182-193.
Lauritzen, S. L. and Spiegelhalter, D. J., 1988, "Local computations with Probabilities on graphical Structures and their application to expert systems", Journal of the Royal Statistical Society B, Vol. 50, No. 2, pp. 57-224.
Lefevre, E. and Colot, O., 2002, "Vannoorenberghe P. Belief Functions Combination and Conflict Management" , Information Fusion, Vol. 3, No. 2, pp. 149-162.
Li, H., Manjunath, B. S. and Mitra, S., 1995, "Mult isensor image fusion using the wavelet transform", Graphical Models and Image Process, Vol. 57, No. 3, pp. 235-245.
Mechitov, K., Sundresh, S., Kwon Y. and Agha, G., 2003, Cooperative tracking with binary detection sensor networks, Conference On Embedded Networked Sensor Systems: Proceedings of the 1st international conference on Embedded networked sensor systems, New York: ACM Press, pp. 332-333.
Murphy, C. K., 2000, "Combining belief functions when evidence conflicts", Decision support systems, Vol. 29, No. 1, pp. 1-9.
Nakamura, E. F., Figueiredo, C. M. and Loureiro, A. A., 2005, Information fusion for data dissemination in self-organizing wireless sensor networks, Proceedings of the 4th International Conference on Networking (ICN2005), Reunion, France, pp. 585-593.
Nakamura, E. F., Loureiro, A. A. F. and Frery, A. C., 2007, "Information fusion for wireless sensor networks: Methods, models, and classifications", ACM Computer Survey, Vol. 39, No. 3, pp. 1-55.
Pearl, J., 1987, "Addendum: Evidential Reasoning using stochastic simulation of causal models", Artificial Intelligence , Vol. 33, No. 2, pp. 245-257.
Pearl, J., 1988, Probabilistic Reasoning in Intelligent Systems: Networks of Plausible Inference, Morgan Kaufman, Inc., San Mateo, CA.
Rosa, J. L. A. and Ebecken, N. F. F., 2003, Data Mining for Data Classification Based on the KNN-Fuzzy Method Supported by Genetic Algorithm, Proc of the 5th International Conference on High Performance Computing for Computational Science, Porte, Portugal, pp. 126-133.
Shortliffe, E. H., 1976, Computer-based medical consultation: MYCIN, New York: American Elsevier.
Shafer, G. A., 1967, A Mathematical Theory of Evidence Princeton, USA: Princeton University Press, 1-80. Smets P., 1990, "The Combination of Evidence in the Transferable Belief Model" , IEEE Transon Pattern Analysis and Machine Intelligence, Vol. 12, No. 5, pp. 447-458.
Sundmaeker, H., Guillemin, P., Friess, P. and Woelfflé, S., 2010, Vision and Challenges for Realising the Internet of Things, Luxemborg: Publications Office of the European Union.
Toet A., 1989, "Image fusion by a rat io of low_pass pyramid", Pattern Recognition Letters, Vol. 9, No. 4, pp. 245-253.
Toet, A., Ruyven, L. J. and Valeton, J. M., 1989, "Merging thermal and visual images by a contrast pyramid", Optical Engineering, Vol. 28, No. 7, pp. 789-792.
Toet, A., 1989, "A morphological pyramidal image decomposition" Pattern Recognition Letters, Vol. 9, No. 4, pp. 255- 261.
Toet, A., 1992, "Mult iscale contrast enhancement with applications to image fusion", Optical Engineering, V ol. 31, No. 5, pp. 1026-1031.
Vapnik, V. N., 1999, The Nature of Stat istical Learning Theory, NY: Springer Verlag.
Ye, N. and Li, X. Y., 2001, A Machine Learning Algorithm Based on Supervised Clustering and Classification, Proc of the 6th International Computer Science Conference on Active Media Technology, Hong kong, China, pp. 327-334.
Wellman, M. P.,1990, "Fundamental concepts of qualitative Probabilistic networks", Artificial Intelligence , V ol. 44, No. 3, pp. 257-303.
Yager, R. R., 1987, "On the Dempster-Shafer Framework and New Combination Rules" , Information Sciences: An International Journal, Vol. 41, No. 2, pp. 93-137.