信息检索技术发展和趋势
摘要:现代信息检索技术经历了由低级到高级的发展过程。目前正朝着多元化的方向发展。主要从信息检索的智能化、专业化、可视化、一站式及基于网格的5个方面来介绍现代信息检索技术的发展趋势。
随着信息技术的发展和用户检索需求的变化,现代信息检索技术在理念、人性化、智能化等方面发生了全面突破。本文探讨了现代信息检索技术发展趋势,从智能化、个性化、一站式、可视化四个方面进行了分析,对检索技术发展趋势展开了一定的探讨。
关键词:信息检索;智能化;个性化;一站式;可视化
信息检索技术经过先组式索引检索、穿孔卡片检索、缩微胶卷检索、脱机批处理检索发展到今天的联机检索、光盘检索、网络检索等。其发展经历了由低级到高级的过程、传统的线性检索向超文本支持的非线性检索发展。这主要依赖于信息技术的发展和信息用户的信息检索需求。这些始终是推动现代信息检索理论与技术发展的重要动力。那么,现代信息检索技术的发展趋势将来如何呢?而要对信息检索技术的发展作出成功的预测是十分困难的。但是可以在广泛调研、比较、分析的基础上把握其某些发展动态,发现一些影响现代信息检索技术发展的新变化、新技术、新理念。
1智能化信息检索
智能化信息检索是人们把人工智能与信息检索技术结合起来应用于信息存取领域的成果。近年来internet上不断涌现的人工智能产品。比如智能搜索引擎、智能浏览器、智能代理、知识共享智能体等。都将大大提高信息存取系统的智能化程度。智能化信息检索是当今信息检索技术研究的热点问题之一。也是未来信息检索主要的发展方向。智能化信息检索是基于自然语言的检索形式.机器根据用户所提供的自然语言表述的检索要求进行分析,而后形成检索策略进行搜索,它能够代替或辅助用户完成诸如选词、选库、构造检索式。甚至在数据库中进行自动推理查找等功能;系统对知识库检索推理的结果。可以使用户得到能够直接加以利用的信息,它是建立在一个或多个专家系统基础上的信息存取系统。用户所需要做的仅仅是告诉计算机想做什么,至于怎样实现则无须人工干预.这意味着用户将彻底从繁琐的规则中解脱出来。它是人工智能与检索技术的有机结合。检索工具智能化的内涵在于检索工具具有学习、分析、辨别和推理的能力。IBM的最新研究的检索系统Piquant能够基于对问题回答来完成用户的检索要求。Piquant能分析文章的语义结构,并揭示其没有显示的表现出来的知识。IBM研究人员演示了在Pinquant中提问“谁是加拿大总理?”。系统准确地找到了回答这个问题的文章,虽然在这篇文章中没有显示的提到我们提问中的单词。
提高信息检索的智能化是信息检索所致力于实现的一个重要特征,它包含2个方面的含义:一是用户检索需求理解的智能化。比如AskJeeve,AnswerBus(http://www.answerbus.corn)等等;二是检索过程的智能化。比如著名的搜索引擎AltaVista所开设的“Ask AltaVista”就有这种智能化检索技术,能够综合用户在一次次的检索结果选择中的取舍,自我学习并进行推理,使自己变得更聪明,从而调整其检索策略,完善检索效果。
人工智能与信息检索技术的结合,将使检索工具更高级易用、更加智能化、个性化和人性化,也使得检索结果更加符合人们的需求,但是因为人工智能本身还处在发展和研究之中.使得现在的检索工具还没有具备完全的智能化.要真正
实现两者的结合的各项优势,还有待研究和改进。因而,检索工具的智能化在未来还具有相当的发展潜力。有关智能检索技术的研究.将为信息检索技术的发展带来革命性的飞跃。也是未来网络信息检索的一个发展方向。
2可视化信息检索
据研究。人们获取的信息70%来自视觉,20%来自听觉,10%来自触觉。因此,人类是非常适应可视信息的。可视的图像较容易记忆,而且在传达某种信息时比任何方式都快且更有效,因而可视化检索具有自己独特的优势。可视化信息检索包含2个方面:一个是检索过程的可视化,另一个是检索结果的可视化。检索过程的可视化是指用户在检索过程中各检索对象之间的关系以可视化的形式展现在用户面前.用户顺着可视化的检索画面一步一步地发现检索结果。斯坦福大学的高线出版社(Hi曲Wire Press)推出的主题地图(TopicMap)就是一种可视化检索环境,它总共包括54149个主题.按学科分类.并按学科之间的关系构成主题树.用户可以可视化地看到学科与学科之间的关系,以及每一个学科下子学科的数目,用户通过拖动鼠标来选择自己感兴趣的主题.最后显示在每一等级主题下的论文数目。
相对于其他的信息检索技术,可视化信息检索技术的好处有:对文献或检索式内部语义关系的理解,有助于用户判断一个检索中的相关文献;一个透明的检索过程使检索更容易、有效,即视觉过程寓于检索过程中是可视化的核心;一个可视化的环境为用户展示更丰富、更直观的信息。相关性在传统的信息检索中指检索结果与检索式相关.而在可视化检索中指检索结果之间的相关度:它具有开发新的检索系统的潜力;它引入了人的认知能力:使得用户可以进行交互式输入,允许在信息空间进行动态移动,允许用户修改数据的展示方式。使他们理解数据的个人偏好可视化;减少了理解检索结果的时间。可对相关的信息进行聚类分析。而聚类分析可帮助人们发现新的学科点,也可作为反馈的工具:提供对检索的有效的反馈机制;提高检索的准确度:帮助和提高检索系统与人之间的交互性:检索结果可以模仿网络环境形成拓扑图.在拓扑图中所有的相似文献或其它类型资源将被归为同类。以等高线来表达与其它信息内容在概念上的远近,Cartia的Theme Scape便是基于概念图谱运用的例子之一。
总之,可视化技术缩短了用户理解信息的时间.提供了感觉与思考之间的有效反馈机制,它代表着信息检索的未来,将会取代以布尔逻辑为基础的、传统的信息存取系统,如OPAC和搜索引擎。尽管目前成熟的、商业化的可视化信息存取系统还未问世,但随着网络技术的发展。以及XML,RDF,Ontology,Grid在信息组织、构架中的应用.可视化检索的优势将越来越突出.成为现代检索技术的发展方向之
3一站式信息检索
目前的信息检索系统比如搜索引擎大都是在甲网站找图片,到乙网站找新闻,再到丙网站找股票资讯等等,十分麻烦且浪费时间。如何将这些图片、新闻、股票等等各种相关联的信息整合到同一界面,让Intemet用户一次查询,全部满足用户的查询要求,这就必须引入一站式(One Stop)信息检索技术,它使得信息用户在搜索时只需输入一次查询目标,即可在同一界面得到各种有关联的查询结果。一站式信息检索能够使用户通过一个检索工具满足自己所有的信息检索需求。一站式信息检索将是未来信息检索服务的一种发展模式。一站式信息检索服务是人性化服务的重要体现,它将大量节约用户的检索时间。
4个性化信息检索
信息时代的一个很大特点就是个性化,不同的人有不同的检索习惯.对检索界面也会有不同的要求:由于人们对词义的不同理解及感兴趣的领域不同,不同的用户对相同的检索结果往往会有不同的评价。随着信息资源的指数级膨胀。不同的打有消费者个人烙印的产品将成为某个消费者区别他人、感觉自我存在及独特的外在标志,也真正体现了个性化信息检索以用户为中心的服务理念。因此现代信息存取技术将来也要满足用户个性化的需求。
个性化信息检索主要体现在以下2个方面:
1允许信息用户的个性化定制。通过“person—alization”选项.用户可以在一定程度上改变检索结果显示的格式.用户还可以预选择自己的信息源,向各种用户自身满意的信息源提问,索取特定类型的信息,并且用户还能对命中结果进行进一步限定,要求仅提供权威性的可靠结果.从而提高查准率,分辨和满足不同用户不同检索需要的功能,甚至还能理解不同用户的不同工作风格。在应用中表现为信息用户的基本定制和高级定制。
2基于数据挖掘技术对信息用户的检索行为进行分析.挖掘出信息用户的检索需求,利用推送技术(Push)主动向用户推送所需要的信息资源。例如,专业性搜索引擎中的Deja News具备个性化检索和自动跟踪功能,当用户使用了DejaNews提供的查询功能后.在返回的结果中点击“Track this search forme”。以后每当有新的文章满足用户的查询条件时,系统将通过电子邮件自动通知用户。
总之,现代信息检索技术的发展趋势必将以信息技术的发展和信息用户的信息检索需求为出发.在理念、人性化、智能化等方面取得全面突破,不断吸收信息技术上的最新成果和理解人们的需求。逐渐适应人脑的思维方式,实现智能、高效、快速而灵活的信息检索,最后达到随心所欲地查找、迅速获取所需信息的水平。从而促进人们对无序信息世界的有序化组织,令信息资源得到更为合理的开发和利用,以一个崭新的面貌出现在人们面前。
参考文献:
[1】苏新宁主编.信息检索理论与技术.北京:科学技术文献出版
社.2004
[2】熊回香.网络信息检索及其发展趋势研究.华中师范大学硕士学位论文.2003
【3】黄如花.网络信息检索的发展趋势.图书情报知识,2002(8)
信息检索技术发展和趋势
摘要:现代信息检索技术经历了由低级到高级的发展过程。目前正朝着多元化的方向发展。主要从信息检索的智能化、专业化、可视化、一站式及基于网格的5个方面来介绍现代信息检索技术的发展趋势。
随着信息技术的发展和用户检索需求的变化,现代信息检索技术在理念、人性化、智能化等方面发生了全面突破。本文探讨了现代信息检索技术发展趋势,从智能化、个性化、一站式、可视化四个方面进行了分析,对检索技术发展趋势展开了一定的探讨。
关键词:信息检索;智能化;个性化;一站式;可视化
信息检索技术经过先组式索引检索、穿孔卡片检索、缩微胶卷检索、脱机批处理检索发展到今天的联机检索、光盘检索、网络检索等。其发展经历了由低级到高级的过程、传统的线性检索向超文本支持的非线性检索发展。这主要依赖于信息技术的发展和信息用户的信息检索需求。这些始终是推动现代信息检索理论与技术发展的重要动力。那么,现代信息检索技术的发展趋势将来如何呢?而要对信息检索技术的发展作出成功的预测是十分困难的。但是可以在广泛调研、比较、分析的基础上把握其某些发展动态,发现一些影响现代信息检索技术发展的新变化、新技术、新理念。
1智能化信息检索
智能化信息检索是人们把人工智能与信息检索技术结合起来应用于信息存取领域的成果。近年来internet上不断涌现的人工智能产品。比如智能搜索引擎、智能浏览器、智能代理、知识共享智能体等。都将大大提高信息存取系统的智能化程度。智能化信息检索是当今信息检索技术研究的热点问题之一。也是未来信息检索主要的发展方向。智能化信息检索是基于自然语言的检索形式.机器根据用户所提供的自然语言表述的检索要求进行分析,而后形成检索策略进行搜索,它能够代替或辅助用户完成诸如选词、选库、构造检索式。甚至在数据库中进行自动推理查找等功能;系统对知识库检索推理的结果。可以使用户得到能够直接加以利用的信息,它是建立在一个或多个专家系统基础上的信息存取系统。用户所需要做的仅仅是告诉计算机想做什么,至于怎样实现则无须人工干预.这意味着用户将彻底从繁琐的规则中解脱出来。它是人工智能与检索技术的有机结合。检索工具智能化的内涵在于检索工具具有学习、分析、辨别和推理的能力。IBM的最新研究的检索系统Piquant能够基于对问题回答来完成用户的检索要求。Piquant能分析文章的语义结构,并揭示其没有显示的表现出来的知识。IBM研究人员演示了在Pinquant中提问“谁是加拿大总理?”。系统准确地找到了回答这个问题的文章,虽然在这篇文章中没有显示的提到我们提问中的单词。
提高信息检索的智能化是信息检索所致力于实现的一个重要特征,它包含2个方面的含义:一是用户检索需求理解的智能化。比如AskJeeve,AnswerBus(http://www.answerbus.corn)等等;二是检索过程的智能化。比如著名的搜索引擎AltaVista所开设的“Ask AltaVista”就有这种智能化检索技术,能够综合用户在一次次的检索结果选择中的取舍,自我学习并进行推理,使自己变得更聪明,从而调整其检索策略,完善检索效果。
人工智能与信息检索技术的结合,将使检索工具更高级易用、更加智能化、个性化和人性化,也使得检索结果更加符合人们的需求,但是因为人工智能本身还处在发展和研究之中.使得现在的检索工具还没有具备完全的智能化.要真正
实现两者的结合的各项优势,还有待研究和改进。因而,检索工具的智能化在未来还具有相当的发展潜力。有关智能检索技术的研究.将为信息检索技术的发展带来革命性的飞跃。也是未来网络信息检索的一个发展方向。
2可视化信息检索
据研究。人们获取的信息70%来自视觉,20%来自听觉,10%来自触觉。因此,人类是非常适应可视信息的。可视的图像较容易记忆,而且在传达某种信息时比任何方式都快且更有效,因而可视化检索具有自己独特的优势。可视化信息检索包含2个方面:一个是检索过程的可视化,另一个是检索结果的可视化。检索过程的可视化是指用户在检索过程中各检索对象之间的关系以可视化的形式展现在用户面前.用户顺着可视化的检索画面一步一步地发现检索结果。斯坦福大学的高线出版社(Hi曲Wire Press)推出的主题地图(TopicMap)就是一种可视化检索环境,它总共包括54149个主题.按学科分类.并按学科之间的关系构成主题树.用户可以可视化地看到学科与学科之间的关系,以及每一个学科下子学科的数目,用户通过拖动鼠标来选择自己感兴趣的主题.最后显示在每一等级主题下的论文数目。
相对于其他的信息检索技术,可视化信息检索技术的好处有:对文献或检索式内部语义关系的理解,有助于用户判断一个检索中的相关文献;一个透明的检索过程使检索更容易、有效,即视觉过程寓于检索过程中是可视化的核心;一个可视化的环境为用户展示更丰富、更直观的信息。相关性在传统的信息检索中指检索结果与检索式相关.而在可视化检索中指检索结果之间的相关度:它具有开发新的检索系统的潜力;它引入了人的认知能力:使得用户可以进行交互式输入,允许在信息空间进行动态移动,允许用户修改数据的展示方式。使他们理解数据的个人偏好可视化;减少了理解检索结果的时间。可对相关的信息进行聚类分析。而聚类分析可帮助人们发现新的学科点,也可作为反馈的工具:提供对检索的有效的反馈机制;提高检索的准确度:帮助和提高检索系统与人之间的交互性:检索结果可以模仿网络环境形成拓扑图.在拓扑图中所有的相似文献或其它类型资源将被归为同类。以等高线来表达与其它信息内容在概念上的远近,Cartia的Theme Scape便是基于概念图谱运用的例子之一。
总之,可视化技术缩短了用户理解信息的时间.提供了感觉与思考之间的有效反馈机制,它代表着信息检索的未来,将会取代以布尔逻辑为基础的、传统的信息存取系统,如OPAC和搜索引擎。尽管目前成熟的、商业化的可视化信息存取系统还未问世,但随着网络技术的发展。以及XML,RDF,Ontology,Grid在信息组织、构架中的应用.可视化检索的优势将越来越突出.成为现代检索技术的发展方向之
3一站式信息检索
目前的信息检索系统比如搜索引擎大都是在甲网站找图片,到乙网站找新闻,再到丙网站找股票资讯等等,十分麻烦且浪费时间。如何将这些图片、新闻、股票等等各种相关联的信息整合到同一界面,让Intemet用户一次查询,全部满足用户的查询要求,这就必须引入一站式(One Stop)信息检索技术,它使得信息用户在搜索时只需输入一次查询目标,即可在同一界面得到各种有关联的查询结果。一站式信息检索能够使用户通过一个检索工具满足自己所有的信息检索需求。一站式信息检索将是未来信息检索服务的一种发展模式。一站式信息检索服务是人性化服务的重要体现,它将大量节约用户的检索时间。
4个性化信息检索
信息时代的一个很大特点就是个性化,不同的人有不同的检索习惯.对检索界面也会有不同的要求:由于人们对词义的不同理解及感兴趣的领域不同,不同的用户对相同的检索结果往往会有不同的评价。随着信息资源的指数级膨胀。不同的打有消费者个人烙印的产品将成为某个消费者区别他人、感觉自我存在及独特的外在标志,也真正体现了个性化信息检索以用户为中心的服务理念。因此现代信息存取技术将来也要满足用户个性化的需求。
个性化信息检索主要体现在以下2个方面:
1允许信息用户的个性化定制。通过“person—alization”选项.用户可以在一定程度上改变检索结果显示的格式.用户还可以预选择自己的信息源,向各种用户自身满意的信息源提问,索取特定类型的信息,并且用户还能对命中结果进行进一步限定,要求仅提供权威性的可靠结果.从而提高查准率,分辨和满足不同用户不同检索需要的功能,甚至还能理解不同用户的不同工作风格。在应用中表现为信息用户的基本定制和高级定制。
2基于数据挖掘技术对信息用户的检索行为进行分析.挖掘出信息用户的检索需求,利用推送技术(Push)主动向用户推送所需要的信息资源。例如,专业性搜索引擎中的Deja News具备个性化检索和自动跟踪功能,当用户使用了DejaNews提供的查询功能后.在返回的结果中点击“Track this search forme”。以后每当有新的文章满足用户的查询条件时,系统将通过电子邮件自动通知用户。
总之,现代信息检索技术的发展趋势必将以信息技术的发展和信息用户的信息检索需求为出发.在理念、人性化、智能化等方面取得全面突破,不断吸收信息技术上的最新成果和理解人们的需求。逐渐适应人脑的思维方式,实现智能、高效、快速而灵活的信息检索,最后达到随心所欲地查找、迅速获取所需信息的水平。从而促进人们对无序信息世界的有序化组织,令信息资源得到更为合理的开发和利用,以一个崭新的面貌出现在人们面前。
参考文献:
[1】苏新宁主编.信息检索理论与技术.北京:科学技术文献出版
社.2004
[2】熊回香.网络信息检索及其发展趋势研究.华中师范大学硕士学位论文.2003
【3】黄如花.网络信息检索的发展趋势.图书情报知识,2002(8)