基于JASIST的情报学研究前沿及趋势分析

2 图 书 馆 学 研 究 2010(应用版) 13

基于JA SIST 的情报学研究前沿及趋势分析李金建 贡金涛

=摘 要>选择情报学著名期刊Journal of the American Societ y f or Information Science and T echnology (5美国情报会志6) 1999) 2008年发表的全部1241篇文献题录作为数据样本, 根据科学计量学原理, 用Cit eSpace 软件绘制出相应的知识图谱, 揭示了学科发展的趋势, 发现了情报学研究领域的关键文献和关键人物, 展现了情报学研究领域的知识结构关系。分析图谱得出了3个研究前沿:信息检索及技术研究; 网络信息及信息查询行为; 引文及词共现分析研究。

=关键词>情报学 共引分析 可视化图谱 Cit eSpace

Abstract:Choosing the total 1241articles published during 1999-2008in Journal of the American Society for Inform ation and Tech nology, a famous journal in the field of Information Science as the data sample and using the Software CiteSpace, the auth ors try to draw the respondent knowledge m aps according to the principle of scientific metrology, w hich reveal the current developm ent trend of the inform ation science, show the key docu ments as well as the key professionals in the field, and give the relationship am ong each research fields. At last, three frontier topics are given by the maps, that is, information retrieval and technology, Internet inf ormation and information search ing beh avior, citation analysis and term co -occurrence research 1Key words:Information Science co -citation analysis visualizing map CiteSpace

1 引言

现代情报学起源于第二次世界大战之前的文献工作, 申农(Shannon C 1E 1) 的信息论和维纳(Winner N 1) 的控制论为现代情报学的诞生奠定了理论基础, 电子计算机的诞生及发展为情报学奠定了技术基础。1945年, 美国科学家范内瓦#布什(Vannevar Bush) 发表了5诚若所思6一文, 实际上指出了情报学发展的目标和方向:使人类正在增多的知识得到更为充分地利用; 1948年, 布拉德福(Bradford) 发表了5文献工作内容的改进和扩展6一文, 强调了原来的文献工作必须进行变革。这两篇文献的发表象征了文献工作向情报学的历史性转移, 情报学从此真正诞生。对于情报学的范畴, 很多情报学家都有自己的观点, 美国情报学家萨拉赛维克(Saracevic, T 1) 认为, 情报学可分为两大块:第一块包括对文献和文献结构的分析研究、信息传播与科学传播、情报的社会背景、情报利用、情报查询和情报行为等; 第二块就是检索。英格沃森(Peter In gwersen) 提出情报学的核心领域有信息计量学、信息查询、信息检索、信息管理和信息检索系统设计这5个部分[4]。

本文选取情报学顶级学术期刊JASIST (Journal of the Am erican Society for Inform ation Science and Technology, 美国情报会志) 1999年到2008年的论文文献作为研究对象并进行可视化分析, 探求情报学近10年的最新发展情况和趋势, 从而使我们从美国科学情报研究所(ISI) 的科学引文索引(SCI) 数据库获取JASIST (1999年及以前期刊名称为JASIS) 1999年到2008年的文献数据, 选取得到主题论文的题录数据1241条, 引文72596条。本文采用美国德雷塞尔大学陈美超博士开发的信息可视化软件/CiteSpace 0, 形象地演示情报学的前沿及发展趋势。我国情报学研究人员可以更好地了解世界情报学的研究动向, 立足本国的实际, 将中国情报学研究推向前进。在国外, 陈美超博士使用此软件进行过知识与数据工程(Data and Knowledge Engineering, 简称DKE) 等前沿领域的可视化及分析[5]。在国内, 刘泽渊教授带领的科学计量学研究团体也使用CiteSpace 软件揭示了航空航天工程、生态经济学、蛋白质工程和组织行为等学科发展脉络和学科前沿, 取得很好的效果[6][7][8][9]。[3][2][1]

RESEARCH ES I N LIBRARY SCIENCE

2 引文网络图谱的可视化及分析3

CiteSpace 可视化软件共引网络图谱有两种不同的视图方式, 它们是聚类视图和时区视图(time -zone view) 。我们利用CiteSpace 软件, 阙值选择(5, 3, 15) 、(5, 3, 20) 、(5, 3, 20) , 运行得到情报学领域文献共引网络知识图谱的聚类视图(如图1)

图1 情报学文献共引网络图谱

根据陈美超教授的定义, 共引网络图谱的关键点是图谱中连接两个以上不同聚类, 且相对中心度和被引频次较高的节点。这些节点可能成为网络中由一个时间段向另一个时间段过渡的关键点

斯特科(Joh n Scott) 的5社会网络分析法6一书中指出/中心度0

整体中心度测度是计算该点与其他各点之间的捷径距离之和[11][10]。在刘军教授翻译的约翰#(local (centrality) 有/局部中心度0centrality) 和/整体中心度0(global centrality) 之分, 局部中心度测度是以度数为基础的对点中心数的测量, 。因此无论局部中心度还是整体中心度, 其中心度大的点容易成为网络关键点, 相当于链接旧领域和新领域的桥梁, 其在学科发展中具有重要的地位。我们可以看出共引网络图谱有16个关键点。聚类视图可以看出情报学主流研究领域分为3个部分, 它们是信息检索理论与技术、网络查询及行为研究、引文共现理论及应用。具体关键点文献见表1。

211 聚类C 1) )) 信息检索及技术研究聚类

信息检索及技术研究聚类处于整个网络的中心, 左侧与网络信息及信息查询聚类的联系主要由较早时期(深色表示1999年-2003年) 的连线连接; 右侧与引文及词共现分析聚类主要由较晚时期(浅色表示2004年-2008年) 的连线连接。它表示了信息检索理论与技术研究聚类是其他两个聚类的基础。

信息检索理论与技术研究聚类主要关键点有5个, 其中最大的关键点文献是萨尔顿(Salton G) 于1983年所著的5现代信息检索介绍6一书。这本书对现代检索理论和技术进行了详细的介绍, 主要内容包括信息检索的概念、倒排文件、倒排索引、文字起源、索引语言、B -树、相似矩阵、转换语法、矢量图、有限状态自动机、指针结构、相关反馈和/Staran 0数字计算机系统等。在以后的日子里, 这部专著被频频引用, 是一部真正意义上的现代检索理论和技术的奠基之作。1989年, 萨尔顿另一本书5自动文本处理:电脑下的信息转化, 分析和检索6, 对矢量信息检索模型做了进一步的阐述, 并开发了著名的/SMART 0向量模型信息检索系统, 大大促进了信息检索的发展。人们鉴于萨尔顿在信息检索中的巨大贡献, 将信息检索领域最高奖项(萨尔顿奖) 以他的名字命名, 称誉他为现代信息检索的奠基人。

4 图 书 馆 学 研 究 2010(应用版) 13

表1 共引网络图谱的关键点文献情况表作 者关键点文献篇名及年代

真实的生活、用户和需要:对网民查询的研究和分析

(2000)

现代信息检索介绍(1983, 专著)

相关性:情报学概念想法的回顾和框架(1975)

一个大规模超文本网络搜索引擎的剖析(1998)

网上查询接口的浏览和Berrypi cking 技术的设计(1989)

网络查询:公众和他们的询问(2001)

一个超大网络搜索引擎询问日志的分析(1999)

基于隐性语义分析的索引(1990)

自动文本处理:电脑下的信息转化, 分析和检索(1989,

专著)

检索过程之中:基于用户视角的信息查询(1991, 专著)

作为智能组织指标的词与共词(1989)

学科可视化, 一个情报学的共引作者分析, 1972-1995

(1998)

作者同被引科学结构的文献测量方法(1981)

信息检索(1979, 专著) 信息检索的ASK:第一部分背景和理论(1982)

查询的意思:对图书馆信息服务的处理方法(1993) 被引次数[***********][1**********]333中心度[***********][***********][***********]1101110111所属聚类C 2C 1C 1C 3C 2C 2C 2C 3C 1C 2C 3C 3C 3C 1C 1C 2Jansen, BJ 1Sa lton, G Sa racevi c, T 1Brin, S BAT ES, M 1J Spi nk A Si lverstei n, C 1Deerwester, S Sa lton G 1Kuhlthau, C 1C Leydesdorff, L 1Whi te, H 1D 1Whi te, H 1D 1Van -C 1J 1Bel kin, N 1J 1Kuhlthau, C 1C RIJS BE RG EN

检索结果的精准与检索的相关性密切相连, Schamber Eisenbery 和Nilan 曾认为:/相关性是情报学的基础和中心概念0[12]。大量的学者探讨/相关性0的含义, 判断它的影响因素, 例如1958年Vickery B 1C 提出相关概念

(logical relevance) 的概念[14], 1973年W ilson 提出/情境相关0(situational 可以分为/主题相关0(relevance to subject) 和/使用者相关0(user relevance) 的思想[13], 1871年Cooper W 1S 1提出/逻辑相关0

relevance) 的概念[15]。关键点文献萨拉塞维克的5相关性:情报学概念想法的回顾和框架6就是在他们研究的基

[16]础上, 列举了/相关性0的所有可能的层次并做了细致的归纳, 建立了/相关性0理论的框架。此后, Harter 在1992年提出/心理相关0(psychological relevance) 的概念。

C 1聚类中还有两个关键点文献, 其中一个是Van -R IJSBERGEN C 1J 1979年出版的专著5信息检索6, 对概率信息检索概念和模型进行了详细介绍。Van -R IJSBERGEN C 1J 是情报学逻辑学派的重要代表, 在英文停用词研究上成绩斐然, 编制的停用词表应用广泛。1982年, 情报结构学派代表人物贝尔金与人合作发表了5信息检索的ASK:第一部分背景和理论6和5信息检索的ASK:第二部分一项设计性学习的结果6两篇论文, 提出ASK (anomalous states of kn owledge) 假说和设计性学习(th e disign study) , 认为ASK 应该首先考虑使用者所不知的状况, 再呈现出适当的信息[17]。

212 聚类C 2) )) 网络信息及信息查询行为聚类

在2007年5图书情报工作6第10期的/信息检索的新发展0专题论述中, 张新民和武夷山研究员认为从宏观的角度来看, 信息查询(Inform ation Seeking) 和信息检索都是对人类信息行为的研究[18]。此聚类文献绝大部分集中在20世纪90年代, 是新型的研究领域, 它是网络环境下的信息查询行为的研究聚类。这是一个信息检索, , ,

RESEARCH ES I N LIBRARY SCIENCE 5

人们的信息需求越来越多地通过网络来解决, 所以人们的网络查询及信息行为研究也成为情报学的研究热点。

本聚类中最大的关键点文献是扬森(Jansen B J) 、斯宾克(Spink A) 和萨拉塞维克于2000年在Information Processing and Management 发表的论文5真实的生活、用户和需要:对网民查询的研究和分析6。这三人都是近几年进行引擎日志挖掘研究的学者, 此文通过对/Excite 0搜索引擎的日志分析, 得出网络用户在检索词使用、选取搜索结果、信息回馈等信息查询行为方面都有自己的特点。斯宾克等的5网络查询:公众和他们的询问6与希尔维斯通(Silverstein C) 等的5一个超大网络搜索引擎询问日志的分析6都是对网络信息查询领域的实证研究。网络信息复杂的今天, 探求信息用户的网络信息查询行为的研究是很有实际价值的。

其他的3个关键点文献是贝茨(BATES, M 1J) 1989年发表的5网上查询接口的浏览和Berrypicking 技术的设计6一文, 在此文中贝茨提出浏览也是信息查询的一种行为方式, 从而扩大了人们对信息查询的理解, 她还提出/berrypicking 0信息查询模型。关于信息搜索模型, 库尔梭(Kuhlth au, C 1C) 在1991年出版的5检索过程之中:基于用户视角的信息查询6一书中提出基于用户视角来看信息搜索, 并基于用户信息寻求情况的五项研究, 建立了信息查询过程模型, 将信息查询过程分为开始(initiation) 、选择(selection) 、探索(exploration) 、成型(f orm ulation ) 、收集(collection) 和呈现(presentation ) 六大阶段。接着她1993年又发表了5查询的意义:对图书馆信息服务的处理方法6一文, 对信息搜索过程进一步阐述, 认为信息搜索过程还伴随着个人的情感、认知、行为与学习。

213 聚类C 3) )) 引文及词共现分析聚类

引文分析是情报学领域常见的分析方法。1955年加菲尔德(Eugene Garfield) 在5科学6上发表的5科学引文索引:文献学贯穿观念联系的一个新维度6一文提出借助图书期刊论文之间的引用文献所构成的联系来作为检索科学情报的新方法, 开创了引文分析的先河[19]。1973年, 著名计量学家亨利#斯莫尔(Henry Small) 发展了引文分析, 提出了有名的共被引(co -citation) 理论和共被引分析方法[20]。1986年法国计量学家M 1Callon 、J 1Law 和A 1Rip 又提出了词共现分析方法[21]。近年来引文分析的研究热点主要集中在引文可视化分析和网络引文分析上。

聚类C 3中最大的关键点文献是Google 创始人布林(Brin , S) 和佩奇(Page, L) 于1998年发表的5一个大规模超文本网络搜索引擎的剖析6一文, 介绍了Google 的搜索原理, 成为现代计算机搜索引擎领域人员必读的经典之作。此文和引文分析的文献出现在同一聚类中, 是因为此文介绍的Google 搜索引擎排序算法/PageR ank 0类似于文献之间的引文分析。PageR ank 根据网站的内外部链接的数量和质量来衡量网站的价值, 与引文分析中用引文多少来确定论文价值的思想相仿, 即一篇文章被他人引用的次数越多, 这篇论文的权威性就越高。

此外中心度排在第二的关键点文献是Deerwester S 等人1990年发表的5基于潜在语义分析的索引6一文, Deerwester S 提出/潜在语义分析0(latent semantic analysis) 的信息检索方法, 其基本思想是文本中的词与词之间存在某种联系, 即存在某种潜在的语义结构, 而词语之间的这种语义结构体现为它们在文本中的出现频率也具有一定的联系, 通过统计学方法, 提取并量化这些潜在的语义结构, 进而消除同义词、多义词的影响, 提高文本表示的准确性[22]。此后大量的学者和科学家为了发挥/潜在语义分析0的优越性, 提出了各种语义空间模型的算法并用于实践之中。

聚类C 3的其他3个关键点文献, 都是关于词共现或共被引方面的文章, 荷兰的科学计量学家雷蒂斯托夫(L eydesdorff, L 1) 的5作为智能组织指标的词与共词6一文, 强调词与词的共现分析也可以作为智能组织描述的一个工具来使用, 他的观点现在得到很广泛的认同和实践, 人们往往用词共现来分析某一学科的内部学科结构。怀特是美国科学计量学家, 他善于从引文的角度来揭示学科的发展, 并将其学科发展通过一定的方法和计算机软件表示出来。1981年怀特与格利菲斯(Griffith B C) 合作发表了5作者同被引科学结构的文献测量方法6一文, 通过对世界39位情报科学家的共被引分析, 利用多维尺度分析方法绘制了情报学知识图谱, 将情报学划为5大分支研究领域, 即科学交流(com munication in science and tech nology) 、文献计量(Bibliom etrics) 、一般理论(intergrative th eory) 、自动化信息检索(autom ated in form ation retrieval) 和齐夫(Zipf, G 1K 1) 、申农组成的早期先驱团体(precursors) 。1998年怀特又与麦肯合作发表了5学科可视化, 一个情报学的共引作者分析, 1972-19956一文, 以1972至1995年间发文被引率最高的前120位作者为样本进行同被引分析, 发现情报学有了两个相对集中的研究领域, 即试验检索(experim ental retrieval) 和引文分析(citation analysis) , 前者关注文献检索,

6 图 书 馆 学 研 究 2010(应用版) 13

3 结论

以美国JASIST 期刊1999年到2008年的数据为基础, 利用陈美超博士开发的信息可视化工具CiteSpace 绘制出情报学的文献共引网络图谱, 显示出3个共引聚类:信息检索及技术研究聚类; 网络信息及信息查询行为聚类; 引文及词共现分析聚类。这是情报学的3个比较大的研究领域, 也是情报学体系的主要框架。情报学的未来将是这三大领域的继续扩展和深化。信息检索早在50年代就开始了, 在信息检索理论指导之下, 正向更深的领域发展, 如智能化信息检索系统、多语种信息检索系统和图像视频信息检索系统等。网络信息及信息查询行为研究的主要内容是人们网络信息查询中的行为研究, 其中的用户模式研究和用户需求评价体系研究将成为近来新的研究热点。至于引文共现研究领域, 基于引文和共现理论的信息可视化、网络分析法和h -指数等将成为新的研究热点。

关于情报学前沿和趋势分析还需要进一步的分析和总结, 本文只选取单一的JASIST 一种期刊, 数据来源有其局限性。任何一门学科都有相关学科, 只把握一门学科而不研究其相关学科的研究本身就是不全面的。所以有待其他研究者在相关学科的基础上, 使用情报学多种期刊数据对情报学的前沿和趋势进行进一步的研究。

注释

[1]B ush V 1As we ma y think 1http:P P ww w 1w 31org P History P 1945P Vbush P vbush -a ll 1sh tml , 2009-07-15

[2][3]周晓英, 崔佳佳, 唐宇萍等1情报学的起源与方向) ) ) 从布什的5诚如所思6谈起1情报科学, 2004(2) :129-132

[4]Sara cevic T 1Informa tion sc ience 1Journa l of the America n Society for Information Science, 1999(12) :1051-1063

[5]Ingw ersen P 1Informa tion and informa tion science 1In Kent A 1Ency clopedia of LIS 1NY:M a rcel Dekker, 1995:137-177

[6]Ch en C 1, Song I Y 1, Yu a n X J 1, e t al 1The them atic and cita tion landscape of data a n d know ledge engin eering (1985-2007) 1D ata and

Kno wledge Engin eering, 2008(2) :234-259

[7]梁永霞, 杨中楷, 刘则渊1基于Ci teSpa ce Ò的航空航天工程前沿研究1科学学研究, 2008(S 2) :304-312

[8]刘则渊, 王贤文1生态经济学研究前沿及其演进的可视化分析1西南林学院学报, 2008(4) :4-11

[9]栾春娟, 侯海燕1基于SCI 的蛋白质工程国际前沿技术分析1全球科技经济瞭望, 2008(10) :46-50

[10]Hirsch J E 1An i ndex to qua ntify a n individua ls scientific re -sea rc h output 1PNAS of the USA, 2005, 102(46) :16569-16572

[11]陈超美, 陈悦, 侯剑华等1CiteSpace Ò:科学文献中新趋势与新动态的识别与可视化1情报学报, 2009(3) :401-421

[12]刘军1社会网络分析1北京:社会科学文献出版社, 2004:68-77

[13]Scha mber L, Eisenberg M B , Nila n M S 1A rE -exa mina tion of releva nce:Towa rd a dyna mic, situa tional defini tion 1Information

Processi ng &M ana gement, 1990, 26(6) :755-775

[14]Vickery B C 1Subj ect a nal ysi s for informa tion retri eval 1Interna tional Conference on Scienti fic Informa tion 1Wa sh i ngton, DC 1USA,

Na tiona l Aca demies Press, 1958:855-866

[15]Cooper W S 1A defini tion of releva nce for information retrieva l 1Informa tion Stora ge a nd Retrieva , 1971(1) :19-37

[16]Wilson P 1Situa tiona l releva nce 1Informa tion Stora ge a nd Retrieva l, 1973(9) :457-471

[17]Stephen P H 1Psychologica l relevance a nd informati on science 1Journa l of the America n Society for Informa tion Science, 1992(9) :

602-615

[18]Belkin N J, Oddy R N, Brooks H M 1Ask for informati on retrieva l:pa rt II Results of a design study 1Journa l of Documentation, 1982

(3) :145-164

[19]张新民, 武夷山1编者的话1图书情报工作, 2007(10) :5

[20]Ga rfield E 1Citation i ndexes for sci ence:a new dimensi on in documenta tion through associa tion of idea s 1Science, 1955(3159) :

108-11

[21]刘则渊, 陈悦, 侯海燕等1科学知识图谱:方法与应用1北京:人民出版社, 2008:16-17

[22]Ca ll on M , La w J, Rip A 1M a ppi ng th e Dyna mics of Sc ience a nd Tec h nology:Sociology of Science i n the R ea l World 1London:

M a cmilla n, 1986:142-162

李金建 贡金涛 河南工业职业技术学院图书馆。

2 图 书 馆 学 研 究 2010(应用版) 13

基于JA SIST 的情报学研究前沿及趋势分析李金建 贡金涛

=摘 要>选择情报学著名期刊Journal of the American Societ y f or Information Science and T echnology (5美国情报会志6) 1999) 2008年发表的全部1241篇文献题录作为数据样本, 根据科学计量学原理, 用Cit eSpace 软件绘制出相应的知识图谱, 揭示了学科发展的趋势, 发现了情报学研究领域的关键文献和关键人物, 展现了情报学研究领域的知识结构关系。分析图谱得出了3个研究前沿:信息检索及技术研究; 网络信息及信息查询行为; 引文及词共现分析研究。

=关键词>情报学 共引分析 可视化图谱 Cit eSpace

Abstract:Choosing the total 1241articles published during 1999-2008in Journal of the American Society for Inform ation and Tech nology, a famous journal in the field of Information Science as the data sample and using the Software CiteSpace, the auth ors try to draw the respondent knowledge m aps according to the principle of scientific metrology, w hich reveal the current developm ent trend of the inform ation science, show the key docu ments as well as the key professionals in the field, and give the relationship am ong each research fields. At last, three frontier topics are given by the maps, that is, information retrieval and technology, Internet inf ormation and information search ing beh avior, citation analysis and term co -occurrence research 1Key words:Information Science co -citation analysis visualizing map CiteSpace

1 引言

现代情报学起源于第二次世界大战之前的文献工作, 申农(Shannon C 1E 1) 的信息论和维纳(Winner N 1) 的控制论为现代情报学的诞生奠定了理论基础, 电子计算机的诞生及发展为情报学奠定了技术基础。1945年, 美国科学家范内瓦#布什(Vannevar Bush) 发表了5诚若所思6一文, 实际上指出了情报学发展的目标和方向:使人类正在增多的知识得到更为充分地利用; 1948年, 布拉德福(Bradford) 发表了5文献工作内容的改进和扩展6一文, 强调了原来的文献工作必须进行变革。这两篇文献的发表象征了文献工作向情报学的历史性转移, 情报学从此真正诞生。对于情报学的范畴, 很多情报学家都有自己的观点, 美国情报学家萨拉赛维克(Saracevic, T 1) 认为, 情报学可分为两大块:第一块包括对文献和文献结构的分析研究、信息传播与科学传播、情报的社会背景、情报利用、情报查询和情报行为等; 第二块就是检索。英格沃森(Peter In gwersen) 提出情报学的核心领域有信息计量学、信息查询、信息检索、信息管理和信息检索系统设计这5个部分[4]。

本文选取情报学顶级学术期刊JASIST (Journal of the Am erican Society for Inform ation Science and Technology, 美国情报会志) 1999年到2008年的论文文献作为研究对象并进行可视化分析, 探求情报学近10年的最新发展情况和趋势, 从而使我们从美国科学情报研究所(ISI) 的科学引文索引(SCI) 数据库获取JASIST (1999年及以前期刊名称为JASIS) 1999年到2008年的文献数据, 选取得到主题论文的题录数据1241条, 引文72596条。本文采用美国德雷塞尔大学陈美超博士开发的信息可视化软件/CiteSpace 0, 形象地演示情报学的前沿及发展趋势。我国情报学研究人员可以更好地了解世界情报学的研究动向, 立足本国的实际, 将中国情报学研究推向前进。在国外, 陈美超博士使用此软件进行过知识与数据工程(Data and Knowledge Engineering, 简称DKE) 等前沿领域的可视化及分析[5]。在国内, 刘泽渊教授带领的科学计量学研究团体也使用CiteSpace 软件揭示了航空航天工程、生态经济学、蛋白质工程和组织行为等学科发展脉络和学科前沿, 取得很好的效果[6][7][8][9]。[3][2][1]

RESEARCH ES I N LIBRARY SCIENCE

2 引文网络图谱的可视化及分析3

CiteSpace 可视化软件共引网络图谱有两种不同的视图方式, 它们是聚类视图和时区视图(time -zone view) 。我们利用CiteSpace 软件, 阙值选择(5, 3, 15) 、(5, 3, 20) 、(5, 3, 20) , 运行得到情报学领域文献共引网络知识图谱的聚类视图(如图1)

图1 情报学文献共引网络图谱

根据陈美超教授的定义, 共引网络图谱的关键点是图谱中连接两个以上不同聚类, 且相对中心度和被引频次较高的节点。这些节点可能成为网络中由一个时间段向另一个时间段过渡的关键点

斯特科(Joh n Scott) 的5社会网络分析法6一书中指出/中心度0

整体中心度测度是计算该点与其他各点之间的捷径距离之和[11][10]。在刘军教授翻译的约翰#(local (centrality) 有/局部中心度0centrality) 和/整体中心度0(global centrality) 之分, 局部中心度测度是以度数为基础的对点中心数的测量, 。因此无论局部中心度还是整体中心度, 其中心度大的点容易成为网络关键点, 相当于链接旧领域和新领域的桥梁, 其在学科发展中具有重要的地位。我们可以看出共引网络图谱有16个关键点。聚类视图可以看出情报学主流研究领域分为3个部分, 它们是信息检索理论与技术、网络查询及行为研究、引文共现理论及应用。具体关键点文献见表1。

211 聚类C 1) )) 信息检索及技术研究聚类

信息检索及技术研究聚类处于整个网络的中心, 左侧与网络信息及信息查询聚类的联系主要由较早时期(深色表示1999年-2003年) 的连线连接; 右侧与引文及词共现分析聚类主要由较晚时期(浅色表示2004年-2008年) 的连线连接。它表示了信息检索理论与技术研究聚类是其他两个聚类的基础。

信息检索理论与技术研究聚类主要关键点有5个, 其中最大的关键点文献是萨尔顿(Salton G) 于1983年所著的5现代信息检索介绍6一书。这本书对现代检索理论和技术进行了详细的介绍, 主要内容包括信息检索的概念、倒排文件、倒排索引、文字起源、索引语言、B -树、相似矩阵、转换语法、矢量图、有限状态自动机、指针结构、相关反馈和/Staran 0数字计算机系统等。在以后的日子里, 这部专著被频频引用, 是一部真正意义上的现代检索理论和技术的奠基之作。1989年, 萨尔顿另一本书5自动文本处理:电脑下的信息转化, 分析和检索6, 对矢量信息检索模型做了进一步的阐述, 并开发了著名的/SMART 0向量模型信息检索系统, 大大促进了信息检索的发展。人们鉴于萨尔顿在信息检索中的巨大贡献, 将信息检索领域最高奖项(萨尔顿奖) 以他的名字命名, 称誉他为现代信息检索的奠基人。

4 图 书 馆 学 研 究 2010(应用版) 13

表1 共引网络图谱的关键点文献情况表作 者关键点文献篇名及年代

真实的生活、用户和需要:对网民查询的研究和分析

(2000)

现代信息检索介绍(1983, 专著)

相关性:情报学概念想法的回顾和框架(1975)

一个大规模超文本网络搜索引擎的剖析(1998)

网上查询接口的浏览和Berrypi cking 技术的设计(1989)

网络查询:公众和他们的询问(2001)

一个超大网络搜索引擎询问日志的分析(1999)

基于隐性语义分析的索引(1990)

自动文本处理:电脑下的信息转化, 分析和检索(1989,

专著)

检索过程之中:基于用户视角的信息查询(1991, 专著)

作为智能组织指标的词与共词(1989)

学科可视化, 一个情报学的共引作者分析, 1972-1995

(1998)

作者同被引科学结构的文献测量方法(1981)

信息检索(1979, 专著) 信息检索的ASK:第一部分背景和理论(1982)

查询的意思:对图书馆信息服务的处理方法(1993) 被引次数[***********][1**********]333中心度[***********][***********][***********]1101110111所属聚类C 2C 1C 1C 3C 2C 2C 2C 3C 1C 2C 3C 3C 3C 1C 1C 2Jansen, BJ 1Sa lton, G Sa racevi c, T 1Brin, S BAT ES, M 1J Spi nk A Si lverstei n, C 1Deerwester, S Sa lton G 1Kuhlthau, C 1C Leydesdorff, L 1Whi te, H 1D 1Whi te, H 1D 1Van -C 1J 1Bel kin, N 1J 1Kuhlthau, C 1C RIJS BE RG EN

检索结果的精准与检索的相关性密切相连, Schamber Eisenbery 和Nilan 曾认为:/相关性是情报学的基础和中心概念0[12]。大量的学者探讨/相关性0的含义, 判断它的影响因素, 例如1958年Vickery B 1C 提出相关概念

(logical relevance) 的概念[14], 1973年W ilson 提出/情境相关0(situational 可以分为/主题相关0(relevance to subject) 和/使用者相关0(user relevance) 的思想[13], 1871年Cooper W 1S 1提出/逻辑相关0

relevance) 的概念[15]。关键点文献萨拉塞维克的5相关性:情报学概念想法的回顾和框架6就是在他们研究的基

[16]础上, 列举了/相关性0的所有可能的层次并做了细致的归纳, 建立了/相关性0理论的框架。此后, Harter 在1992年提出/心理相关0(psychological relevance) 的概念。

C 1聚类中还有两个关键点文献, 其中一个是Van -R IJSBERGEN C 1J 1979年出版的专著5信息检索6, 对概率信息检索概念和模型进行了详细介绍。Van -R IJSBERGEN C 1J 是情报学逻辑学派的重要代表, 在英文停用词研究上成绩斐然, 编制的停用词表应用广泛。1982年, 情报结构学派代表人物贝尔金与人合作发表了5信息检索的ASK:第一部分背景和理论6和5信息检索的ASK:第二部分一项设计性学习的结果6两篇论文, 提出ASK (anomalous states of kn owledge) 假说和设计性学习(th e disign study) , 认为ASK 应该首先考虑使用者所不知的状况, 再呈现出适当的信息[17]。

212 聚类C 2) )) 网络信息及信息查询行为聚类

在2007年5图书情报工作6第10期的/信息检索的新发展0专题论述中, 张新民和武夷山研究员认为从宏观的角度来看, 信息查询(Inform ation Seeking) 和信息检索都是对人类信息行为的研究[18]。此聚类文献绝大部分集中在20世纪90年代, 是新型的研究领域, 它是网络环境下的信息查询行为的研究聚类。这是一个信息检索, , ,

RESEARCH ES I N LIBRARY SCIENCE 5

人们的信息需求越来越多地通过网络来解决, 所以人们的网络查询及信息行为研究也成为情报学的研究热点。

本聚类中最大的关键点文献是扬森(Jansen B J) 、斯宾克(Spink A) 和萨拉塞维克于2000年在Information Processing and Management 发表的论文5真实的生活、用户和需要:对网民查询的研究和分析6。这三人都是近几年进行引擎日志挖掘研究的学者, 此文通过对/Excite 0搜索引擎的日志分析, 得出网络用户在检索词使用、选取搜索结果、信息回馈等信息查询行为方面都有自己的特点。斯宾克等的5网络查询:公众和他们的询问6与希尔维斯通(Silverstein C) 等的5一个超大网络搜索引擎询问日志的分析6都是对网络信息查询领域的实证研究。网络信息复杂的今天, 探求信息用户的网络信息查询行为的研究是很有实际价值的。

其他的3个关键点文献是贝茨(BATES, M 1J) 1989年发表的5网上查询接口的浏览和Berrypicking 技术的设计6一文, 在此文中贝茨提出浏览也是信息查询的一种行为方式, 从而扩大了人们对信息查询的理解, 她还提出/berrypicking 0信息查询模型。关于信息搜索模型, 库尔梭(Kuhlth au, C 1C) 在1991年出版的5检索过程之中:基于用户视角的信息查询6一书中提出基于用户视角来看信息搜索, 并基于用户信息寻求情况的五项研究, 建立了信息查询过程模型, 将信息查询过程分为开始(initiation) 、选择(selection) 、探索(exploration) 、成型(f orm ulation ) 、收集(collection) 和呈现(presentation ) 六大阶段。接着她1993年又发表了5查询的意义:对图书馆信息服务的处理方法6一文, 对信息搜索过程进一步阐述, 认为信息搜索过程还伴随着个人的情感、认知、行为与学习。

213 聚类C 3) )) 引文及词共现分析聚类

引文分析是情报学领域常见的分析方法。1955年加菲尔德(Eugene Garfield) 在5科学6上发表的5科学引文索引:文献学贯穿观念联系的一个新维度6一文提出借助图书期刊论文之间的引用文献所构成的联系来作为检索科学情报的新方法, 开创了引文分析的先河[19]。1973年, 著名计量学家亨利#斯莫尔(Henry Small) 发展了引文分析, 提出了有名的共被引(co -citation) 理论和共被引分析方法[20]。1986年法国计量学家M 1Callon 、J 1Law 和A 1Rip 又提出了词共现分析方法[21]。近年来引文分析的研究热点主要集中在引文可视化分析和网络引文分析上。

聚类C 3中最大的关键点文献是Google 创始人布林(Brin , S) 和佩奇(Page, L) 于1998年发表的5一个大规模超文本网络搜索引擎的剖析6一文, 介绍了Google 的搜索原理, 成为现代计算机搜索引擎领域人员必读的经典之作。此文和引文分析的文献出现在同一聚类中, 是因为此文介绍的Google 搜索引擎排序算法/PageR ank 0类似于文献之间的引文分析。PageR ank 根据网站的内外部链接的数量和质量来衡量网站的价值, 与引文分析中用引文多少来确定论文价值的思想相仿, 即一篇文章被他人引用的次数越多, 这篇论文的权威性就越高。

此外中心度排在第二的关键点文献是Deerwester S 等人1990年发表的5基于潜在语义分析的索引6一文, Deerwester S 提出/潜在语义分析0(latent semantic analysis) 的信息检索方法, 其基本思想是文本中的词与词之间存在某种联系, 即存在某种潜在的语义结构, 而词语之间的这种语义结构体现为它们在文本中的出现频率也具有一定的联系, 通过统计学方法, 提取并量化这些潜在的语义结构, 进而消除同义词、多义词的影响, 提高文本表示的准确性[22]。此后大量的学者和科学家为了发挥/潜在语义分析0的优越性, 提出了各种语义空间模型的算法并用于实践之中。

聚类C 3的其他3个关键点文献, 都是关于词共现或共被引方面的文章, 荷兰的科学计量学家雷蒂斯托夫(L eydesdorff, L 1) 的5作为智能组织指标的词与共词6一文, 强调词与词的共现分析也可以作为智能组织描述的一个工具来使用, 他的观点现在得到很广泛的认同和实践, 人们往往用词共现来分析某一学科的内部学科结构。怀特是美国科学计量学家, 他善于从引文的角度来揭示学科的发展, 并将其学科发展通过一定的方法和计算机软件表示出来。1981年怀特与格利菲斯(Griffith B C) 合作发表了5作者同被引科学结构的文献测量方法6一文, 通过对世界39位情报科学家的共被引分析, 利用多维尺度分析方法绘制了情报学知识图谱, 将情报学划为5大分支研究领域, 即科学交流(com munication in science and tech nology) 、文献计量(Bibliom etrics) 、一般理论(intergrative th eory) 、自动化信息检索(autom ated in form ation retrieval) 和齐夫(Zipf, G 1K 1) 、申农组成的早期先驱团体(precursors) 。1998年怀特又与麦肯合作发表了5学科可视化, 一个情报学的共引作者分析, 1972-19956一文, 以1972至1995年间发文被引率最高的前120位作者为样本进行同被引分析, 发现情报学有了两个相对集中的研究领域, 即试验检索(experim ental retrieval) 和引文分析(citation analysis) , 前者关注文献检索,

6 图 书 馆 学 研 究 2010(应用版) 13

3 结论

以美国JASIST 期刊1999年到2008年的数据为基础, 利用陈美超博士开发的信息可视化工具CiteSpace 绘制出情报学的文献共引网络图谱, 显示出3个共引聚类:信息检索及技术研究聚类; 网络信息及信息查询行为聚类; 引文及词共现分析聚类。这是情报学的3个比较大的研究领域, 也是情报学体系的主要框架。情报学的未来将是这三大领域的继续扩展和深化。信息检索早在50年代就开始了, 在信息检索理论指导之下, 正向更深的领域发展, 如智能化信息检索系统、多语种信息检索系统和图像视频信息检索系统等。网络信息及信息查询行为研究的主要内容是人们网络信息查询中的行为研究, 其中的用户模式研究和用户需求评价体系研究将成为近来新的研究热点。至于引文共现研究领域, 基于引文和共现理论的信息可视化、网络分析法和h -指数等将成为新的研究热点。

关于情报学前沿和趋势分析还需要进一步的分析和总结, 本文只选取单一的JASIST 一种期刊, 数据来源有其局限性。任何一门学科都有相关学科, 只把握一门学科而不研究其相关学科的研究本身就是不全面的。所以有待其他研究者在相关学科的基础上, 使用情报学多种期刊数据对情报学的前沿和趋势进行进一步的研究。

注释

[1]B ush V 1As we ma y think 1http:P P ww w 1w 31org P History P 1945P Vbush P vbush -a ll 1sh tml , 2009-07-15

[2][3]周晓英, 崔佳佳, 唐宇萍等1情报学的起源与方向) ) ) 从布什的5诚如所思6谈起1情报科学, 2004(2) :129-132

[4]Sara cevic T 1Informa tion sc ience 1Journa l of the America n Society for Information Science, 1999(12) :1051-1063

[5]Ingw ersen P 1Informa tion and informa tion science 1In Kent A 1Ency clopedia of LIS 1NY:M a rcel Dekker, 1995:137-177

[6]Ch en C 1, Song I Y 1, Yu a n X J 1, e t al 1The them atic and cita tion landscape of data a n d know ledge engin eering (1985-2007) 1D ata and

Kno wledge Engin eering, 2008(2) :234-259

[7]梁永霞, 杨中楷, 刘则渊1基于Ci teSpa ce Ò的航空航天工程前沿研究1科学学研究, 2008(S 2) :304-312

[8]刘则渊, 王贤文1生态经济学研究前沿及其演进的可视化分析1西南林学院学报, 2008(4) :4-11

[9]栾春娟, 侯海燕1基于SCI 的蛋白质工程国际前沿技术分析1全球科技经济瞭望, 2008(10) :46-50

[10]Hirsch J E 1An i ndex to qua ntify a n individua ls scientific re -sea rc h output 1PNAS of the USA, 2005, 102(46) :16569-16572

[11]陈超美, 陈悦, 侯剑华等1CiteSpace Ò:科学文献中新趋势与新动态的识别与可视化1情报学报, 2009(3) :401-421

[12]刘军1社会网络分析1北京:社会科学文献出版社, 2004:68-77

[13]Scha mber L, Eisenberg M B , Nila n M S 1A rE -exa mina tion of releva nce:Towa rd a dyna mic, situa tional defini tion 1Information

Processi ng &M ana gement, 1990, 26(6) :755-775

[14]Vickery B C 1Subj ect a nal ysi s for informa tion retri eval 1Interna tional Conference on Scienti fic Informa tion 1Wa sh i ngton, DC 1USA,

Na tiona l Aca demies Press, 1958:855-866

[15]Cooper W S 1A defini tion of releva nce for information retrieva l 1Informa tion Stora ge a nd Retrieva , 1971(1) :19-37

[16]Wilson P 1Situa tiona l releva nce 1Informa tion Stora ge a nd Retrieva l, 1973(9) :457-471

[17]Stephen P H 1Psychologica l relevance a nd informati on science 1Journa l of the America n Society for Informa tion Science, 1992(9) :

602-615

[18]Belkin N J, Oddy R N, Brooks H M 1Ask for informati on retrieva l:pa rt II Results of a design study 1Journa l of Documentation, 1982

(3) :145-164

[19]张新民, 武夷山1编者的话1图书情报工作, 2007(10) :5

[20]Ga rfield E 1Citation i ndexes for sci ence:a new dimensi on in documenta tion through associa tion of idea s 1Science, 1955(3159) :

108-11

[21]刘则渊, 陈悦, 侯海燕等1科学知识图谱:方法与应用1北京:人民出版社, 2008:16-17

[22]Ca ll on M , La w J, Rip A 1M a ppi ng th e Dyna mics of Sc ience a nd Tec h nology:Sociology of Science i n the R ea l World 1London:

M a cmilla n, 1986:142-162

李金建 贡金涛 河南工业职业技术学院图书馆。


相关内容

  • 努力打造陕西装备制造业基地
  • 摘 要: 为适应装备制造业企业和中小企业对信息的新需求,我们搭建了陕西省装备制造业为主的主导产业科技情报服务平台,作为行业知识服务平台建设的尝试.以解决用户问题为根本出发点,按照用户信息行为的规律组织业务流程,运用先进的知识发现.组织.挖掘等技术,通过共享和协同机制,对信息和知识进行提取.整合,实现 ...

  • 信息用户检索决策中的心智模型分析
  • ISSN1000-0135 第29卷第4期641-651,2010年8月 情报学报 JOURNALOFTHECHINASOCIETYFORSCIENTIFICANDTECHNICALINFORMATIONISSN1000-0135doi:10.3772桙j.issn.1000-0135.2010.0 ...

  • 国内知识图谱研究的可视化分析
  • 国内知识图谱研究的可视化分析 魏瑞斌 安徽财经大学管理科学与工程学院 蚌埠233030 摘要 对国内知识图谱期刊论文的外部特征和内容特征进行可视化分析.研究表明:国内知识图谱研究处于起步阶段,研究人员和机构相对集中,研究论文的合著率较高,研究主题鲜明.今后的研究需要加强学科间的合作,加强基础理论研究 ...

  • 国际人力资源管理研究热点和前沿的可视化分析
  • 2010年第10期 科技管理研究 Science and Technology Management Research 2010No. 10 文章编号:1000-7695(2010)10-0113-03 国际人力资源管理研究热点和前沿的可视化分析 房宏君,刘凤霞 (北京联合大学生物化学工程学院,北京 ...

  • 汤森路透[2015研究前沿]全球首发,中国领跑化学领域!
  • 海归学者发起的公益学术平台 分享信息,整合资源 交流学术,偶尔风月 <2015研究前沿>报告继承了<2014研究前沿>的分析方法,从近五年文献聚类分析形成的10839个研究前沿中鉴别出100个热点前沿,并遴选出最近两年发展迅速的49个新兴前沿,分析其国家和机构布局,进而展示当 ...

  • 基于随机前沿分析的医学科研效率研究论文
  • 生堡堕堂登堑篁里盘查!!!!至!旦箜!!鲞笙!塑垦!堕!坚塑曼生墨塑坚!!!壁!垒!g::!!!!∑!!:!!!塑!:! ・7b- 研讨・ 基于随机前沿分析的医学科研效率研究 钟华 李海存倪萍安新颖 [摘要]本文应用随机前沿分析方法对医学科研机构的科研效率进行评价.首先在分析医学科研效率影响因素的基 ...

  • 基于CiteSpace研究科学知识图谱的可视化分析_肖明
  • >> 第55卷第6期 2011年3月 基于C i t e S p a c e 研究科学知识图谱的可视化分析 肖 明 陈嘉勇 李国俊 北京师范大学管理学院 北京100875 [摘要]运用C i t e S p a c e 软件绘制2007-2010年间以"Ci t e S p a ...

  • 多源信息融合数字模型
  • 科技前沿与学术评论 多源信息融合数字模型 研究员.博导 岳天祥研究员.博导 刘纪远 (中国科学院地理学与资源研究所, 北京100101) 摘 要:研究结果表明,在目前基础条件下,多源信息融合数字模型的实现需要解决现行数字地面模型和空间插值模型的误差问题.点-面信息有效融合问题.多尺度转换问题和多维G ...

  • 对我国情报学教育现状与发展的回顾及反思
  • 图书情报工作 第52卷第5期 2008年5月 ・工作研究・ 对我国情报学教育现状与发展的回顾及反思 李 颖 樊振佳 南开大学商学院 天津 300071 张丽丽 北京大学信息管理系 北京 100871 [摘要]对我国情报学教育定位的4种主要观点及情报学教育的本科.硕士.博士三级培养层次等现状进行分析, ...