信息存储与检索

第一章

1.信息的涵义:

申农(信息论创始人):用于消除随机不确定性的东西(信源、信宿)

广义信息是物质、能量存在和运动状态的表征.

狭义信息是人类社会共享的一切知识、学问以及从客观现象中提炼出来的各种消息的总和,即现代信息

2.资源的涵义

资源是一切被人类开发和利用的客观存在。

3.信息资源的涵义

狭义指文献资源或数据资源,抑或各种媒介和形式的信息的集合,包括文字、声像、印刷品、电子信息、数据库等。这都是限于信息的本身。

广义信息资源是信息活动中各种要素的总称。这既包含了信息本身,也包括了与信息相关的人员、设备、技术和资金等各种资源

(1)原始数据与信息的区别

原始数据经过加工处理变为信息

(2)信息与信息资源的区别

经过加工、可被利用的信息称为信息资源。 information resource为复数时,常指信息及与信息有关的设备、人员等集合,是经过人类选取、组织、序化的有用信息的集合。

(1)信息资源是信息的集体;

(2)信息资源是经过人类选择、获取的有用信息的集合;

(3)信息资源是经过人类组织序化的信息的集合。

4.信息的基本性质

(1)信息是内容是客观的(2)信息的形式是主观的(3)信息是一切物质的基本属性

5.与信息有关的概念

(1)知识。

是对客观事物规律性认识,是系统化和精炼化的信息

知识的三种存在方式:大脑、实物、文献

知识的七个特征:①不可替代性 ②不可相加性 ③不可逆性 ④不可磨损性⑤不可分性⑥可共享性⑦无限增值性

知识分类:①事实知识(Know What)②原理知识( Know why)③技能知识( Know how)④人力知识( Know who)⑤时间知识( Know When)⑥空间知识( Know Where)⑦数量知识( Know Quantity )

(2)文献。是记录知识的一切载体,即用文字、图形、符号、或声视频等记录方式在一定介质上所生成的物质成果

文献的三要素:记录、知识、载体

文献的功能:①存储功能 ②传递功能 ③认识功能

(3)情报。指为一定目的而搜集和传递的有特定效用的知识

情报的基本属性:传递性、效用性

6.信息资源的基本特征

(1)普遍性(2)传递性(3)时效性(4)价值性(5)可转换性(6)可利用性

(7)可共享性

7.按性质划分

(1)自然信息资源(2)社会信息资源

按信息包含范围划分

(1)广义信息资源(2)狭义信息资源

按信息资源的载体

(1)印刷型信息资源(2)微缩型信息资源(3)声像性信息资源(4)电子型信

息资源

按内容

(1)文献型信息资源(2)数据型信息资源(3)多媒体信息资源

按保密程度

(1)公开性信息资源(2)半公开性信息资源(3)非公开性信息资源

按表现形式

(1)文字性信息(2)图像性信息(3)数值数据性信息(4)语音性信息

按信息资源的加工程度

(1)一次信息(2)二次信息(3)三次信息

按传输方式

(1)网络信息资源(2)非网络信息资源

按数据资源信息的生产途径和发布范围分

(1)商用电子资源(2)网络公开学术资源(3)特色信息资源

8.信息素质教育

信息素质教育:

是从各种信息资源中检索、评价使用信息的能力。是培养信息意识的一条重要的

途径。

9.电子信息资源含义与特点

(1)、存储形式多样化,文本、超文本、多媒体、超媒体(2)、资源数字化(3)、

交流程度高(4)、提高利用率(5)、内容丰富(6)、载体容量大

10.网络信息资源的类型

按照网络传输协议不同分

(1)Web信息资源:通过HTTP在网上传输

(2)Telnet信息资源:基于网络通讯协议

(3)FTP信息资源:通过FTP协议可完成完整的文件拷贝

(4)用户服务组信息资源:由一组对某一特定主题有共同兴趣的网络用户组成

的电子论坛。

(5)Gopher信息资源:Gopher是一种基于菜单的网络服务,允许用户以一种简

单的、一致的方式快速找到并访问所需的网络资源。

按信息传播交流过程分

(1)稳定的电子信息资源 (2)不稳定的电子信息资源

按网络信息资源的表现形式分

(1)电子图书型(2)电子期刊型 (3)电子报纸型

(4)联机系统与联机数据库(5)数字图书馆

按照存取方式分

(1)邮件型(2)电话型(3)揭示板型(4)广播型

(5)图书馆型(6)书目型(7)交互型

按电子数据库内容分

(1) 参考数据库(2) 源数据库 (3)混合型数据库

(1)参考数据库指导用户到另一个信息源中获取原文或其他细节的数据库。

分为: 书目数据库和指南数据库

指南数据库(REERRENCE DATABASES)也称指示性数据库,是指存储关于某些机

构、人物、出版物、项目、程序、活动等对象的简要描述,指引用户从其他有关

信息获取更详细的信息的一类数据库。

如产品目录、机构名录、研发项目、基金项目等数据库均属于此类型。

(2)源数据库(source databases):

直接提供原始资料和具体数据的数据库

全文数据库 数值数据库 科学技术数据 统计数据库

文本-数值数据库 公司信息库 产品市场数据库 术语数据库

汉语主题词数据库 图象数据库 建筑图纸数据库

(3)混合型数据库

磁媒体数据库 光盘数据库 多媒体数据库

11.网络信息资源的特征

(1)、信息内容丰富(2)、信息变化频繁(3)、信息结构复杂(4)、格式多样化

(5)、信息价值不一

网络信息资源的发展变化

(1)、网络信息资源数量规模的急剧增大(2)、信息资源内容趋于规范

网络信息资源的评价

(1)资源内容评价指标①数据库的规模②数据库的范围③数据库的质量控制

④数据库的实效性

(2)信息组织管理的评价指标①信息收集方法②信息更新周期③信息管理方式

(3)信息检索功能的评价指标①布尔逻辑检索②精确检索③截词检索

(4)检索结果评价指标①结果满意度②相关性排序③显示内容形式

印刷型信息资源的特点

(1)实用性:携带、书写、保存方便

(2)直观性:阅读不需借助计算机等工具。

(3)不可替代性:以纸质为载体的艺术作品的不可替代性

(4)增值性:质文献作为收藏品的不可替代性

按文献的加工深度划分

零次文献:指未经公开交流的最原始的文献。如论文手稿、新闻稿、未审核的工

程图纸、实验记录、会议记录。

特点:内容庞杂,来源真实,成熟度差

一次文献:以著者本人的研究成果为依据而形成,并在社会上公开交流或发表的

文献。如期刊论文、研究报告、预印本、会议论文、专利说明书、学位论文、技

术标准等。

特点:零散、无序、难获取

第一,创造性;第二,原始性;第三,多样性;

二次文献:是把分散、无组织一次文献进行收集、加工、整理压缩而形成的并能

按期外部特征提供查找线索的文献形式。如目录、题录、文摘、索引等

特点:

第一,集中性;第二,工具性;第三,系统性;

三次文献:利用二次文献对一次文献进行综合、归纳和分析的基础上而形成的述

评性、综述性文献形式。

特点:

第一,综合性;第二,针对性;第三,科学性;

12.其他载体文献信息资源

印刷型文献信息资源特点:存储密度小、占据空间大、阅读携带方便

微缩型文献信息资源特点:存储密度小、占据空间大、阅读携带方便

声像型文献信息资源特点:直观、形象

电子型文献信息资源特点:存储密度高、存取快、数据可修改、删除、更新

第二章

1.信息存储与检索概念

(1).广义信息检索:指将信息按有序的方式组织和贮存,并根据用户的需求查

找出有关信息的过程。包括存入和输出两个方面。

(2).狭义的信息检索:单指查寻信息的过程,即从信息集合之中查寻出所需要

的符合要求的信息的过程。

(3).信息存储:是按主题词表或分类表及使用原则对原始信息资源进行处理,

形成信息特征标识,为检索提供整序(即提供检索途径的)的信息集合的过程。

(4).信息存储与检索的基本原理:查询语言(检索提问)和系统标识语言所进

行的“相符性比较”与“匹配运算”。

(5).直接检索: 直接从信息源或信息文献载体中获取信息

(6).间接检索: 通过检索工具指引来获取所需信息。

(7)、信息检索通常包括4种类型:

一是关于文献的检索;二是关于某事实或事项的知识检索;三是关于数值或数据

的情报检索;四是关于图象信息的信息检索。

2.信息存储

(1).信息的印刷存储

特点:直观易读、携带方便。缺点:存储信息密度低、存储传输慢,难以长期保

(2).信息的微缩存储 特点:容量大、密度高,忠实于信息原件、不出差错;成本低、保存时间长

(3).信息的磁存储

(1)磁存储的特点

能存储一切可转换成电信号信息。文字、声、像;可长久保存、重复使用、可擦

写;可同时进行多路信息存储,并保证信息之间的时 间和位相关系;存储频带

宽广;可高速存储高频信息慢速播放或慢速存入低频信息快速播放

(2) 磁存储类型

计算机磁带 硬盘软盘 光盘 温盘

(4),半导体存储

是采用集成化的技术将存储单元电路及其外围电路直接置放在半导体芯片上支

撑的。

(5),光盘存储

特点:信息存储密度高

价格低

方便存取、方便与计算机连接

显示信息种类多

坚固耐用,存储寿命长

计算机的存取技术与设备

网络存储

3.按检索活动的执行主体

手工检索

利用人工信息存取系统检索信息的活动,如各类纸质书目、索引、文摘、卡片

检索过程:人工的手翻、眼看、大脑分析和判断

优点:①不需要辅助设备,适应性好②成本低,检索工具可长期无限制使用③检

索前随时获得反馈信息,及时修改检索策略④可以把几种检索工具进行对比参照。

缺点:①费时费力②检索工具提供检索点有限,主题专深文献

按检索工具类型

(1)目录与题录检索

(2)文摘检索

(3)字典型检索

(4)交互式检索

(5)索引检索

按照检索方式划分

有先组式索引和后组式索引。

按照索引所包括的对象划分

有综合索引和专门索引

依据索引标题词的性质划分

有揭示信息资源内容特征的主题索引、分类索引、关键词索引、分子式索引、结

构式索引;

有揭示信息资源形式特征的题名索引、人名索引、物名索引、代码索引、引文索

引。

依据索引标题词的排序方式划分

有按照标题词字顺组织的主题索引、题名索引、人名索引、关键词索引、语词索

引等;

有按照文献代码组织的报告号索引、合同号索引、标准号索引等;

有按其它排序方式组织的网络信息自动索引、重量索引、速度索引、专用索引等

4.主题索引优缺点

(1)能把属于不同学科、不同知识体系中论述的同一主题的资源集中标引出来,

届时资料比较深入、广泛。

(2)查考文献资料时,需要正确选取主题词,否则难以准确查到

5.关键词索引自然语言检索标识;自然语言多指关键词,直接从文献篇名、正文

或文摘中抽取,未经优选和规范化

自然语言检索优点

(1)不受词表控制,能及时检索到最新概念的各类文献

(2)可任意选取专指性强的语言,提高查准率

(3)非受控词具有数量大的特点,比叙词表大2~3个数量级。

(4)避免在标引人员和用户之间造成不必要的交流障碍

自然语言检索缺点

(1)不规范,存在大量同义词、多义词和含义模糊现象。

(2)没有显示词语之间的关系

规范语言检索标识。

6.组配索引

1 按组配方式

(1)先组式检索语言

指检索前,检索词已被预先组配好的一种检索语言

分为定组型和散组型编制检索语言词表的时已经预先固定组配

(2)后组式检索语言指表达文献信息主题的标识,在编制检索语言词表和标引

文献的时候,都不预先固定组配,而是在检索进行时根据检索的实际需要,按照

组配规则临时进行组配的检索语言

先后组式检索语言评价

(1)先组式有利于提高检索词的专指度,减少标引到每个词的文献数量,减少

和避免假组配,从而有利于查准率

(2)先组式的词在数量上是有限的,不能适应各种角度和深度的符合概念检索

(3)后组式便于各种角度和深度的检索,有利于查准率的提高,但有可能出现

假组配,致使误检的增多。

7.文摘与索引的异同点:文摘是指对一篇文献内容所作的简略、准确的摘录 , 一

般不包含有对原文补充、解释或评论

共同点都以论文、文章、报告为主要报道对象

不同点:1)索引报道文献的外表特征为主,文摘报道文献的内容特征为主

2)从形式上,索引一般没有摘录,文摘没有原文评价

3)文摘很少收录综合性的文献,按分类编排,不按主题和著者。

4)文摘比索引报到时间慢,文摘比索引少。

5)索引告诉读者文章位置,没有论文的内容,是否有价值。

第三章

1.计算机检索技术的发展

(1)脱机检索

(2)联机检索

(3)国际联机检索实现了人类情报资源的共享。

优点:信息量大、快速、方便,数据库内容更新快

(4)单机光盘检索

(5)光盘网络检索

(6)Web信息资源检索

逻辑运算符的优先顺序为NOT、AND、OR,如果要改变运算顺序需要用“()”

2.提问检索式构造

句子切分词汇剔除概念替换概念限定与补充组合式检索式

3.信息检索一般方法(4) 排除、限定和合取法

①排除法:对查找对象的产生和存在的状态在时间和空间上加以外在否定。

排除法可在时间或空间上可极大地收缩检索范围。如要查中国网络资源建设

的文章,确定1994年以前Internet未进入中国,则可排除1994年以前的报刊

资料。

②限定法:指对查找对象在时间和空间上加以内在的肯定。排除的结果必然

是限定,反之亦然

③合取法:如果把不同资料中涉及所需信息的记载都截取下来,汇集在一起,

再经过去粗取精、去伪存真地加工,构成一个完整的答案。

善于跨种类地综合利用各种类、各文种的参考工具书,注意比较它们各自的

特点,有步骤、按次序地进行查找;

不仅利用二次文献,而且利用一次文献和三次文献;

不仅要利用文字资料,还要注意利用图象资料;

不仅要利用电子信息,也要考虑缩微资料、印刷品和档案材料;

不仅要注意参考工具书的正文,还要充分利用其附录。

4.选择检索方法的原则

①如果检索工具缺藏或根本没有,研究课题涉及面又不大,对查全率不作较

高要求,可采用由近及远追溯法。追溯的起点最好是所附参考文献较多的论文及

论著还有一些信息研究成果如“评述”、“综述”等。

②如果检索工具齐备,研究课题涉及的范围大,则应采用常用法或综合法查

找。

③如果研究课题属于新兴学科或知识更新快的学科,可采用倒查法。

④ 如果研究课题对查全率作特别要求,如开题查新,一般可采用顺查法。

⑤ 如果已经掌握了课题发展的规律、特点,一般可采用抽查法。

5.计算机检索常用法

(1).菜单检索:

用户不必记忆复杂的指令,只需在系统给出的菜单中选择项目来完成各项操作

缺点:检索步骤多,且检索精确度不及指令检索

(2). 指令检索:

又称命令检索,是一种依靠各种指令来完成操作的检索方法。

(3). 浏览式检索:

用于网络信息资源的超文本或超媒体查询

(4). 提问—回答式检索

目标明确,技术规范,检索速度快,查全率和查准率高,可广泛用于

光盘数据库和搜索引擎。

基本查询、二次检索、词组检索、索引词典检索、高级检索、综合检索

6. 信息检索的意义和作用:

(1)有利于培养具有获取最新信息和自我知识更新能力的复合型、开拓性人才

(2)有利于节省科研时间,提高科研效率。

可把我们引导到超越教学大纲的更多的知识范围中去

(3) 有利于为决策提供科学依据

(4) 有利于减少重复劳动,提高科研成功率,避免走弯路。

第四章

1.计算机信息检索技术的特征:

(1)速度快、效率高

(2)检所范围广

(3)不受时空限制

(4)数据更新频率高

(5)辅助功能完善

2.计算机信息检索系统的组成

计算机信息检索系统:

(1)信息源

(2)信息组织管理

(3) 系统功能

(4) 用户接口

(5) 系统支持技术

(1) 硬件部分指以计算机主机为中心的一系列及其设备,包括主机、外围设备记

忆与数据处理或数据传送有关的其他设备

(2) 软件设备信息检索系统中的有关程序和各种文件资料的总称。操作系统、数

据库管理、汇编、文件管理、词表管理、回溯、通讯管理、总控程序等 软件由

系统维护软件与检索软件构成。系统维护软件,如数据库管理程序、词表管理程序等,其作用是保障检索系统的高效运转。检索软件是用户与系统的界面,用户通过检索软件进行检索,检索软件功能的强弱直接影响着检索效果。

(3) 机读数据库 是将数据按照一定格式存储在计算机内的数据的

仓库,即存储在计算机内的相关数据的集合。 系统拥有的各种数据库成为联机数据库,由系统本身自建或有数据库生产者提供。为了节省空存储的空间并便于随机存取,系统要建立主文档的索引文档,指明每条记录的存储地址 按提供的内容网络信息资源可分为:

(1)参考型数据库。指引用户到另一信息源以获得原文或其他细节的一类数据库。包括各种书目数据库和引文数据库。这种数据库具有参考和评价的功能,多用于查新、开题。如:SCI、EI、维普的中文期刊数据库

(2)全文数据库。指存储文献全文或其中主要部分的数据库。如新闻消息全文库、法律法规全文库、博硕论文全文库等。

(3)事实型数据库。直接提供事实或数值的数据库。如:万方的企业产品数据库、彼得森大学指南等。

(4)电子图书。计算机利用计算机检索并下载阅读的图书。如:书生之家、超星数字图书馆、各种数字图书馆等。

(5)电子期刊。直接在网上就可以检索和阅读的期刊。如:万方数字化期刊,中国期刊网全文数据库,science online等

(6)电子报纸。如:人民日报的网络版。

(7)其它类型。如电子公告版(bbs),网络论坛、新闻等

按是否收费网络数据库可分为

(1)商业数据库:内容系统、丰富、全面。图书馆通过购买获得的都是商业数据库,如:Ei Village、《中国期刊网全文数据库》。

(2)免费数据库:逊于商业数据库。一般是由政府部门开发,提供相关信息;或是暂未成熟收费的商业数据库。

第五章

1.联机检索系统的基本结构

包括检索终端、通信网和联机检索中心三部分。

检索终端(硬件):显示器、键盘、打印机、电传终端等微机终端

通信网:公用电话网、专用数据通讯网、公用数据网

联机检索中心:中央计算机、联机数据库、检索与管理软件以相应的检索服务体制组成

(1) 检索范围广

(2) 数据库种类多

(3) 检索效率高

(4) 检索效果好

(5) 具有灵活的服务方式和输出方式

2.国际联机检索特点

(1)检索速度快,一般课题均可以几分钟之内完成联机过程。

(2)资源丰富,四大情报检索系统具有丰富的情报源。

(3)可及时得到最新信息。一些大型数据库更新速度极为迅速,如CA、BA等均

是每周更新,联机数据库的信息至少比书本式工具书快一至两个月。 国际联机检索缺点

(1)集中式的管理使主机负担重,一旦出现故障,整个网络瘫痪。

(2)在信息组织上,联机检索是普通文本,以线性方式组织

(3)不能像Internet共享网络中的各个资源.

(4)联机系统需要专业知识 ,费用较高。

3.匹配模式

模式选项分为两种:模糊匹配和精确匹配。

“模糊匹配”的结果范围通常情况下会比“精确匹配”的结果范围大些。如果要检索的是一个生僻词,建议使用“模糊匹配”检索篇名、作者、关键词、中文摘要、中文刊名以及篇名/关键词/摘要这些字段支持匹配模式选择。

4.联机信息检索与网络信息检索比较

(1)联机信息检索与网络信息检索的相似之处

①检索实质相同

②逻辑组织大体相同

③提供检索的逻辑组配手段相似

④检索入口相同

(2)联机信息检索与网络信息检索的差异

①标引所依据的语言不同

②系统界面设计不同

③信息组织方式不同

5.联机信息检索与网络信息检索效益比较

1. 联机信息检索的优势和缺陷

优势:

(1)联机存取系统在信息数量上的优势

(2)联机存取系统在信息质量上的优势

(3)联机存取系统在检索效率上的优势

缺陷:

(1)联机信息检索费用昂贵

(2)联机信息检索需要一定的检索技巧

2.基于Internet的网络信息检索的优势和缺陷

优势:

(1)检索费用低

(2)用户界面友好

(3)信息内容和形式新颖多样、原文可获得性高

缺陷:

网络上免费提供的信息质量、时效性和可靠性还不能得到充分的保证 由于缺乏必要的管理和法律制约,Internet上的信息资源开发与服务还存在着各种问题,如网络安全、有害与违法信息的传播、版权保护、信息资源的管理和组织、网络信息检索的检索低等问题。

6.网络环境下联机信息检索发展策略

1 联入Internet

2 改善用户界面

3 调整收费制度

第一章

1.信息的涵义:

申农(信息论创始人):用于消除随机不确定性的东西(信源、信宿)

广义信息是物质、能量存在和运动状态的表征.

狭义信息是人类社会共享的一切知识、学问以及从客观现象中提炼出来的各种消息的总和,即现代信息

2.资源的涵义

资源是一切被人类开发和利用的客观存在。

3.信息资源的涵义

狭义指文献资源或数据资源,抑或各种媒介和形式的信息的集合,包括文字、声像、印刷品、电子信息、数据库等。这都是限于信息的本身。

广义信息资源是信息活动中各种要素的总称。这既包含了信息本身,也包括了与信息相关的人员、设备、技术和资金等各种资源

(1)原始数据与信息的区别

原始数据经过加工处理变为信息

(2)信息与信息资源的区别

经过加工、可被利用的信息称为信息资源。 information resource为复数时,常指信息及与信息有关的设备、人员等集合,是经过人类选取、组织、序化的有用信息的集合。

(1)信息资源是信息的集体;

(2)信息资源是经过人类选择、获取的有用信息的集合;

(3)信息资源是经过人类组织序化的信息的集合。

4.信息的基本性质

(1)信息是内容是客观的(2)信息的形式是主观的(3)信息是一切物质的基本属性

5.与信息有关的概念

(1)知识。

是对客观事物规律性认识,是系统化和精炼化的信息

知识的三种存在方式:大脑、实物、文献

知识的七个特征:①不可替代性 ②不可相加性 ③不可逆性 ④不可磨损性⑤不可分性⑥可共享性⑦无限增值性

知识分类:①事实知识(Know What)②原理知识( Know why)③技能知识( Know how)④人力知识( Know who)⑤时间知识( Know When)⑥空间知识( Know Where)⑦数量知识( Know Quantity )

(2)文献。是记录知识的一切载体,即用文字、图形、符号、或声视频等记录方式在一定介质上所生成的物质成果

文献的三要素:记录、知识、载体

文献的功能:①存储功能 ②传递功能 ③认识功能

(3)情报。指为一定目的而搜集和传递的有特定效用的知识

情报的基本属性:传递性、效用性

6.信息资源的基本特征

(1)普遍性(2)传递性(3)时效性(4)价值性(5)可转换性(6)可利用性

(7)可共享性

7.按性质划分

(1)自然信息资源(2)社会信息资源

按信息包含范围划分

(1)广义信息资源(2)狭义信息资源

按信息资源的载体

(1)印刷型信息资源(2)微缩型信息资源(3)声像性信息资源(4)电子型信

息资源

按内容

(1)文献型信息资源(2)数据型信息资源(3)多媒体信息资源

按保密程度

(1)公开性信息资源(2)半公开性信息资源(3)非公开性信息资源

按表现形式

(1)文字性信息(2)图像性信息(3)数值数据性信息(4)语音性信息

按信息资源的加工程度

(1)一次信息(2)二次信息(3)三次信息

按传输方式

(1)网络信息资源(2)非网络信息资源

按数据资源信息的生产途径和发布范围分

(1)商用电子资源(2)网络公开学术资源(3)特色信息资源

8.信息素质教育

信息素质教育:

是从各种信息资源中检索、评价使用信息的能力。是培养信息意识的一条重要的

途径。

9.电子信息资源含义与特点

(1)、存储形式多样化,文本、超文本、多媒体、超媒体(2)、资源数字化(3)、

交流程度高(4)、提高利用率(5)、内容丰富(6)、载体容量大

10.网络信息资源的类型

按照网络传输协议不同分

(1)Web信息资源:通过HTTP在网上传输

(2)Telnet信息资源:基于网络通讯协议

(3)FTP信息资源:通过FTP协议可完成完整的文件拷贝

(4)用户服务组信息资源:由一组对某一特定主题有共同兴趣的网络用户组成

的电子论坛。

(5)Gopher信息资源:Gopher是一种基于菜单的网络服务,允许用户以一种简

单的、一致的方式快速找到并访问所需的网络资源。

按信息传播交流过程分

(1)稳定的电子信息资源 (2)不稳定的电子信息资源

按网络信息资源的表现形式分

(1)电子图书型(2)电子期刊型 (3)电子报纸型

(4)联机系统与联机数据库(5)数字图书馆

按照存取方式分

(1)邮件型(2)电话型(3)揭示板型(4)广播型

(5)图书馆型(6)书目型(7)交互型

按电子数据库内容分

(1) 参考数据库(2) 源数据库 (3)混合型数据库

(1)参考数据库指导用户到另一个信息源中获取原文或其他细节的数据库。

分为: 书目数据库和指南数据库

指南数据库(REERRENCE DATABASES)也称指示性数据库,是指存储关于某些机

构、人物、出版物、项目、程序、活动等对象的简要描述,指引用户从其他有关

信息获取更详细的信息的一类数据库。

如产品目录、机构名录、研发项目、基金项目等数据库均属于此类型。

(2)源数据库(source databases):

直接提供原始资料和具体数据的数据库

全文数据库 数值数据库 科学技术数据 统计数据库

文本-数值数据库 公司信息库 产品市场数据库 术语数据库

汉语主题词数据库 图象数据库 建筑图纸数据库

(3)混合型数据库

磁媒体数据库 光盘数据库 多媒体数据库

11.网络信息资源的特征

(1)、信息内容丰富(2)、信息变化频繁(3)、信息结构复杂(4)、格式多样化

(5)、信息价值不一

网络信息资源的发展变化

(1)、网络信息资源数量规模的急剧增大(2)、信息资源内容趋于规范

网络信息资源的评价

(1)资源内容评价指标①数据库的规模②数据库的范围③数据库的质量控制

④数据库的实效性

(2)信息组织管理的评价指标①信息收集方法②信息更新周期③信息管理方式

(3)信息检索功能的评价指标①布尔逻辑检索②精确检索③截词检索

(4)检索结果评价指标①结果满意度②相关性排序③显示内容形式

印刷型信息资源的特点

(1)实用性:携带、书写、保存方便

(2)直观性:阅读不需借助计算机等工具。

(3)不可替代性:以纸质为载体的艺术作品的不可替代性

(4)增值性:质文献作为收藏品的不可替代性

按文献的加工深度划分

零次文献:指未经公开交流的最原始的文献。如论文手稿、新闻稿、未审核的工

程图纸、实验记录、会议记录。

特点:内容庞杂,来源真实,成熟度差

一次文献:以著者本人的研究成果为依据而形成,并在社会上公开交流或发表的

文献。如期刊论文、研究报告、预印本、会议论文、专利说明书、学位论文、技

术标准等。

特点:零散、无序、难获取

第一,创造性;第二,原始性;第三,多样性;

二次文献:是把分散、无组织一次文献进行收集、加工、整理压缩而形成的并能

按期外部特征提供查找线索的文献形式。如目录、题录、文摘、索引等

特点:

第一,集中性;第二,工具性;第三,系统性;

三次文献:利用二次文献对一次文献进行综合、归纳和分析的基础上而形成的述

评性、综述性文献形式。

特点:

第一,综合性;第二,针对性;第三,科学性;

12.其他载体文献信息资源

印刷型文献信息资源特点:存储密度小、占据空间大、阅读携带方便

微缩型文献信息资源特点:存储密度小、占据空间大、阅读携带方便

声像型文献信息资源特点:直观、形象

电子型文献信息资源特点:存储密度高、存取快、数据可修改、删除、更新

第二章

1.信息存储与检索概念

(1).广义信息检索:指将信息按有序的方式组织和贮存,并根据用户的需求查

找出有关信息的过程。包括存入和输出两个方面。

(2).狭义的信息检索:单指查寻信息的过程,即从信息集合之中查寻出所需要

的符合要求的信息的过程。

(3).信息存储:是按主题词表或分类表及使用原则对原始信息资源进行处理,

形成信息特征标识,为检索提供整序(即提供检索途径的)的信息集合的过程。

(4).信息存储与检索的基本原理:查询语言(检索提问)和系统标识语言所进

行的“相符性比较”与“匹配运算”。

(5).直接检索: 直接从信息源或信息文献载体中获取信息

(6).间接检索: 通过检索工具指引来获取所需信息。

(7)、信息检索通常包括4种类型:

一是关于文献的检索;二是关于某事实或事项的知识检索;三是关于数值或数据

的情报检索;四是关于图象信息的信息检索。

2.信息存储

(1).信息的印刷存储

特点:直观易读、携带方便。缺点:存储信息密度低、存储传输慢,难以长期保

(2).信息的微缩存储 特点:容量大、密度高,忠实于信息原件、不出差错;成本低、保存时间长

(3).信息的磁存储

(1)磁存储的特点

能存储一切可转换成电信号信息。文字、声、像;可长久保存、重复使用、可擦

写;可同时进行多路信息存储,并保证信息之间的时 间和位相关系;存储频带

宽广;可高速存储高频信息慢速播放或慢速存入低频信息快速播放

(2) 磁存储类型

计算机磁带 硬盘软盘 光盘 温盘

(4),半导体存储

是采用集成化的技术将存储单元电路及其外围电路直接置放在半导体芯片上支

撑的。

(5),光盘存储

特点:信息存储密度高

价格低

方便存取、方便与计算机连接

显示信息种类多

坚固耐用,存储寿命长

计算机的存取技术与设备

网络存储

3.按检索活动的执行主体

手工检索

利用人工信息存取系统检索信息的活动,如各类纸质书目、索引、文摘、卡片

检索过程:人工的手翻、眼看、大脑分析和判断

优点:①不需要辅助设备,适应性好②成本低,检索工具可长期无限制使用③检

索前随时获得反馈信息,及时修改检索策略④可以把几种检索工具进行对比参照。

缺点:①费时费力②检索工具提供检索点有限,主题专深文献

按检索工具类型

(1)目录与题录检索

(2)文摘检索

(3)字典型检索

(4)交互式检索

(5)索引检索

按照检索方式划分

有先组式索引和后组式索引。

按照索引所包括的对象划分

有综合索引和专门索引

依据索引标题词的性质划分

有揭示信息资源内容特征的主题索引、分类索引、关键词索引、分子式索引、结

构式索引;

有揭示信息资源形式特征的题名索引、人名索引、物名索引、代码索引、引文索

引。

依据索引标题词的排序方式划分

有按照标题词字顺组织的主题索引、题名索引、人名索引、关键词索引、语词索

引等;

有按照文献代码组织的报告号索引、合同号索引、标准号索引等;

有按其它排序方式组织的网络信息自动索引、重量索引、速度索引、专用索引等

4.主题索引优缺点

(1)能把属于不同学科、不同知识体系中论述的同一主题的资源集中标引出来,

届时资料比较深入、广泛。

(2)查考文献资料时,需要正确选取主题词,否则难以准确查到

5.关键词索引自然语言检索标识;自然语言多指关键词,直接从文献篇名、正文

或文摘中抽取,未经优选和规范化

自然语言检索优点

(1)不受词表控制,能及时检索到最新概念的各类文献

(2)可任意选取专指性强的语言,提高查准率

(3)非受控词具有数量大的特点,比叙词表大2~3个数量级。

(4)避免在标引人员和用户之间造成不必要的交流障碍

自然语言检索缺点

(1)不规范,存在大量同义词、多义词和含义模糊现象。

(2)没有显示词语之间的关系

规范语言检索标识。

6.组配索引

1 按组配方式

(1)先组式检索语言

指检索前,检索词已被预先组配好的一种检索语言

分为定组型和散组型编制检索语言词表的时已经预先固定组配

(2)后组式检索语言指表达文献信息主题的标识,在编制检索语言词表和标引

文献的时候,都不预先固定组配,而是在检索进行时根据检索的实际需要,按照

组配规则临时进行组配的检索语言

先后组式检索语言评价

(1)先组式有利于提高检索词的专指度,减少标引到每个词的文献数量,减少

和避免假组配,从而有利于查准率

(2)先组式的词在数量上是有限的,不能适应各种角度和深度的符合概念检索

(3)后组式便于各种角度和深度的检索,有利于查准率的提高,但有可能出现

假组配,致使误检的增多。

7.文摘与索引的异同点:文摘是指对一篇文献内容所作的简略、准确的摘录 , 一

般不包含有对原文补充、解释或评论

共同点都以论文、文章、报告为主要报道对象

不同点:1)索引报道文献的外表特征为主,文摘报道文献的内容特征为主

2)从形式上,索引一般没有摘录,文摘没有原文评价

3)文摘很少收录综合性的文献,按分类编排,不按主题和著者。

4)文摘比索引报到时间慢,文摘比索引少。

5)索引告诉读者文章位置,没有论文的内容,是否有价值。

第三章

1.计算机检索技术的发展

(1)脱机检索

(2)联机检索

(3)国际联机检索实现了人类情报资源的共享。

优点:信息量大、快速、方便,数据库内容更新快

(4)单机光盘检索

(5)光盘网络检索

(6)Web信息资源检索

逻辑运算符的优先顺序为NOT、AND、OR,如果要改变运算顺序需要用“()”

2.提问检索式构造

句子切分词汇剔除概念替换概念限定与补充组合式检索式

3.信息检索一般方法(4) 排除、限定和合取法

①排除法:对查找对象的产生和存在的状态在时间和空间上加以外在否定。

排除法可在时间或空间上可极大地收缩检索范围。如要查中国网络资源建设

的文章,确定1994年以前Internet未进入中国,则可排除1994年以前的报刊

资料。

②限定法:指对查找对象在时间和空间上加以内在的肯定。排除的结果必然

是限定,反之亦然

③合取法:如果把不同资料中涉及所需信息的记载都截取下来,汇集在一起,

再经过去粗取精、去伪存真地加工,构成一个完整的答案。

善于跨种类地综合利用各种类、各文种的参考工具书,注意比较它们各自的

特点,有步骤、按次序地进行查找;

不仅利用二次文献,而且利用一次文献和三次文献;

不仅要利用文字资料,还要注意利用图象资料;

不仅要利用电子信息,也要考虑缩微资料、印刷品和档案材料;

不仅要注意参考工具书的正文,还要充分利用其附录。

4.选择检索方法的原则

①如果检索工具缺藏或根本没有,研究课题涉及面又不大,对查全率不作较

高要求,可采用由近及远追溯法。追溯的起点最好是所附参考文献较多的论文及

论著还有一些信息研究成果如“评述”、“综述”等。

②如果检索工具齐备,研究课题涉及的范围大,则应采用常用法或综合法查

找。

③如果研究课题属于新兴学科或知识更新快的学科,可采用倒查法。

④ 如果研究课题对查全率作特别要求,如开题查新,一般可采用顺查法。

⑤ 如果已经掌握了课题发展的规律、特点,一般可采用抽查法。

5.计算机检索常用法

(1).菜单检索:

用户不必记忆复杂的指令,只需在系统给出的菜单中选择项目来完成各项操作

缺点:检索步骤多,且检索精确度不及指令检索

(2). 指令检索:

又称命令检索,是一种依靠各种指令来完成操作的检索方法。

(3). 浏览式检索:

用于网络信息资源的超文本或超媒体查询

(4). 提问—回答式检索

目标明确,技术规范,检索速度快,查全率和查准率高,可广泛用于

光盘数据库和搜索引擎。

基本查询、二次检索、词组检索、索引词典检索、高级检索、综合检索

6. 信息检索的意义和作用:

(1)有利于培养具有获取最新信息和自我知识更新能力的复合型、开拓性人才

(2)有利于节省科研时间,提高科研效率。

可把我们引导到超越教学大纲的更多的知识范围中去

(3) 有利于为决策提供科学依据

(4) 有利于减少重复劳动,提高科研成功率,避免走弯路。

第四章

1.计算机信息检索技术的特征:

(1)速度快、效率高

(2)检所范围广

(3)不受时空限制

(4)数据更新频率高

(5)辅助功能完善

2.计算机信息检索系统的组成

计算机信息检索系统:

(1)信息源

(2)信息组织管理

(3) 系统功能

(4) 用户接口

(5) 系统支持技术

(1) 硬件部分指以计算机主机为中心的一系列及其设备,包括主机、外围设备记

忆与数据处理或数据传送有关的其他设备

(2) 软件设备信息检索系统中的有关程序和各种文件资料的总称。操作系统、数

据库管理、汇编、文件管理、词表管理、回溯、通讯管理、总控程序等 软件由

系统维护软件与检索软件构成。系统维护软件,如数据库管理程序、词表管理程序等,其作用是保障检索系统的高效运转。检索软件是用户与系统的界面,用户通过检索软件进行检索,检索软件功能的强弱直接影响着检索效果。

(3) 机读数据库 是将数据按照一定格式存储在计算机内的数据的

仓库,即存储在计算机内的相关数据的集合。 系统拥有的各种数据库成为联机数据库,由系统本身自建或有数据库生产者提供。为了节省空存储的空间并便于随机存取,系统要建立主文档的索引文档,指明每条记录的存储地址 按提供的内容网络信息资源可分为:

(1)参考型数据库。指引用户到另一信息源以获得原文或其他细节的一类数据库。包括各种书目数据库和引文数据库。这种数据库具有参考和评价的功能,多用于查新、开题。如:SCI、EI、维普的中文期刊数据库

(2)全文数据库。指存储文献全文或其中主要部分的数据库。如新闻消息全文库、法律法规全文库、博硕论文全文库等。

(3)事实型数据库。直接提供事实或数值的数据库。如:万方的企业产品数据库、彼得森大学指南等。

(4)电子图书。计算机利用计算机检索并下载阅读的图书。如:书生之家、超星数字图书馆、各种数字图书馆等。

(5)电子期刊。直接在网上就可以检索和阅读的期刊。如:万方数字化期刊,中国期刊网全文数据库,science online等

(6)电子报纸。如:人民日报的网络版。

(7)其它类型。如电子公告版(bbs),网络论坛、新闻等

按是否收费网络数据库可分为

(1)商业数据库:内容系统、丰富、全面。图书馆通过购买获得的都是商业数据库,如:Ei Village、《中国期刊网全文数据库》。

(2)免费数据库:逊于商业数据库。一般是由政府部门开发,提供相关信息;或是暂未成熟收费的商业数据库。

第五章

1.联机检索系统的基本结构

包括检索终端、通信网和联机检索中心三部分。

检索终端(硬件):显示器、键盘、打印机、电传终端等微机终端

通信网:公用电话网、专用数据通讯网、公用数据网

联机检索中心:中央计算机、联机数据库、检索与管理软件以相应的检索服务体制组成

(1) 检索范围广

(2) 数据库种类多

(3) 检索效率高

(4) 检索效果好

(5) 具有灵活的服务方式和输出方式

2.国际联机检索特点

(1)检索速度快,一般课题均可以几分钟之内完成联机过程。

(2)资源丰富,四大情报检索系统具有丰富的情报源。

(3)可及时得到最新信息。一些大型数据库更新速度极为迅速,如CA、BA等均

是每周更新,联机数据库的信息至少比书本式工具书快一至两个月。 国际联机检索缺点

(1)集中式的管理使主机负担重,一旦出现故障,整个网络瘫痪。

(2)在信息组织上,联机检索是普通文本,以线性方式组织

(3)不能像Internet共享网络中的各个资源.

(4)联机系统需要专业知识 ,费用较高。

3.匹配模式

模式选项分为两种:模糊匹配和精确匹配。

“模糊匹配”的结果范围通常情况下会比“精确匹配”的结果范围大些。如果要检索的是一个生僻词,建议使用“模糊匹配”检索篇名、作者、关键词、中文摘要、中文刊名以及篇名/关键词/摘要这些字段支持匹配模式选择。

4.联机信息检索与网络信息检索比较

(1)联机信息检索与网络信息检索的相似之处

①检索实质相同

②逻辑组织大体相同

③提供检索的逻辑组配手段相似

④检索入口相同

(2)联机信息检索与网络信息检索的差异

①标引所依据的语言不同

②系统界面设计不同

③信息组织方式不同

5.联机信息检索与网络信息检索效益比较

1. 联机信息检索的优势和缺陷

优势:

(1)联机存取系统在信息数量上的优势

(2)联机存取系统在信息质量上的优势

(3)联机存取系统在检索效率上的优势

缺陷:

(1)联机信息检索费用昂贵

(2)联机信息检索需要一定的检索技巧

2.基于Internet的网络信息检索的优势和缺陷

优势:

(1)检索费用低

(2)用户界面友好

(3)信息内容和形式新颖多样、原文可获得性高

缺陷:

网络上免费提供的信息质量、时效性和可靠性还不能得到充分的保证 由于缺乏必要的管理和法律制约,Internet上的信息资源开发与服务还存在着各种问题,如网络安全、有害与违法信息的传播、版权保护、信息资源的管理和组织、网络信息检索的检索低等问题。

6.网络环境下联机信息检索发展策略

1 联入Internet

2 改善用户界面

3 调整收费制度


相关内容

  • 信息检索知识点
  • 信息检索考点整理 1. 信息检索的概念 广义的信息检索是指将信息按一定的方式组织.存储起来,并根据信息用户的需要找出有关信息的过程,包括信息的存储和检索两个过程: 而狭义的信息检索仅指有序化信息的检索查找. 2. 信息检索的原理 就是将检索者的检索提问标识与存储在检索工具中的信息特征标识进行相符性比 ...

  • 计算机检索基本原理
  • 网络资源与信息检索 本章具体内容安排: 2.1 计算机检索基本原理概述 2.2 计算机检索基本原理 2.3 文献信息数据库的基本概念 2.4 计算机检索策略的构建与调整 要求:初步掌握计算机检索的基本原理.基本类型及其检索策略的构建与调整. 第二讲 计算机检索基本原理 2.1 计算机检索基本原理概述 ...

  • 信息化理论与实践
  • 1.信息是经过采集.记录.处理并以可检索的形式存储的数据. 2.信息的本质属性:可识别性.可出理性.可检索性.可存储性. 3.信息.只是.数据的关系:信息不同于数据,(信息是经过加工以后.并对客观世界产生影响的数据.)信息也不同于知识(知识是以某种方式把一个或多个信息关联在一起的信息的信息结构,是个 ...

  • 软件工程超市管理系统详细设计文档
  • 超市管理系统 [详细设计说明书] 执笔人:洪振 学号:12101105 [项目组组员] 12101104韩劼男 12101105洪振 12101106籍孟云 12101107荆德松 12101108李杨 12101109梁宏达 2015-5-20 目录 1.引言................... ...

  • 信息检索与利用名词解释
  • 文献(document)指的是在存贮.检索.利用或传递记录信息的过程中,可作为一个单元处理的,在载体内.载体上或依附载体而存贮有信息或数据的载体. 以文字.图形.符号.声频.视频.电磁信号等手段记录和传播知识的载体就是文献. 检索策略 检索策略(Retrieval Strategy),是指为实现检索 ...

  • 图书馆学基础
  • 图书馆学基础知识汇总 一.信息管理 1. 信息 信息是事物发出的信号所包含的内容 是由事物发出的消息.指令.数据等所包含的内容用以消除不确定性. 信息的基本属性-消除不确定性,共享性是信息区别于物质和能量的主要特性. 信息的特性:普遍性.多样性.可识别性.可加工性.可存储性.可转换性.可传递性 可共 ...

  • 如何使用SQLServer2000全文检索 -- c#天堂
  • 如何使用SQL Server 2000全文检索 SQL Server 2000全文检索 一.如何在SQL中启用全文检索功能 1.证全文检索服务是否安装 通过储存过程FULLTEXTSERVICEPROPERTY(返回有关全文服务级别属性的信息)来验证搜索服务(全文组件)是否安装.如Select fu ...

  • 信息检索与存取期末考试重点
  • 1. 纸质文献资源的存储与组织的4个基本要素 长期以来,纸质文献资源的存储与组织多从4个基本要素着手,即信息内容.载体材料.记录符号和记录方式. (1) (2) (3) (4) 2. 零次文献.一次文献.二次文献.三次文献的区分 零次文献--尚未经过系统整理形成正式文献的零散资料,包括草稿.记录和谈 ...

  • 数字档案馆的含义和主要功能
  • (一)数字档案馆的含义 数字档案馆将原有的以纸张为载体的档案进行数字化处理,并通过网络设备进行管理和利用,是传统档案馆功能的延伸.数字档案馆能够存储大量各种形态的信息,信息存储和利用不受地域的限制.在数字档案馆中,可以开展档案的收集.整理.鉴定.保管.编研和利用等各项业务,同时也能开展电子商务.信息 ...