信息组织学考试要点

1,信息组织的理论基础(系统论、耗散结构论、协同论)。

系统论:在信息组织中,如果将大量的、分散的、杂乱的信息组织成一个系统,建立起内在的关联性,那么信息系统的整体功能将大于各个信息单元的功能之和。也是就是说,这将能发挥信息资源的价值与作用。基于这一原理,信息组织的目标是建立信息系统。

耗散结构理论:所要建立的信息系统应该是一个开放的系统。现实存在的包括信息组织和信息检索在内的信息系统正是这样一个开放系统,它与外界进行着信息的交换,既采集信息也输出信息。

协同论:一个信息系统是由多个子系统构成的,建立各子系统之间的协同作用机制是非常重要的,这正是来自协同论的指导思想:无论什么系统从无序向有序的演化,都是大量子系统之间相互作用而又协同一致的结果。

2,自动标引技术可以分为自动主题标引技术和自动分类标引技术两大类,是信息组织自动化的基础。鉴于汉语的特性,自动分词更是中文信息计算机自动化处理的基础和前提。 3,自动分类标引是指由计算机代替人工对文献信息进行分类,赋予其分类标识,以描述文献主题内容的活动。按自动分类的实现途径进行划分,可将自动分类分为自动聚类和自动归类。

4,自动归类是指先分析待分类对象中的特征,将其与各种类别中对象具有的共同特征进行比较,再将待分类对象归入特征最近的一类并赋予其相应的分类号。自动归类根据使用的技术通常分为基于词的自动归类(词典法)和基于专家系统的自动分类(知识法)两大类。 5,自动聚类是指从待分类对象中提取特征,再将提取的全部特征进行比较并按一定原则将具有相同或相近特征的对象定义为一类,设法使各类中包含的对象大体相等。一般是在语词共现的基础上,通过词频统计和相似性比较加以聚类的。

6,自动主题标引是指由计算机自动确定语词标识来表达信息资源主题的过程,包括自动抽词标引和自动赋词标引两种基本形式。

7,自动抽词标引是指直接从原文中抽取词或短语作为标引词来描述信息资源的主题内容。它主要是从文献的正文、文摘或标题中直接选取标引词,利用该词再文献中出现的频率作为抽词程序的基础。

8,自动赋词标引是指由计算机从受控词表中自动选取词语来表达文献主题内容。分为基于关联词表的自动赋词标引和基于中介词典的自动赋词标引。

9,信息资源描述是指根据信息组织和检索的需要,对信息资源的内容特征和形式特征进行分析、选择和记录的活动。在传统文献组织检索系统的编制中,信息资源描述又被称为文献著录或书目著录。信息描述的结果,是描述记录或称为款目,亦即元数据。它是一种文献的缩影,可以用来作为信息资源的代替物组织检索系统。

10,信息资源的标引,也称文献标引,是指分析文献的内容属性(特征)及相关外表属性,并用特定语言表达分析出的属性或特征,从而富于文献检索标识的过程。

11,标引语言是表达文献主题概念和文献需求主题概念的简明性、单义性和关联性概念标识系统,是根据标引和检索的需要而编制的人工语言。标识的简明性,即标识的形式简洁、含义明确;标识的单义性,即标识与概念的唯一对应,排除了同义现象和多义现象;标识的关联性,即标识之间建立了联系,以反映概念之间的关系。

12,标引语言的类型:依据构成原理可将标引语言分为分类语言、主题语言、代码语言;依标识组合时间的先后,可将标引语言分为先组式语言、后组式语言和散组式语言。

13,中图法的基本序列,也称基本部类或部类,是分类法编制中为建立知识分类体系,对知识门类所进行的最概括、最本质的划分与排列,是确立基本大类的基础。基本序列是: 马克思主义、列宁主义、毛泽东思想、邓小平理论 哲学、宗教 社会科学总论 自然科学总论 综合性图书

14,基本大类,也称分类大纲,是分类法中划分的第一级类目,是在基本序列基础上展开的知识分类体系框架。基本大类都是传统的、稳定的、较为概括的学科或知识领域。分为22个大类。

A 马克思主义、列宁主义、毛泽东思想

B 哲学、宗教

C 社会科学总论

D 政治、法律

E 军事

F 经济

G 文化、科学、教育、体育

H 语言、文字

I 文学

J 艺术

K 历史、地理

N 自然科学总论

O 数理科学和化学

P 天文学、地理科学

Q 生物科学

R 医学、卫生

S 农业科学

T 工业技术

U 交通运输

V 航空、航天

X 环境科学、劳动保护科学(安全科学)

Z 综合性图书

15,体系分类法的宏观结构,即它的各个组成部分及其之间的组织方法、相互联系和作用的方式。它由分类表。编制说明和索引组成。分类表:也称类目表,它是根据类目之间的关系,按照一定的组织原则组织起来的类目一览表。分类表示分类法的主体,因此人们有时将分类表等同于分类法。编制和使用说明:一般是对分类表的编制目的和适用范围、编制原则、体系结构、辅助表、标记符号、注释等予以介绍和解释,以使人们对分类表有一个基本的、全面了解。索引:又称类目索引,它是一种按类名即类目相关概念名称子顺查找相应类号的类表辅助工具。

16,分类法的为微观结构,即类目的构成要素及其组织。类目(包括复分表的子目):是构成分类法的最基本要素,每个类目代表具有某种共同属性的文献集合。一个类目表是由类号、类名、类级、注释和参照组成的。类号:是类目的代号,也叫标记符号,决定类目在分类体系中的位置。文献经过分类标引之后,作为组织分类文献排架标识、组织分类检索工具的检索标识。类名:是类目的名称,用描述文献信息内容的术语直接或间接表达类目的含义和内容范围。类级:是类目的级别,在印刷排版中用排版的缩格和字体表示,代表该类目在分类体系中的等级(划分的层次)、显示类目间的等级关系。注释和参照:对类目的含义及内容范围、分类方法、与其他类目的关系等进行说明。

17,信息描述项目:用以揭示文献信息内容和形式特征的记录事项,也称为著录事项,是组成书目描述的基本单元。每个描述项目又由若干个元素组成。ISBD 规定了九个著录项目:题名与责任项、 版本项、文献特殊细节项、出版发行项、 载体形态项、丛编项、附注项

、文献标准编号及有关记载项、提要项。“. —”各大项前置符(每段起首除外) “=” 并列题名、并列责任者、并列版本说明等 “. ” 用于标识多卷集文献的分辑标识,不同责任者的集合题名等 “+ ”用于载体形态项的附件说明等。

18,关键词索引的类型:一类是带上下文的关键词索引,包括题内关键词索引、题外关键词索引、双重关键词索引;另一类是不带关键词的索引,包括单纯关键词索引、词对式关键词索引、简单关键词索引。

19,一个HTML 文档通常由文档头、文档名称、表格、段落和列表等组成。称为文档元素简称元素。它们是文本文档的基本构件,并且使用超文本标记语言规定的标签来标识这些元素。

20,在HTML 的表格设计中,注意掌握下列要点:

①〈TABLE 〉„〈TABLE 〉必须要包含整个表的定义;

② 在表格中的第一项是表的名称(captain )它是可有可无的;

③〈TR 〉„〈/TR〉标签定义的行的数目没有限制;

④在一行中, 使用

或者标签定义的数据单元数目也没有限制; ⑤表的每一个单元的属性可单独设置,因此表格的形式可以多种多样;

⑥数据单元中的内容可以是文字、数字,也可以是图标或者是两者兼有,而且还可以设置超级链接。

21, XML 的三个特征:可扩展性,结构化,有效性。xml 的特点:灵活性与简洁性,开放性与可扩展,使用性,高效性。

22,元数据是关于数据的数据,同时也是结构化的数据。它对信息资源进行描述和解释,促进信息资源的检索、管理和利用。元数据可以为各种形态的信息资源提供规范的描述方案和检索工具,为分布的、由多种信息资源组成的信息系统提供整合的工具和纽带。

23,元数据的功能:支持资源发现,组织数字信息资源,支持资源的互操作,支持数字识别和支持存档和保存。

24,都伯林核心元素的定义:资源名:赋予资源的名称,创建者:资源内容的主要责任者,日期:与资源本身生命周期中的一个事件相关的日期,资源标识符:在给定的文本环境中对资源的参照引用,类型:有关资源内容的特征和类型,形式,资源的物理或数字化的表现形式。覆盖范围:资源内容所涉及的外延与覆盖的范围。

25,每条MARC 记录分为四个区:头标区、目次区、数据区和记录结束符。

26,按照信息组织的级次分:参考数据库、源数据库

按照信息内容分:文献、事实、数值、多媒体

按照信息结构化程度分:隐含的模式信息、不规则的结构

27,数据集成子系统的功能是从各种数据源处收集数据并且给上层应用提供一个单一的、一致的关系数据库接口。由包裹器、映射器、抽象器基本组成模块。

1,信息组织的理论基础(系统论、耗散结构论、协同论)。

系统论:在信息组织中,如果将大量的、分散的、杂乱的信息组织成一个系统,建立起内在的关联性,那么信息系统的整体功能将大于各个信息单元的功能之和。也是就是说,这将能发挥信息资源的价值与作用。基于这一原理,信息组织的目标是建立信息系统。

耗散结构理论:所要建立的信息系统应该是一个开放的系统。现实存在的包括信息组织和信息检索在内的信息系统正是这样一个开放系统,它与外界进行着信息的交换,既采集信息也输出信息。

协同论:一个信息系统是由多个子系统构成的,建立各子系统之间的协同作用机制是非常重要的,这正是来自协同论的指导思想:无论什么系统从无序向有序的演化,都是大量子系统之间相互作用而又协同一致的结果。

2,自动标引技术可以分为自动主题标引技术和自动分类标引技术两大类,是信息组织自动化的基础。鉴于汉语的特性,自动分词更是中文信息计算机自动化处理的基础和前提。 3,自动分类标引是指由计算机代替人工对文献信息进行分类,赋予其分类标识,以描述文献主题内容的活动。按自动分类的实现途径进行划分,可将自动分类分为自动聚类和自动归类。

4,自动归类是指先分析待分类对象中的特征,将其与各种类别中对象具有的共同特征进行比较,再将待分类对象归入特征最近的一类并赋予其相应的分类号。自动归类根据使用的技术通常分为基于词的自动归类(词典法)和基于专家系统的自动分类(知识法)两大类。 5,自动聚类是指从待分类对象中提取特征,再将提取的全部特征进行比较并按一定原则将具有相同或相近特征的对象定义为一类,设法使各类中包含的对象大体相等。一般是在语词共现的基础上,通过词频统计和相似性比较加以聚类的。

6,自动主题标引是指由计算机自动确定语词标识来表达信息资源主题的过程,包括自动抽词标引和自动赋词标引两种基本形式。

7,自动抽词标引是指直接从原文中抽取词或短语作为标引词来描述信息资源的主题内容。它主要是从文献的正文、文摘或标题中直接选取标引词,利用该词再文献中出现的频率作为抽词程序的基础。

8,自动赋词标引是指由计算机从受控词表中自动选取词语来表达文献主题内容。分为基于关联词表的自动赋词标引和基于中介词典的自动赋词标引。

9,信息资源描述是指根据信息组织和检索的需要,对信息资源的内容特征和形式特征进行分析、选择和记录的活动。在传统文献组织检索系统的编制中,信息资源描述又被称为文献著录或书目著录。信息描述的结果,是描述记录或称为款目,亦即元数据。它是一种文献的缩影,可以用来作为信息资源的代替物组织检索系统。

10,信息资源的标引,也称文献标引,是指分析文献的内容属性(特征)及相关外表属性,并用特定语言表达分析出的属性或特征,从而富于文献检索标识的过程。

11,标引语言是表达文献主题概念和文献需求主题概念的简明性、单义性和关联性概念标识系统,是根据标引和检索的需要而编制的人工语言。标识的简明性,即标识的形式简洁、含义明确;标识的单义性,即标识与概念的唯一对应,排除了同义现象和多义现象;标识的关联性,即标识之间建立了联系,以反映概念之间的关系。

12,标引语言的类型:依据构成原理可将标引语言分为分类语言、主题语言、代码语言;依标识组合时间的先后,可将标引语言分为先组式语言、后组式语言和散组式语言。

13,中图法的基本序列,也称基本部类或部类,是分类法编制中为建立知识分类体系,对知识门类所进行的最概括、最本质的划分与排列,是确立基本大类的基础。基本序列是: 马克思主义、列宁主义、毛泽东思想、邓小平理论 哲学、宗教 社会科学总论 自然科学总论 综合性图书

14,基本大类,也称分类大纲,是分类法中划分的第一级类目,是在基本序列基础上展开的知识分类体系框架。基本大类都是传统的、稳定的、较为概括的学科或知识领域。分为22个大类。

A 马克思主义、列宁主义、毛泽东思想

B 哲学、宗教

C 社会科学总论

D 政治、法律

E 军事

F 经济

G 文化、科学、教育、体育

H 语言、文字

I 文学

J 艺术

K 历史、地理

N 自然科学总论

O 数理科学和化学

P 天文学、地理科学

Q 生物科学

R 医学、卫生

S 农业科学

T 工业技术

U 交通运输

V 航空、航天

X 环境科学、劳动保护科学(安全科学)

Z 综合性图书

15,体系分类法的宏观结构,即它的各个组成部分及其之间的组织方法、相互联系和作用的方式。它由分类表。编制说明和索引组成。分类表:也称类目表,它是根据类目之间的关系,按照一定的组织原则组织起来的类目一览表。分类表示分类法的主体,因此人们有时将分类表等同于分类法。编制和使用说明:一般是对分类表的编制目的和适用范围、编制原则、体系结构、辅助表、标记符号、注释等予以介绍和解释,以使人们对分类表有一个基本的、全面了解。索引:又称类目索引,它是一种按类名即类目相关概念名称子顺查找相应类号的类表辅助工具。

16,分类法的为微观结构,即类目的构成要素及其组织。类目(包括复分表的子目):是构成分类法的最基本要素,每个类目代表具有某种共同属性的文献集合。一个类目表是由类号、类名、类级、注释和参照组成的。类号:是类目的代号,也叫标记符号,决定类目在分类体系中的位置。文献经过分类标引之后,作为组织分类文献排架标识、组织分类检索工具的检索标识。类名:是类目的名称,用描述文献信息内容的术语直接或间接表达类目的含义和内容范围。类级:是类目的级别,在印刷排版中用排版的缩格和字体表示,代表该类目在分类体系中的等级(划分的层次)、显示类目间的等级关系。注释和参照:对类目的含义及内容范围、分类方法、与其他类目的关系等进行说明。

17,信息描述项目:用以揭示文献信息内容和形式特征的记录事项,也称为著录事项,是组成书目描述的基本单元。每个描述项目又由若干个元素组成。ISBD 规定了九个著录项目:题名与责任项、 版本项、文献特殊细节项、出版发行项、 载体形态项、丛编项、附注项

、文献标准编号及有关记载项、提要项。“. —”各大项前置符(每段起首除外) “=” 并列题名、并列责任者、并列版本说明等 “. ” 用于标识多卷集文献的分辑标识,不同责任者的集合题名等 “+ ”用于载体形态项的附件说明等。

18,关键词索引的类型:一类是带上下文的关键词索引,包括题内关键词索引、题外关键词索引、双重关键词索引;另一类是不带关键词的索引,包括单纯关键词索引、词对式关键词索引、简单关键词索引。

19,一个HTML 文档通常由文档头、文档名称、表格、段落和列表等组成。称为文档元素简称元素。它们是文本文档的基本构件,并且使用超文本标记语言规定的标签来标识这些元素。

20,在HTML 的表格设计中,注意掌握下列要点:

①〈TABLE 〉„〈TABLE 〉必须要包含整个表的定义;

② 在表格中的第一项是表的名称(captain )它是可有可无的;

③〈TR 〉„〈/TR〉标签定义的行的数目没有限制;

④在一行中, 使用

或者标签定义的数据单元数目也没有限制; ⑤表的每一个单元的属性可单独设置,因此表格的形式可以多种多样;

⑥数据单元中的内容可以是文字、数字,也可以是图标或者是两者兼有,而且还可以设置超级链接。

21, XML 的三个特征:可扩展性,结构化,有效性。xml 的特点:灵活性与简洁性,开放性与可扩展,使用性,高效性。

22,元数据是关于数据的数据,同时也是结构化的数据。它对信息资源进行描述和解释,促进信息资源的检索、管理和利用。元数据可以为各种形态的信息资源提供规范的描述方案和检索工具,为分布的、由多种信息资源组成的信息系统提供整合的工具和纽带。

23,元数据的功能:支持资源发现,组织数字信息资源,支持资源的互操作,支持数字识别和支持存档和保存。

24,都伯林核心元素的定义:资源名:赋予资源的名称,创建者:资源内容的主要责任者,日期:与资源本身生命周期中的一个事件相关的日期,资源标识符:在给定的文本环境中对资源的参照引用,类型:有关资源内容的特征和类型,形式,资源的物理或数字化的表现形式。覆盖范围:资源内容所涉及的外延与覆盖的范围。

25,每条MARC 记录分为四个区:头标区、目次区、数据区和记录结束符。

26,按照信息组织的级次分:参考数据库、源数据库

按照信息内容分:文献、事实、数值、多媒体

按照信息结构化程度分:隐含的模式信息、不规则的结构

27,数据集成子系统的功能是从各种数据源处收集数据并且给上层应用提供一个单一的、一致的关系数据库接口。由包裹器、映射器、抽象器基本组成模块。


相关内容

  • 注册信息系统审计师CISA简介
  • 注册信息系统审计师CISA简介 1.什么是注册信息系统审计师CISA认证 注册信息系统审计师(Certified Information System Auditor,简称CISA),也称IT审计师,是指一批专家级的人士,既通晓信息系统的软件.硬件.开发.运营.维护.管理和安全,又熟悉经济管理的核心 ...

  • 秘书资格证书专题教学大纲
  • 一 大纲说明  (一)课程性质和任务  秘书资格证书专题课程是中央广播电视大学开放教育试点汉语言文学专业本科阶段的选修课。使用的文字基本教材为《秘书职业技能鉴定培训教材》(中级)(曲克敏等主编,海潮出版社1999年2月第一次印刷出版发行),辅助教材有《中级秘书学习指导》、《秘书职业技能鉴定应试指南》 ...

  • 教研室年度工作计划及工作要点
  • 在上级部门和教育局的领导下,为进一步提高教育教学质量,使我县教育教学工作不断规范。特制定如下工作计划:   一、指导思想   按照《中国教育改革与发展纲要》、《关于基础教育改革与发展的决定》的要求,不断更新观念、开拓创新、积极探索实践,认真到基层学校进行调研。加强教育教学的研究、检查、指导等工作,特 ...

  • 网络工程师师认证考试
  • 网络工程师是什么 网络工程师是通过学习和训练,掌握网络技术的理论知识和操作技能的网络技术人员.网络工程师能够从事计算机信息系统的设计.建设.运行和维护工作.考试合格人员能根据应用部门的要求进行网络系统的规划.设计和网络设备的软硬件安装调试工作,能进行网络系统的运行.维护和管理,能高效.可靠.安全地管 ...

  • 2015年河北省体育艺术考生报考要点
  • 寻找最好的教育APP--中国教育APP测评报告 活动报名:移动互联时代教育机构如何再创业 在线教育高峰论坛:奔跑吧,在线教育! workshop:精英头脑风暴 跨界大咖聚焦教育 新浪2014中国教育盛典各大奖项投票中 2015年河北省体育.艺术考生报考要点周知 1.河北省普通高等学校体育教育.社会体 ...

  • 2011年广东省普通高考"英语听说"考试要求
  • 广东省2011年普通高考"英语听说"考试要求 广东省普通高考英语科考试从2011年开始分别进行笔试与听说考试.其中,听说考试占英语科总分(满分150分)的10%.笔试试卷考试时间调整为120分钟,试卷满分为135分. 一.考试范围与内容 (一)语言知识 要求考生掌握并能运用英语语 ...

  • 事业单位考试文秘事务试题
  • 一. 选择题(20分) 1.会场的大小要根据会议的(规模 )而定. A.性质 B.时间 C.规模 D.作用 2.会议签到工作是( 准确统计到会人数)的重要手段. A.准确统计到会人数 B.分发会议文件 C.联络感情 D.掌握会议报到动态 3.秘书要摆正自己与上级的位置,其基本原则是(兢兢业业,甘当无 ...

  • 电子政务考试要点
  • 电子政务考试内容梳理 名词解释: 1. 电子政务P6 电子政务是指各种公务机构通过广泛应用现代信息技术 ,推动政务活动方式的变革,提高行政效率,发展民主决策进程,向社会提供优质.规范.透明的管理与服务的过程与结果. 2. 自动化P20(这个仅供参考) 信息自动化就是计算机在信息处理领域自动识别.判断 ...

  • 黑龙江特岗教师招考[教育理论综合]全真模拟预测试卷(3)答案
  • 最全汇总>>>黑龙江教师资格考试信息 黑龙江特岗教师招考<教育理论综合>全真模拟预测试卷(3) 答案 通过近几年黑龙江教师招聘考试公告可知,黑龙江省教师招聘考试贯穿全年进行,笔试科目不太固定,一般以是教育理论综合知识和专业岗位综合知识考试内容为主.中公黑龙江教师考试网整 ...