结课大作业
信息组织与管理
学
学
专
生生业姓学班名 号 级 汪厚连 08580101 08信息管理1班
管理工程系
2011年6月7日
目录
1 根据第三章,分别用800字、500字、200字和120字概括第三章内容 ......................... 1
1.1 800字概括 ......................................................................................................... 1
1.1 500字概括 ......................................................................................................... 1
1.1 200字概括 ......................................................................................................... 2
1.1 120字概括 ......................................................................................................... 2
2 论述中途分类法的优缺点.............................................................................................. 2
2.1 缺点或不足 ........................................................................................................ 3
2.2 优点或优势 ........................................................................................................ 4
3 什么是Web2.0,Web2.0主要应用领域和发展方向是什么 ................................................ 4
3.1 Web2.0简介 ....................................................................................................... 4
3.2 Web2.0应用领域 ................................................................................................ 5
3.3 Web2.0发展方向 ................................................................................................ 5
4 中国分类主题词表和中国图书馆分类法的体系结构,并比较异同点............................... 6
4.1 中国分类主题词表体系结构................................................................................ 6
4.2 中国图书馆分类法体系结构................................................................................ 6
4.3 比较异同点 ........................................................................................................ 7
5 谷歌的使用技巧和EI以及SCI的使用方法 ................................................................... 7
5.1谷歌使用技巧 ..................................................................................................... 7
5.2 EI使用方法 ..................................................................................................... 10
5.3 SCI使用方法 ................................................................................................... 11 6 创立一个数字图书馆项目,系统架构,数字图书的主要大类,做可行性分析(人源,经济,
技术) ........................................................................................................................... 12
6.1 基于SOA的数字图书馆平台体系架构................................................................ 12
6.2 数字图书的主要大类 ........................................................................................ 14
6.3 可行性分析 ...................................................................................................... 15
1 根据第三章,分别用800字、500字、200字和120字概括第三章内容
1.1 800字概括
概括有从分类法的原理上,有信息分类检索的特点与需求,包括分类检索的意义,信息用户的差异,分类检索的类型,分类检索对分类法的基本需求;信息分类法的类型,包括不同处理对象的信息分类法,不同编制结构的信息分类法;信息分类法的结构原理,包括科学分类、学科分类、事物分类、知识分类,分类法的宏观结构;分类法结构与功能的关系。从分类法的编制上,有分类法编制的基本程序,包括分类法的功能分析与定位,系统用户需求调查与分析,分类体系设计,分类标记设计,分类法结构设计,分类法主表设计,分类法辅助分类体系设计,分类法辅助表设计,分类法索引设计,试标引与修订;分类体系的构建,类目的划分与排序,包括类目的设臵,类目的划分,分类标准的使用次序,类目与信息的排序;类目关系显示及交叉关系的处理,包括类目关系的显示,类目之间交叉关系的处理;类目注释,包括类目内容注释,类目关系注释,分类法注释,类目沿革注释;分类法的修订,包括分类法修订的形式,分类法修订的准备,分类法修订的主要方面和技术。从分类法的标记系统上,有分类法标记的功能与要求,包括分类标记的功能,分类标记的需求;分类法标记的类型,包括按组成成分划分的分类标记,按标记制度划分的分类标记;分类法标记系统的构建包括分类法的结构形式,分类法的功能,标记系统的辅助符号,配号方法。从《中国图书馆分类法》概述上,有《中图法》的历史发展,包括《中图法》编制的背景,《中图法》在修订中完善发展,《中图法》系列版本的形成,《中图法》走向分类主题一体化,《中图法》在我国图书馆和情报系统的应用,《中图法》的组织与原理,《中图法》的发展趋势;《中图法》的结构原理,包括《中图法》体系结构,《中图法》的复分表,《中图法》的类目仿分,《中图法》的标记系统;《中图法》的电子版,包括《中图法》电子版的功能设计,《中图法》电子版的数据格式,《中图法》电子版的功能和使用和《中图法》电子版评价。
1.1 500字概括
总结为分类检索的意义,信息用户的差异,分类检索的类型,分类检索对分类法的基本需求;不同处理对象的信息分类法,不同编制结构的信息分类法;科学分类、学科分类、事物分类、知识分类,分
类法的宏观结构;分类法结构与功能的关系。分类法的功能分析与定位,系统用户需求调查与分析,分类体系设计,分类标记设计,分类法结构设计,分类法主表设计,分类法辅助分类体系设计,分类法辅助表设计,分类法索引设计,试标引与修订;分类体系的构建,类目的设臵,类目的划分,分类标准的使用次序,类目与信息的排序;类目关系的显示,类目之间交叉关系的处理;类目内容注释,类目关系注释,分类法注释,类目沿革注释;分类法修订的形式,分类法修订的准备,分类法修订的主要方面和技术。分类标记的功能,分类标记的需求;按组成成分划分的分类标记,按标记制度划分的分类标记;分类法的结构形式,分类法的功能,标记系统的辅助符号,配号方法。《中图法》编制的背景,在修订中完善发展,系列版本的形成,走向分类主题一体化,在我国图书馆和情报系统的应用、组织与原理、发展趋势;体系结构、复分表、类目仿分、标记系统;《中图法》电子版的功能设计、数据格式、功能和使用和评价。
1.1 200字概括
归纳为从分类法的原理,有信息分类检索的特点与需求,信息分类法的类型,信息分类法的结构原理,分类法结构与功能的关系。从分类法的编制,有分类法编制的基本排序,分类体系的构建,类目的划分与排序,类目关系显示及交叉关系的处理,类目注释,分类法的修订。从分类法的标记系统,有分类法标记的功能与要求,分类法标记的类型,分类法标记系统的构建。从《中国图书馆分类法》概述上,有《中图法》的历史发展、结构原理、电子版。
1.1 120字概括
总结为从分类法原理,从分类法编制、基本排序,分类法构建,类目划分与排序、关系显示及交叉关系处理、注释和修订。从分类法标记系统,有分类法标记功能与要求、标记类型和分类法标记系统构建。从《中图法》概述,有《中图法》历史发展、结构原理以及电子版。
2 论述中途分类法的优缺点
《中图法》初版于1975 年,1999 年更新了第四版。从1975 年至2008 年,《中图法》在实践中应用了三十多年。图书分类法虽然连续更新了四个版本,但和其他技术理论一样,也需要随着客观世界的变化而继续改进。所以《中图法》作为图书分类专业的方法技术,依然有着可供改进的的余地。
2.1 缺点或不足
谈及不足方面可以有个人体会为例,在一次书业观察论坛上,有专业人士提出,现在动漫图书在排行榜上的归类十分混乱,对图书打榜形成了一定的影响。过后,笔者仔细观察了一下各类图书排行榜,包括开卷榜、网上书店排行榜、新华书店排行榜以及各类报纸上的图书排行榜,发现这些榜单分类五花八门,没有一个统一的分类标准。如此一来,导致的最直接的结果就是同一本书,在不同的榜单中被归为完全不同的类别。以《绝对小孩》为例,在开卷的细分榜上被归类于文学榜,但到了总榜却归为了非虚构类。这样,《绝对小孩》既要和文学类图书,如郭敬明的小说一起打细分榜,又要和于丹、易中天的作品打总榜。最让笔者匪夷所思的是,在卓越亚马逊网上,笔者看到《绝对小孩》竟与《20几岁决定女人的一生》、《人体使用手册》、《求医不如求己》等一起归入生活类图书榜。除此之外,在北京图书大厦,《绝对小孩》被归入了文学榜;而在各类报纸的图书排行榜上,归类就更乱,有的放在了生活类,有的放在了少儿类,每家报纸都有自己的标准。
分析上述现象的一些原因有如下事实:其实,图书分类混乱这个问题不仅仅出现在动漫图书中,其他图书也经常遇到此类问题。究其原因,是现在图书分类没有一个严格、统一的标准。据了解,《中国图书馆分类法》(以下简称《中图法》)是目前大部分图书排行榜和书店卖场图书分类的基础,但这些年来,图书的出版数量、内容、表现形式等都发生了很大的变化,而《中图法》还是一成不变,已不适应行业的发展。另外,《中图法》的主体对象是图书馆使用,而排行榜与书店卖场的主体对象是图书的营销。在目标群体上,前者主要是针对理论学习研究,后者则是为满足消费者 的生活与工作需求。由此看出,实际应用中的图书分类与《中图法》存在不同程度的差异。事实上,各级书店卖场、网上书店以及图书排行榜的图书分类法,目前都 是以《中图法》为基础,根据自己的习惯与实际需求进行改造的,从而形成自己的营销分类体系,很少有完全搬用《中图法》的。但因为大家都各自为战,所以各自 的分类标准差别很大,从而就形成了今天我们看到的百花齐放的局面。
据了解,开卷在2004年推出了自己的分类体系,共700多个类别,这套分类体系在很大程度上从中图法中脱离出来,它开始把生活、青春文学、心理自助、大 众社科等概念变成能够进行分类操作的正
式类别。当当网也是以《中图法》为基础,根据自身架构、图书内容、当当网用户的年龄结构等再进行图书分类。目前当当 网的图书畅销榜有42个细分类。
2.2 优点或优势
下面就谈谈《中国图书馆分类法》(以下简称《中图法》)的优点所在和需要完善的一些地方,中图法顾名思义就是针对中国的图书馆进行分门别内的一种专门方法,适合所用中国人自己使用。在很多方面我们是取之西方又区别于西方的分类法,柔和西方先进思维方法达到为我所用的目的。仍然就上述问题进行阐述,在使用了中图法以后我们可以很轻易的找到自己所用查找的书目。
大家之所以关心排行榜,是因为从榜单上可以看出图书在市场上、在终端读者中的反应,从而可以对作者、出版者产生正确的指导。出版商可以根据榜单来了解各地 的销售信息,以及不同地区对同一本图书产生的不同反应,以调整自己的营销策略。同时还可以了解各门类的市场情况是怎样的,哪类书受欢迎、哪类书被冷落、出 现了什么新的图书热点。对于读者而言,现在图书品种很多,而如何选择图书,榜单可以起到一定的指导作用,可以影响到读者的偏好。如果榜单不科学,以上这些 就会产生偏差。而对于书店卖场,图书分类主要是服务于上架和导购,如果分类不科学,最直接的影响就是读者找不到所需图书。据了解,有些书店把《绝对小孩》归入艺术类,而 在卖场中,艺术类一般都会被安排在较高楼层上,客流较小,处于曲高和寡的境地。这样一来,自然就会对其销售产生很大的影响。另外,图书分类不统一,会对书 店卖场在采购、对接、图书上架等工作环节上产生影响。如果有一个科学合理的分类,不仅能帮助读者更快、更准确地找到其所需的图书,还能促进相关图书的销 售。所以书店的上架分类,既要考虑店员上架方便、内部管理方便,更要考虑顾客找书的方便和增加更多的购买可能。为了保障图书分类科学以及上架的准确,现在 很多出版社都在图书的封底印有上架建议。望相关组织机构制定完善的图书分类的行业标准,这是大家共同的认识。 3 什么是Web2.0,Web2.0主要应用领域和发展方向是什么
3.1 Web2.0简介
Web2.0,是相对Web1.0(2003年以前的互联网模式)的新的一类互联网应用的统称,是一次从核心内容到外部应用的革命。由Web1.0单纯通过网络浏览器浏览html网页模式向内容更丰富、联系
性更强、工具性更强的Web2.0互联网模式的发展已经成为互联网新的发展趋势。
Web1.0到Web2.0的转变,具体的来说,可以从模式上是单纯的“读”向“写”、“共同建设”发展;由被动地接收互联网信息向主动创造互联网信息迈进!从基本构成单元上,是由“网页”向“发表/记录的信息”发展;从工具上,是由互联网浏览器向各类浏览器、rss阅读器等内容发展;运行机制上,由“Client Server”向“Web Services”转变;作者由程序员等专业人士向全部普通用户发展;应用上由初级的“滑稽”的应用向全面大量应用发展。
总之,Web2.0是以 Flickr、Craigslist、Linkedin、Tribes、Ryze、 Friendster、Del.icio.us、43Things.com等网站为代表,以Blog、TAG、SNS、RSS、wiki等应用为核心,依据六度分隔、xml、ajax等新理论和技术实现的互联网新一代模式。
3.2 Web2.0应用领域
Web2.0的应用领域还是比较广泛的,它可以广泛运用于电子商务、电子政务、开放网络以及企业服务等。
3.3 Web2.0发展方向
谈及Web2.0的未来发展方向,可谓仁者见仁智者见智,我们可以从以下几个方面探讨Web2.0 的未来发展方向。在WEB 2.0时代,个体用户的价值得到了最大的体现,众多的网民既是信息创造者和信息传播渠道,同时也是信息的受众。新闻采播不再是小部分专业人士的特权,任何接触新闻事件的人员都可以以自己的视角来观察和报道新闻事件,并且数码摄像机与录像机的普及为大众采编新闻提供了设备基础,内容制作者将细分为数据、图像、多媒体等不同类型。网民主动地选择信息,信息主动去寻找合适的用户。通过RSS等定制化阅读器,网民可以过滤掉不感兴趣的多余信息,只关注自己感兴趣的信息。传统媒体逐渐成为个性化网络媒体的后台。
由WEB 1.0通过浏览器浏览html网页,向内容更丰富、互动性、个性化更强的WEB 2.0模式发展已经是互联网新的发展趋势。现有的博客、播客、个人门户、网络互动杂志、互动搜索等等都已经体现了这种趋势。而随着技术的进一步发展,网络媒体逐渐分成表现层和基础层,现有的WEB 2.0网络媒体形态将占据表现层的主体,媒体表现形式上由文字加图片走向音、视频。博客与播客将走向融合,个人网络空间概念进一步得到增强,互联网不仅仅是人们工作和生活的工
具,而是变成生活的一部分,个人网络空间即网民在互联网上的生存形态,通过SNS形成众多小的群体,而社区论坛则成为个人网络聚集地,互动搜索成为联系各种群体之间的纽带。虽然现有的传统媒体和门户网站向基础层转变,但是作为大众传媒,传统媒体的权威性仍然不会降低,传统媒体和门户网站仍然发挥着重要的作用。
4 中国分类主题词表和中国图书馆分类法的体系结构,并比较异同点
4.1 中国分类主题词表体系结构
《中国分类主题词表》(以下简称《中分表》)体系结构:《中分表》是从我国文献检索语言实际情况出发,选择了“分类法——主题词表对照索引”式的一体化体系。这种体系既不是单纯分类法的等级学科体系,也不是单纯的叙词字顺体系,而是二者相互对照、相互融合、互相索引的一体化结构。
主窗体通过自动显示滚动条来控制浏览所有子窗体。子窗体是主窗体的主要结构,由三个文档构成,包括“分类号—主题词对应表”文档,窗口标题简称为“分类表”;“主题词—分类号对应表”文档,窗口标题简称为“主题表”;“词族表”文档,窗口标题简称“词族表”。电子版还提供一个在形式上与印刷本基本相同的但不属于子窗体形式的“浏览表”窗体,窗口标题简称为“浏览表”,包括“分类号—主题词对应表”和“主题词—分类号对应表”。两种窗体可相互辅助,也可以独立使用。
《中分表》电子版不仅可用于文献信息资源网络标引,还可用于文献信息资源网络检索平台。概括而言,具备以下功能特点:(1)分类主体一体化辅助索引的功能。(2)基于内容的一体化标识的检索功能。(3)自然语言检索功能。(4)易用性、辅助性性能。(5)分类目录检索系统和分类目录主题索引、主题目录检索系统和主题目录分类索引的功能。(6)评注、记忆功能。
4.2 中国图书馆分类法体系结构
《中国图书馆分类法》(以下简称《中图法》)体系结构:(1)《中图法》最初是面向各类图书馆情报机构,以印刷型文献为主要对象的分类工具,为全国文献统一分类编目,实现数目数据共享创造条件。《中图法》应当有囊括人类一切知识领域的知识体系;具有满足大型综合性图书情报机构使用的类目体系,同时又兼顾不同规模和不同专业图书情报机构的需要;有详略不同、专业不同、针对文献类型不同、载体不同的版本,以满足各种文献信息分类整序的需要。(2)
《中图法》以自然科学、社会科学、哲学作为人类知识领域的基本构成建立基本序列。并将作为社会主义分类法编制指导思想的“马克思主义、列宁主义、毛泽东思想、邓小平理论”和结合文献特殊性设臵的“综合性图书”作为部类,形成五个部类的基本序列。(3)《中图法》的宏观结构包括:编制说明、基本大类表、基本类目表、主表、附表、字顺索引、使用手册等,这些部分共同构成《中图法》的整体。微观结构包括:类目是构造分类法的最基本要素,每个类目代表具有某种共同属性的文献集合。《中图法》的类目结构由类号、类名、类级、注释和参照组成。
4.3 比较异同点
二者都是作为一种检索方式用于用于检索自己所需要的信息,都有自己的电子版供用户使用检索。不同点则在于他们各自的体系结构和功能实现上,《中分表》有几种一体化体系结构,还可用于信息资源网络检索平台,而《中图法》需要满足各种不同的需要和用户的需要,并且每个学科门类编制结构又会有统一的规定。
5 谷歌的使用技巧和EI以及SCI的使用方法
5.1谷歌使用技巧
Google检索引擎因其准确和快速的检索服务而深受广大网民欢迎,成为人们手中查询信息的必备工具,Google检索引擎本身也不辜负网民的期望,不断推出新的检索功能,除了为帮助人们更精确查找信息而常用的网站内容(site)、网页链路(inurl)、网页标题
(intitle)、各种格式文件 (filetype)和被链接(link)等检索功能之外,最近,还推出了一系列新的检索服务,总体来说,这些新的检索功能更加人性化,更贴近人们的日常 生活和需要,因而很容易被用户接受和使用。
1、汉语拼音输入检索
为了方便使用中文的用户在网上搜索,Google允许用户直接在键盘上输入汉语拼音来检索相关事物,例如:
输入 shanghaishikebiao
检索结果提示:您是不是要找:上海时刻表
这正是我们需要查找的关键词,用户可以据此浏览相关结果,这包括上海地区的各种交通工具的时刻表。如果需要查找更详细的资料“上海飞机航班时刻表”,则只要在原来的检索结果“上海时刻表”中间输入feijihangban,例如:上海feijihangban时刻表。
Google的这项新功能,可以免除用户在中文和拼音输入方面的互相转换。用户在输入拼音时,不要留有空格,否则Google会误认为英文。Google把拼音与常用的字或者词组一一对应,因此,过于生僻的字或词组不适合于用这个方法查找。
2、中英文字典
经常使用计算机的用户手头上自然会有一、两个字典软件,用于查找和翻译中英文的词义。作为一种使用频率较高的工具,Google也提供了一个中英文字 典,很方便使用。用户可以按照下列方法查找词义查找英文的中文词义则输入fycomputer 查找中文的英文词义则输入翻译计算机
3、天气查询
天气情况也是人们经常要查询的信息之一,Google 提供的天气查询来自于一个更新及时的中文气象网站,适合中国人使用。用户输入中文和英文都可以查询,例如要了解奥运会期间雅典的天气情况,可以按照下列方法输入:
雅典天气athens tq 返回的查询结果中会在第一条出现一个 “雅典天气预报”,用户点击后就可以看到当天雅典的天气情况。如果地名相同者,用户还需要进行一次选择。
4、股票查询
查询股票的网站已经很多了,Google提供的股票查询只是更方便一些而已,用户可以按照股票名称、股票代码或者股票名称的声母字母查询,下列为查询“中国联通”股票行情的举例。
中国联通 股票 zglt gp
gp 600050
5、邮政编码和区号查询
人们时常需要查询邮政编码和电话区号,Google提供了这样一个实用的功能,用户据此能够获得所要查询的省市名称,邮政编码及长途电话区号,下面为查询举例:
邮编 杭州
区号 绍兴
yb杭州
qh绍兴
需要注意的是用户只能查询到城市级别的邮政编码和区号,而无法进一步查询区县的具体信息。
6、手机归属地查询
用户在输入手机号码后可以获得号码段、归属地、卡类型、邮政编码和电话区号的信息,但是从实用的角度看,其中只有手机归属地的信息较为有用。
7、计算器使用
Google有计算器的功能,例如在google检索框中输入45*86+35/7,就会得到结果:
(45 * 86) + (35 / 7) = 3 875
有兴趣的用户,或者经常在计算机上进行运算的用户不妨可以试一试。
8、购物检索
Google新开设的购物检索称之为Froogle,网址为http://Froogle.google.com/
用户只要输入商品的名称,就可以看到该商品的图片和价格,用户还可以限定一种商品的价格进行检索,并且将检索结果按需要从高价到低价排序列出,许多商品可以直接在网上订购,这种图文并茂的检索购物方式较受用户青睐。
9、美国实用生活信息查询
如果用户生活在美国或者短期去美国出差和学习,下面的查询功能或许能对他们又帮助,因为这些检索服务目前仅限于美国。
9.1 地区代码查询
用户输入美国的地区代码,在返回的检索结果中的第一项就是该地区的地图,用户可以通过不断的点击来找到一条具体的大街。
9.2 条形码查询
用户输入一个商品的条形码就可以找到有关该产品的说明。
9.3 飞机航班查询
用户输入一家航空公司的名称和航班号,即可获得该航班的出发地和目的地,起飞和到达时间,以及实际航行情况,目前是否开始检票,抵达目的地候机大楼的舱门号。
9.4 车牌号查询
用户输入车牌号,可以获得一辆车的名称、型号、出厂年份,车身和发动机情况。
9.5 邮件查询
用户输入一个邮件的号码,可以获悉该邮件目前的状况,譬如邮
件已经抵达或者正在路途上等。
10、检索工具栏
Google的检索工具栏功能强大,有拖放和右击检索功能,新闻阅读,广告拦截,网站排名显示和搜索字词标明等,工具栏可以附在浏览器下,使用更加方 便。用户可以首先在Google网站下载并安装一个检索工具栏,然后根据需要在工具栏的选项中进行设臵,我们推荐用户使用这个检索工具栏,它将给用户带来 许多意想不到的方便。 10.1 Google 新闻
Google 的新闻来源于4500家报刊杂志和通讯社,在精选以后持续播出世界各国的新闻,每条新闻都有更新的时间,并联接相关的新闻。用户可以使用免费的新闻通知服务,通过电子邮件收到自己感兴趣的新闻。
10.2 网站排名
Google 通过对 Web 链接结构和许多其它变量自动计算,对网页的重要程度进行评定。网站排名根据这个评定能够显示用户正在访问的网站的重要程度,用一根绿色线条显示,直观而明确。 10.3 搜索字词标明
搜索字词标明通过鲜艳的色彩标明用户所检索的字词在每个网页上的位臵,便于用户查阅,单击“搜索字词标明”按钮可以打开和关闭标明状态。
10.4 拖放和右击检索
拖放检索功能使检索更为方便,用户可以把在网页上所选取的字词直接拖放到检索框中,Google会自动进行检索。对于与 Web浏览器同时运行的许多 文字处理应用程序中的文字,也可以使用此功能。右击检索是指用户可以在网页上选取文字后,右击鼠标,然后从弹出式菜单中选择“Google 搜索”便可以 自动检索。
Google搜索引擎为我们提供了搜索的方便,她正在不断推出新的服务功能,例如为移动电话特别设计的无线搜寻等,相信随着技术的不断发展,我们会从中享受更多的搜索乐趣。
5.2 EI使用方法
EI,即《工程索引》(The Engineering Index,简称EI),创刊于1884年,由Elsevier Engineering Information Inc.编辑出版。主要收录工程技术领域的论文(主要为科技期刊和会议录论文),数据覆盖了核技术、生物工程、交通运输、化学和工艺工程、照明和
光学技 术、农业工程和食品技术、计算机和数据处理、应用物理、电子和通信、控制工程、土木工程、机械工程、材料工程、石油、宇航、汽车工程等学科领域。具体使用方法还是用实例来说明,例子:检索医学领域中含有"pipe"的文献。如果仅仅用"pipe"检索在所有字段中检索,会命中4万多条记录;即使同时限制在TITLE中检索,结果也有1万多条,数据冗余太大。这时,可以考虑从学科的角度进行限制检索:
先检索到从Ei Thesaurus中检索医学类目:
Medicine:461.6, Medical care:461.7, Medical imaging:461.1,Medical problems,
Medical supplies:462.1,Medical computing:723.5,Medical diagnosis, Medical education, Medical equipment,Medical monitoring:462.2
利用"Expert Search":(461.1 wn CL OR 461.6 wn CL OR 461.7 wn CL OR 462.1 wn CL OR 723.5 wn CL) AND (pipe wn TI) 命中500多条记录,因723.5类与计算机应用有关,命中记录中有许多看不出是与医学有关的,可以考虑将该类去掉检索,结果就比较令人满意。
5.3 SCI使用方法
SCI, 即《科学引文索引》(Science Citation Index),是自然科学领域基础理论学科方面的重要的期刊文摘索引数据库。它创建于1961年,创始人为美国科学情报研究所所长Eugene
Garfield(1925.9.15)。利用它,可以检索数学、物理学、化学、天文学、生物学、医学、农业科学以及计算机科学、材料科学等学科方面自 1945年以来(我馆购买了1994年至今的数据使用权)重要的学术成果信息;SCI还被国内外学术界当做制定学科发展规划和进行学术排名的重要依据。这里也用具体实例说明使用方法:利用SCI数据库检索周远翔老师的论文收录情况
作者的文献(文章或报告)共有104篇,在这些文章中,他的合作者包括以下八人:N. Yoshimura, 关志成,H. Katoh, 严萍,梁曦东,李光范,M. Nifuku, Atsushi Satake
构建检索式:(zhou yx or yunxiang z) and (Yoshimura n or guan zc or zhicheng g or Katoh h or yan p or ping y or liang xd or xidong l or li gf or guangfan l or Nifuku m or Satake a or Atsushi
S)在AUTHOR字段中输入上述检索式,命中9条记录。与作者提供的论文核对后发现:这9条记录全是作者本人的论文。还有几篇文献是作者单独完成的,对于这些文献,需要单独处理。
6 创立一个数字图书馆项目,系统架构,数字图书的主要大类,做可行性分析(人源,经济,技术)
6.1 基于SOA的数字图书馆平台体系架构
数字图书馆平台需要将各业务系统融和成为一个有机整体;同时作为一个工作平台,需要将日 常生产管理中形成的各种知识文档集中存储,便于查询和传递,达到建成知识化数字图书馆的目的。因此,要求数字图书馆平台系统框架具有很强的扩展性和定制 性。因此数字图书馆平台是应用面向服务的架构体系,以网络技术为支撑,辅以大规模数据库技术、分布式处理技术、商业智能、智能决策支持系统、Agent代 理和语义Web等技术所支持的数字图书馆资源管理系统,是未来数字图书馆的资源管理模式。
数字图书馆平台需要支持数字图书馆信息资源的“存→理→传→找→用”等整个生命周期的活 动。构建数字图书馆平台体系结构需要考虑的主要因素包括:集成性、可靠性、可扩展性;内容管理;数字图书馆之间及数字图书馆内部的协作性;智能技术的应 用,包括商业智能与智能决策、语义Web、智能代理等。
在传统数字图书馆平台架构基础上,根据以上需考虑的因素,应用SOA基础架构,融合智能 技术,构建基于SOA的数字图书馆平台的三层体系架构。这种三层架构如图7所示:最底层是数据层,包括所有数字图书馆应用系统服务的结构化与非结构化的数 据内容;中间层是面向服务的应用层,它集成数字图书馆的各应用系统,利用SOA架构,将底层数据的异构和分布结构屏蔽,并无缝内嵌到SOA层中,提供清晰 明确的统一视图和接口;最上层是应用工具,它能够提供用户所需的智能和服务,让用户便捷、高效的实现各种应用。在这种三层结构中,各层的主要构成模块如下 所述:
表示层
数字图书馆平台的表示层主要负责与数字图书馆用户以及商业伙伴之间的相互 交互,包括内外部网站、办公交流平台;在数字图书馆平台里所有的数据交换都通过XML格式进行,这些数据由表示层负责翻译成外部浏览者(HT2ML),无 线设备(WAP,Mobile)等可以理解的格式。这层包括门户Web应用、智能代理、商务智能等,以
及门户的各种功能Portlet。
通过商务智能、智能决策和智能代理把从不同业务系统中发掘出的知识以最恰当的方式表示出 来,为数字图书馆的决策者提供决策依据。数字图书馆平台通过门户PortLet、智能代理等为终端用户提供个性体验,提供定制内容和页面外观及版式的表现 形式,还可利用相应的工具,使主题专家可以编制个性化的内容,满足数字图书馆平台系统各个访问者的需求和兴趣。在这个层面通过对知识的分类和权限规划,将 基于浏览器的应用按照规则统一界面入口,并实现数字图书馆平台、部门门户和个人门户的多级需求,建立统一访问的界面规则和风格。
SOA应用层。
基于SOA数字图书馆应用集成是数字图书馆平台体系架构的首要问 题,包括数字图书馆应用系统服务的整合、资源的整合等内容。在数字图书馆平台中,基于SOA将数字图书馆的各种业务应用系统、工作流程等无缝整合,使数字 图书馆平台具备可扩展性,可以在系统中随时增加业务功能模块,使数字图书馆的前期投资可以被无限利用。基于SOA的数字图书馆平台整合主要包括业务流程的 整合以及数字图书馆应用服务及数字资源的整合。
在这种基于SOA的数字图书馆平台架构中,可以用一个服务替换另一个服务而无须关心其底 层的实现技术,唯一要考虑的就是服务接口,而它采用了通用的Web服务和XML标准。因此,可以在不牺牲同构环境的传统价值(即管理、安全性、可靠性、伸 缩性和性能)的情况下,提供将底层服务实现无缝地重新部署到其他技术、地理或组织领域的能力。它可以对数字图书馆的业务流程进行监控管理,对业务过程实时 数据进行分析计算,建立与完善过程监视、在线性能计算、可靠性管理、生产综合查询;实现运行优化指导和优化支持;结合历史数据和理论模型及专家经验,形成 对数字图书馆运行的决策支持,实现管理层与控制层的集成,同时也为上层应用提供统一的数据平台。采用SOA架构开发、配臵和管理的应用程序令数字图书馆拥 有更大的自主性和灵活度,基于SOA的数字图书馆应用与流程整合,数字图书馆所有的内容都被集成到一起。新的网络服务、应用程序更加简约、高效,对市场变 化能及时做出反应,并最终成为数字图书馆核心竞争力的一部分。
数据层。
数据层由数字图书馆知识库组成。利用知识挖掘管理工具,对数字图书馆的所 有数据资源进行多维分析,汲取有价值的数据信息,并采用关联规则及神经网络等挖掘算法,不仅挖掘各种结构化和非结构化知识文档和数据,而且包括相关的管理 组织、流程、管理制度,以及知识管理的方式与方法等,分类、分级进行组织管理,构建数字图书馆级知识库,并通过相应的管理手段保证其运行。
数字图书馆知识库包含着数字图书馆的事实、文档的元数据,以及描述事实和元数据结构的本 体,即本体知识库与实例知识库。知识库中存储了大量不同类型的结构化和非结构化知识,其主要的内容是本体、事实知识和文档表示。事实与概念被储存在一个关 系数据库中,不过,它们是以一种具象化格式被储存的。这种格式将关系和概念视为最重要的客体对象,因此,它在改变与修订方面非常灵活。系统中的组件是以存 储在知识库中的知识为中心而进行的。
6.2 数字图书的主要大类
A 马克思主义、列宁主义、毛泽东思想、邓小平理论
B 哲学
C 社会科学总论
D 政治、法律
E 军事
F 经济
G 文化、科学、教育、体育
H 语言、文字
I 文学
J 艺术
K 历史、地理
N 自然科学总论
O 数理科学和化学
P 天文学、地球科学
Q 生物科学
R 医药、卫生
S 农业科学
T 工业技术
U 交通运输
V 航空、航天
X 环境科学、劳动保护科学(安全科学)
Z 综合性图书
6.3 可行性分析
此方案从人源角度分析,需要一批精通计算机软硬件熟悉的专业人士,对好懂得云计算知识对本项目有积极帮助,所以在这看来人源最为重要。
此方案从经济角度分析,需要的前期投入资金估计30万足够,主要用于购买电脑方面的服务配臵以及软硬件资源。
此方案从技术角度分析,设计相当多的电脑技术,专业人士对此项目的帮助实现是很至关重要的。
结课大作业
信息组织与管理
学
学
专
生生业姓学班名 号 级 汪厚连 08580101 08信息管理1班
管理工程系
2011年6月7日
目录
1 根据第三章,分别用800字、500字、200字和120字概括第三章内容 ......................... 1
1.1 800字概括 ......................................................................................................... 1
1.1 500字概括 ......................................................................................................... 1
1.1 200字概括 ......................................................................................................... 2
1.1 120字概括 ......................................................................................................... 2
2 论述中途分类法的优缺点.............................................................................................. 2
2.1 缺点或不足 ........................................................................................................ 3
2.2 优点或优势 ........................................................................................................ 4
3 什么是Web2.0,Web2.0主要应用领域和发展方向是什么 ................................................ 4
3.1 Web2.0简介 ....................................................................................................... 4
3.2 Web2.0应用领域 ................................................................................................ 5
3.3 Web2.0发展方向 ................................................................................................ 5
4 中国分类主题词表和中国图书馆分类法的体系结构,并比较异同点............................... 6
4.1 中国分类主题词表体系结构................................................................................ 6
4.2 中国图书馆分类法体系结构................................................................................ 6
4.3 比较异同点 ........................................................................................................ 7
5 谷歌的使用技巧和EI以及SCI的使用方法 ................................................................... 7
5.1谷歌使用技巧 ..................................................................................................... 7
5.2 EI使用方法 ..................................................................................................... 10
5.3 SCI使用方法 ................................................................................................... 11 6 创立一个数字图书馆项目,系统架构,数字图书的主要大类,做可行性分析(人源,经济,
技术) ........................................................................................................................... 12
6.1 基于SOA的数字图书馆平台体系架构................................................................ 12
6.2 数字图书的主要大类 ........................................................................................ 14
6.3 可行性分析 ...................................................................................................... 15
1 根据第三章,分别用800字、500字、200字和120字概括第三章内容
1.1 800字概括
概括有从分类法的原理上,有信息分类检索的特点与需求,包括分类检索的意义,信息用户的差异,分类检索的类型,分类检索对分类法的基本需求;信息分类法的类型,包括不同处理对象的信息分类法,不同编制结构的信息分类法;信息分类法的结构原理,包括科学分类、学科分类、事物分类、知识分类,分类法的宏观结构;分类法结构与功能的关系。从分类法的编制上,有分类法编制的基本程序,包括分类法的功能分析与定位,系统用户需求调查与分析,分类体系设计,分类标记设计,分类法结构设计,分类法主表设计,分类法辅助分类体系设计,分类法辅助表设计,分类法索引设计,试标引与修订;分类体系的构建,类目的划分与排序,包括类目的设臵,类目的划分,分类标准的使用次序,类目与信息的排序;类目关系显示及交叉关系的处理,包括类目关系的显示,类目之间交叉关系的处理;类目注释,包括类目内容注释,类目关系注释,分类法注释,类目沿革注释;分类法的修订,包括分类法修订的形式,分类法修订的准备,分类法修订的主要方面和技术。从分类法的标记系统上,有分类法标记的功能与要求,包括分类标记的功能,分类标记的需求;分类法标记的类型,包括按组成成分划分的分类标记,按标记制度划分的分类标记;分类法标记系统的构建包括分类法的结构形式,分类法的功能,标记系统的辅助符号,配号方法。从《中国图书馆分类法》概述上,有《中图法》的历史发展,包括《中图法》编制的背景,《中图法》在修订中完善发展,《中图法》系列版本的形成,《中图法》走向分类主题一体化,《中图法》在我国图书馆和情报系统的应用,《中图法》的组织与原理,《中图法》的发展趋势;《中图法》的结构原理,包括《中图法》体系结构,《中图法》的复分表,《中图法》的类目仿分,《中图法》的标记系统;《中图法》的电子版,包括《中图法》电子版的功能设计,《中图法》电子版的数据格式,《中图法》电子版的功能和使用和《中图法》电子版评价。
1.1 500字概括
总结为分类检索的意义,信息用户的差异,分类检索的类型,分类检索对分类法的基本需求;不同处理对象的信息分类法,不同编制结构的信息分类法;科学分类、学科分类、事物分类、知识分类,分
类法的宏观结构;分类法结构与功能的关系。分类法的功能分析与定位,系统用户需求调查与分析,分类体系设计,分类标记设计,分类法结构设计,分类法主表设计,分类法辅助分类体系设计,分类法辅助表设计,分类法索引设计,试标引与修订;分类体系的构建,类目的设臵,类目的划分,分类标准的使用次序,类目与信息的排序;类目关系的显示,类目之间交叉关系的处理;类目内容注释,类目关系注释,分类法注释,类目沿革注释;分类法修订的形式,分类法修订的准备,分类法修订的主要方面和技术。分类标记的功能,分类标记的需求;按组成成分划分的分类标记,按标记制度划分的分类标记;分类法的结构形式,分类法的功能,标记系统的辅助符号,配号方法。《中图法》编制的背景,在修订中完善发展,系列版本的形成,走向分类主题一体化,在我国图书馆和情报系统的应用、组织与原理、发展趋势;体系结构、复分表、类目仿分、标记系统;《中图法》电子版的功能设计、数据格式、功能和使用和评价。
1.1 200字概括
归纳为从分类法的原理,有信息分类检索的特点与需求,信息分类法的类型,信息分类法的结构原理,分类法结构与功能的关系。从分类法的编制,有分类法编制的基本排序,分类体系的构建,类目的划分与排序,类目关系显示及交叉关系的处理,类目注释,分类法的修订。从分类法的标记系统,有分类法标记的功能与要求,分类法标记的类型,分类法标记系统的构建。从《中国图书馆分类法》概述上,有《中图法》的历史发展、结构原理、电子版。
1.1 120字概括
总结为从分类法原理,从分类法编制、基本排序,分类法构建,类目划分与排序、关系显示及交叉关系处理、注释和修订。从分类法标记系统,有分类法标记功能与要求、标记类型和分类法标记系统构建。从《中图法》概述,有《中图法》历史发展、结构原理以及电子版。
2 论述中途分类法的优缺点
《中图法》初版于1975 年,1999 年更新了第四版。从1975 年至2008 年,《中图法》在实践中应用了三十多年。图书分类法虽然连续更新了四个版本,但和其他技术理论一样,也需要随着客观世界的变化而继续改进。所以《中图法》作为图书分类专业的方法技术,依然有着可供改进的的余地。
2.1 缺点或不足
谈及不足方面可以有个人体会为例,在一次书业观察论坛上,有专业人士提出,现在动漫图书在排行榜上的归类十分混乱,对图书打榜形成了一定的影响。过后,笔者仔细观察了一下各类图书排行榜,包括开卷榜、网上书店排行榜、新华书店排行榜以及各类报纸上的图书排行榜,发现这些榜单分类五花八门,没有一个统一的分类标准。如此一来,导致的最直接的结果就是同一本书,在不同的榜单中被归为完全不同的类别。以《绝对小孩》为例,在开卷的细分榜上被归类于文学榜,但到了总榜却归为了非虚构类。这样,《绝对小孩》既要和文学类图书,如郭敬明的小说一起打细分榜,又要和于丹、易中天的作品打总榜。最让笔者匪夷所思的是,在卓越亚马逊网上,笔者看到《绝对小孩》竟与《20几岁决定女人的一生》、《人体使用手册》、《求医不如求己》等一起归入生活类图书榜。除此之外,在北京图书大厦,《绝对小孩》被归入了文学榜;而在各类报纸的图书排行榜上,归类就更乱,有的放在了生活类,有的放在了少儿类,每家报纸都有自己的标准。
分析上述现象的一些原因有如下事实:其实,图书分类混乱这个问题不仅仅出现在动漫图书中,其他图书也经常遇到此类问题。究其原因,是现在图书分类没有一个严格、统一的标准。据了解,《中国图书馆分类法》(以下简称《中图法》)是目前大部分图书排行榜和书店卖场图书分类的基础,但这些年来,图书的出版数量、内容、表现形式等都发生了很大的变化,而《中图法》还是一成不变,已不适应行业的发展。另外,《中图法》的主体对象是图书馆使用,而排行榜与书店卖场的主体对象是图书的营销。在目标群体上,前者主要是针对理论学习研究,后者则是为满足消费者 的生活与工作需求。由此看出,实际应用中的图书分类与《中图法》存在不同程度的差异。事实上,各级书店卖场、网上书店以及图书排行榜的图书分类法,目前都 是以《中图法》为基础,根据自己的习惯与实际需求进行改造的,从而形成自己的营销分类体系,很少有完全搬用《中图法》的。但因为大家都各自为战,所以各自 的分类标准差别很大,从而就形成了今天我们看到的百花齐放的局面。
据了解,开卷在2004年推出了自己的分类体系,共700多个类别,这套分类体系在很大程度上从中图法中脱离出来,它开始把生活、青春文学、心理自助、大 众社科等概念变成能够进行分类操作的正
式类别。当当网也是以《中图法》为基础,根据自身架构、图书内容、当当网用户的年龄结构等再进行图书分类。目前当当 网的图书畅销榜有42个细分类。
2.2 优点或优势
下面就谈谈《中国图书馆分类法》(以下简称《中图法》)的优点所在和需要完善的一些地方,中图法顾名思义就是针对中国的图书馆进行分门别内的一种专门方法,适合所用中国人自己使用。在很多方面我们是取之西方又区别于西方的分类法,柔和西方先进思维方法达到为我所用的目的。仍然就上述问题进行阐述,在使用了中图法以后我们可以很轻易的找到自己所用查找的书目。
大家之所以关心排行榜,是因为从榜单上可以看出图书在市场上、在终端读者中的反应,从而可以对作者、出版者产生正确的指导。出版商可以根据榜单来了解各地 的销售信息,以及不同地区对同一本图书产生的不同反应,以调整自己的营销策略。同时还可以了解各门类的市场情况是怎样的,哪类书受欢迎、哪类书被冷落、出 现了什么新的图书热点。对于读者而言,现在图书品种很多,而如何选择图书,榜单可以起到一定的指导作用,可以影响到读者的偏好。如果榜单不科学,以上这些 就会产生偏差。而对于书店卖场,图书分类主要是服务于上架和导购,如果分类不科学,最直接的影响就是读者找不到所需图书。据了解,有些书店把《绝对小孩》归入艺术类,而 在卖场中,艺术类一般都会被安排在较高楼层上,客流较小,处于曲高和寡的境地。这样一来,自然就会对其销售产生很大的影响。另外,图书分类不统一,会对书 店卖场在采购、对接、图书上架等工作环节上产生影响。如果有一个科学合理的分类,不仅能帮助读者更快、更准确地找到其所需的图书,还能促进相关图书的销 售。所以书店的上架分类,既要考虑店员上架方便、内部管理方便,更要考虑顾客找书的方便和增加更多的购买可能。为了保障图书分类科学以及上架的准确,现在 很多出版社都在图书的封底印有上架建议。望相关组织机构制定完善的图书分类的行业标准,这是大家共同的认识。 3 什么是Web2.0,Web2.0主要应用领域和发展方向是什么
3.1 Web2.0简介
Web2.0,是相对Web1.0(2003年以前的互联网模式)的新的一类互联网应用的统称,是一次从核心内容到外部应用的革命。由Web1.0单纯通过网络浏览器浏览html网页模式向内容更丰富、联系
性更强、工具性更强的Web2.0互联网模式的发展已经成为互联网新的发展趋势。
Web1.0到Web2.0的转变,具体的来说,可以从模式上是单纯的“读”向“写”、“共同建设”发展;由被动地接收互联网信息向主动创造互联网信息迈进!从基本构成单元上,是由“网页”向“发表/记录的信息”发展;从工具上,是由互联网浏览器向各类浏览器、rss阅读器等内容发展;运行机制上,由“Client Server”向“Web Services”转变;作者由程序员等专业人士向全部普通用户发展;应用上由初级的“滑稽”的应用向全面大量应用发展。
总之,Web2.0是以 Flickr、Craigslist、Linkedin、Tribes、Ryze、 Friendster、Del.icio.us、43Things.com等网站为代表,以Blog、TAG、SNS、RSS、wiki等应用为核心,依据六度分隔、xml、ajax等新理论和技术实现的互联网新一代模式。
3.2 Web2.0应用领域
Web2.0的应用领域还是比较广泛的,它可以广泛运用于电子商务、电子政务、开放网络以及企业服务等。
3.3 Web2.0发展方向
谈及Web2.0的未来发展方向,可谓仁者见仁智者见智,我们可以从以下几个方面探讨Web2.0 的未来发展方向。在WEB 2.0时代,个体用户的价值得到了最大的体现,众多的网民既是信息创造者和信息传播渠道,同时也是信息的受众。新闻采播不再是小部分专业人士的特权,任何接触新闻事件的人员都可以以自己的视角来观察和报道新闻事件,并且数码摄像机与录像机的普及为大众采编新闻提供了设备基础,内容制作者将细分为数据、图像、多媒体等不同类型。网民主动地选择信息,信息主动去寻找合适的用户。通过RSS等定制化阅读器,网民可以过滤掉不感兴趣的多余信息,只关注自己感兴趣的信息。传统媒体逐渐成为个性化网络媒体的后台。
由WEB 1.0通过浏览器浏览html网页,向内容更丰富、互动性、个性化更强的WEB 2.0模式发展已经是互联网新的发展趋势。现有的博客、播客、个人门户、网络互动杂志、互动搜索等等都已经体现了这种趋势。而随着技术的进一步发展,网络媒体逐渐分成表现层和基础层,现有的WEB 2.0网络媒体形态将占据表现层的主体,媒体表现形式上由文字加图片走向音、视频。博客与播客将走向融合,个人网络空间概念进一步得到增强,互联网不仅仅是人们工作和生活的工
具,而是变成生活的一部分,个人网络空间即网民在互联网上的生存形态,通过SNS形成众多小的群体,而社区论坛则成为个人网络聚集地,互动搜索成为联系各种群体之间的纽带。虽然现有的传统媒体和门户网站向基础层转变,但是作为大众传媒,传统媒体的权威性仍然不会降低,传统媒体和门户网站仍然发挥着重要的作用。
4 中国分类主题词表和中国图书馆分类法的体系结构,并比较异同点
4.1 中国分类主题词表体系结构
《中国分类主题词表》(以下简称《中分表》)体系结构:《中分表》是从我国文献检索语言实际情况出发,选择了“分类法——主题词表对照索引”式的一体化体系。这种体系既不是单纯分类法的等级学科体系,也不是单纯的叙词字顺体系,而是二者相互对照、相互融合、互相索引的一体化结构。
主窗体通过自动显示滚动条来控制浏览所有子窗体。子窗体是主窗体的主要结构,由三个文档构成,包括“分类号—主题词对应表”文档,窗口标题简称为“分类表”;“主题词—分类号对应表”文档,窗口标题简称为“主题表”;“词族表”文档,窗口标题简称“词族表”。电子版还提供一个在形式上与印刷本基本相同的但不属于子窗体形式的“浏览表”窗体,窗口标题简称为“浏览表”,包括“分类号—主题词对应表”和“主题词—分类号对应表”。两种窗体可相互辅助,也可以独立使用。
《中分表》电子版不仅可用于文献信息资源网络标引,还可用于文献信息资源网络检索平台。概括而言,具备以下功能特点:(1)分类主体一体化辅助索引的功能。(2)基于内容的一体化标识的检索功能。(3)自然语言检索功能。(4)易用性、辅助性性能。(5)分类目录检索系统和分类目录主题索引、主题目录检索系统和主题目录分类索引的功能。(6)评注、记忆功能。
4.2 中国图书馆分类法体系结构
《中国图书馆分类法》(以下简称《中图法》)体系结构:(1)《中图法》最初是面向各类图书馆情报机构,以印刷型文献为主要对象的分类工具,为全国文献统一分类编目,实现数目数据共享创造条件。《中图法》应当有囊括人类一切知识领域的知识体系;具有满足大型综合性图书情报机构使用的类目体系,同时又兼顾不同规模和不同专业图书情报机构的需要;有详略不同、专业不同、针对文献类型不同、载体不同的版本,以满足各种文献信息分类整序的需要。(2)
《中图法》以自然科学、社会科学、哲学作为人类知识领域的基本构成建立基本序列。并将作为社会主义分类法编制指导思想的“马克思主义、列宁主义、毛泽东思想、邓小平理论”和结合文献特殊性设臵的“综合性图书”作为部类,形成五个部类的基本序列。(3)《中图法》的宏观结构包括:编制说明、基本大类表、基本类目表、主表、附表、字顺索引、使用手册等,这些部分共同构成《中图法》的整体。微观结构包括:类目是构造分类法的最基本要素,每个类目代表具有某种共同属性的文献集合。《中图法》的类目结构由类号、类名、类级、注释和参照组成。
4.3 比较异同点
二者都是作为一种检索方式用于用于检索自己所需要的信息,都有自己的电子版供用户使用检索。不同点则在于他们各自的体系结构和功能实现上,《中分表》有几种一体化体系结构,还可用于信息资源网络检索平台,而《中图法》需要满足各种不同的需要和用户的需要,并且每个学科门类编制结构又会有统一的规定。
5 谷歌的使用技巧和EI以及SCI的使用方法
5.1谷歌使用技巧
Google检索引擎因其准确和快速的检索服务而深受广大网民欢迎,成为人们手中查询信息的必备工具,Google检索引擎本身也不辜负网民的期望,不断推出新的检索功能,除了为帮助人们更精确查找信息而常用的网站内容(site)、网页链路(inurl)、网页标题
(intitle)、各种格式文件 (filetype)和被链接(link)等检索功能之外,最近,还推出了一系列新的检索服务,总体来说,这些新的检索功能更加人性化,更贴近人们的日常 生活和需要,因而很容易被用户接受和使用。
1、汉语拼音输入检索
为了方便使用中文的用户在网上搜索,Google允许用户直接在键盘上输入汉语拼音来检索相关事物,例如:
输入 shanghaishikebiao
检索结果提示:您是不是要找:上海时刻表
这正是我们需要查找的关键词,用户可以据此浏览相关结果,这包括上海地区的各种交通工具的时刻表。如果需要查找更详细的资料“上海飞机航班时刻表”,则只要在原来的检索结果“上海时刻表”中间输入feijihangban,例如:上海feijihangban时刻表。
Google的这项新功能,可以免除用户在中文和拼音输入方面的互相转换。用户在输入拼音时,不要留有空格,否则Google会误认为英文。Google把拼音与常用的字或者词组一一对应,因此,过于生僻的字或词组不适合于用这个方法查找。
2、中英文字典
经常使用计算机的用户手头上自然会有一、两个字典软件,用于查找和翻译中英文的词义。作为一种使用频率较高的工具,Google也提供了一个中英文字 典,很方便使用。用户可以按照下列方法查找词义查找英文的中文词义则输入fycomputer 查找中文的英文词义则输入翻译计算机
3、天气查询
天气情况也是人们经常要查询的信息之一,Google 提供的天气查询来自于一个更新及时的中文气象网站,适合中国人使用。用户输入中文和英文都可以查询,例如要了解奥运会期间雅典的天气情况,可以按照下列方法输入:
雅典天气athens tq 返回的查询结果中会在第一条出现一个 “雅典天气预报”,用户点击后就可以看到当天雅典的天气情况。如果地名相同者,用户还需要进行一次选择。
4、股票查询
查询股票的网站已经很多了,Google提供的股票查询只是更方便一些而已,用户可以按照股票名称、股票代码或者股票名称的声母字母查询,下列为查询“中国联通”股票行情的举例。
中国联通 股票 zglt gp
gp 600050
5、邮政编码和区号查询
人们时常需要查询邮政编码和电话区号,Google提供了这样一个实用的功能,用户据此能够获得所要查询的省市名称,邮政编码及长途电话区号,下面为查询举例:
邮编 杭州
区号 绍兴
yb杭州
qh绍兴
需要注意的是用户只能查询到城市级别的邮政编码和区号,而无法进一步查询区县的具体信息。
6、手机归属地查询
用户在输入手机号码后可以获得号码段、归属地、卡类型、邮政编码和电话区号的信息,但是从实用的角度看,其中只有手机归属地的信息较为有用。
7、计算器使用
Google有计算器的功能,例如在google检索框中输入45*86+35/7,就会得到结果:
(45 * 86) + (35 / 7) = 3 875
有兴趣的用户,或者经常在计算机上进行运算的用户不妨可以试一试。
8、购物检索
Google新开设的购物检索称之为Froogle,网址为http://Froogle.google.com/
用户只要输入商品的名称,就可以看到该商品的图片和价格,用户还可以限定一种商品的价格进行检索,并且将检索结果按需要从高价到低价排序列出,许多商品可以直接在网上订购,这种图文并茂的检索购物方式较受用户青睐。
9、美国实用生活信息查询
如果用户生活在美国或者短期去美国出差和学习,下面的查询功能或许能对他们又帮助,因为这些检索服务目前仅限于美国。
9.1 地区代码查询
用户输入美国的地区代码,在返回的检索结果中的第一项就是该地区的地图,用户可以通过不断的点击来找到一条具体的大街。
9.2 条形码查询
用户输入一个商品的条形码就可以找到有关该产品的说明。
9.3 飞机航班查询
用户输入一家航空公司的名称和航班号,即可获得该航班的出发地和目的地,起飞和到达时间,以及实际航行情况,目前是否开始检票,抵达目的地候机大楼的舱门号。
9.4 车牌号查询
用户输入车牌号,可以获得一辆车的名称、型号、出厂年份,车身和发动机情况。
9.5 邮件查询
用户输入一个邮件的号码,可以获悉该邮件目前的状况,譬如邮
件已经抵达或者正在路途上等。
10、检索工具栏
Google的检索工具栏功能强大,有拖放和右击检索功能,新闻阅读,广告拦截,网站排名显示和搜索字词标明等,工具栏可以附在浏览器下,使用更加方 便。用户可以首先在Google网站下载并安装一个检索工具栏,然后根据需要在工具栏的选项中进行设臵,我们推荐用户使用这个检索工具栏,它将给用户带来 许多意想不到的方便。 10.1 Google 新闻
Google 的新闻来源于4500家报刊杂志和通讯社,在精选以后持续播出世界各国的新闻,每条新闻都有更新的时间,并联接相关的新闻。用户可以使用免费的新闻通知服务,通过电子邮件收到自己感兴趣的新闻。
10.2 网站排名
Google 通过对 Web 链接结构和许多其它变量自动计算,对网页的重要程度进行评定。网站排名根据这个评定能够显示用户正在访问的网站的重要程度,用一根绿色线条显示,直观而明确。 10.3 搜索字词标明
搜索字词标明通过鲜艳的色彩标明用户所检索的字词在每个网页上的位臵,便于用户查阅,单击“搜索字词标明”按钮可以打开和关闭标明状态。
10.4 拖放和右击检索
拖放检索功能使检索更为方便,用户可以把在网页上所选取的字词直接拖放到检索框中,Google会自动进行检索。对于与 Web浏览器同时运行的许多 文字处理应用程序中的文字,也可以使用此功能。右击检索是指用户可以在网页上选取文字后,右击鼠标,然后从弹出式菜单中选择“Google 搜索”便可以 自动检索。
Google搜索引擎为我们提供了搜索的方便,她正在不断推出新的服务功能,例如为移动电话特别设计的无线搜寻等,相信随着技术的不断发展,我们会从中享受更多的搜索乐趣。
5.2 EI使用方法
EI,即《工程索引》(The Engineering Index,简称EI),创刊于1884年,由Elsevier Engineering Information Inc.编辑出版。主要收录工程技术领域的论文(主要为科技期刊和会议录论文),数据覆盖了核技术、生物工程、交通运输、化学和工艺工程、照明和
光学技 术、农业工程和食品技术、计算机和数据处理、应用物理、电子和通信、控制工程、土木工程、机械工程、材料工程、石油、宇航、汽车工程等学科领域。具体使用方法还是用实例来说明,例子:检索医学领域中含有"pipe"的文献。如果仅仅用"pipe"检索在所有字段中检索,会命中4万多条记录;即使同时限制在TITLE中检索,结果也有1万多条,数据冗余太大。这时,可以考虑从学科的角度进行限制检索:
先检索到从Ei Thesaurus中检索医学类目:
Medicine:461.6, Medical care:461.7, Medical imaging:461.1,Medical problems,
Medical supplies:462.1,Medical computing:723.5,Medical diagnosis, Medical education, Medical equipment,Medical monitoring:462.2
利用"Expert Search":(461.1 wn CL OR 461.6 wn CL OR 461.7 wn CL OR 462.1 wn CL OR 723.5 wn CL) AND (pipe wn TI) 命中500多条记录,因723.5类与计算机应用有关,命中记录中有许多看不出是与医学有关的,可以考虑将该类去掉检索,结果就比较令人满意。
5.3 SCI使用方法
SCI, 即《科学引文索引》(Science Citation Index),是自然科学领域基础理论学科方面的重要的期刊文摘索引数据库。它创建于1961年,创始人为美国科学情报研究所所长Eugene
Garfield(1925.9.15)。利用它,可以检索数学、物理学、化学、天文学、生物学、医学、农业科学以及计算机科学、材料科学等学科方面自 1945年以来(我馆购买了1994年至今的数据使用权)重要的学术成果信息;SCI还被国内外学术界当做制定学科发展规划和进行学术排名的重要依据。这里也用具体实例说明使用方法:利用SCI数据库检索周远翔老师的论文收录情况
作者的文献(文章或报告)共有104篇,在这些文章中,他的合作者包括以下八人:N. Yoshimura, 关志成,H. Katoh, 严萍,梁曦东,李光范,M. Nifuku, Atsushi Satake
构建检索式:(zhou yx or yunxiang z) and (Yoshimura n or guan zc or zhicheng g or Katoh h or yan p or ping y or liang xd or xidong l or li gf or guangfan l or Nifuku m or Satake a or Atsushi
S)在AUTHOR字段中输入上述检索式,命中9条记录。与作者提供的论文核对后发现:这9条记录全是作者本人的论文。还有几篇文献是作者单独完成的,对于这些文献,需要单独处理。
6 创立一个数字图书馆项目,系统架构,数字图书的主要大类,做可行性分析(人源,经济,技术)
6.1 基于SOA的数字图书馆平台体系架构
数字图书馆平台需要将各业务系统融和成为一个有机整体;同时作为一个工作平台,需要将日 常生产管理中形成的各种知识文档集中存储,便于查询和传递,达到建成知识化数字图书馆的目的。因此,要求数字图书馆平台系统框架具有很强的扩展性和定制 性。因此数字图书馆平台是应用面向服务的架构体系,以网络技术为支撑,辅以大规模数据库技术、分布式处理技术、商业智能、智能决策支持系统、Agent代 理和语义Web等技术所支持的数字图书馆资源管理系统,是未来数字图书馆的资源管理模式。
数字图书馆平台需要支持数字图书馆信息资源的“存→理→传→找→用”等整个生命周期的活 动。构建数字图书馆平台体系结构需要考虑的主要因素包括:集成性、可靠性、可扩展性;内容管理;数字图书馆之间及数字图书馆内部的协作性;智能技术的应 用,包括商业智能与智能决策、语义Web、智能代理等。
在传统数字图书馆平台架构基础上,根据以上需考虑的因素,应用SOA基础架构,融合智能 技术,构建基于SOA的数字图书馆平台的三层体系架构。这种三层架构如图7所示:最底层是数据层,包括所有数字图书馆应用系统服务的结构化与非结构化的数 据内容;中间层是面向服务的应用层,它集成数字图书馆的各应用系统,利用SOA架构,将底层数据的异构和分布结构屏蔽,并无缝内嵌到SOA层中,提供清晰 明确的统一视图和接口;最上层是应用工具,它能够提供用户所需的智能和服务,让用户便捷、高效的实现各种应用。在这种三层结构中,各层的主要构成模块如下 所述:
表示层
数字图书馆平台的表示层主要负责与数字图书馆用户以及商业伙伴之间的相互 交互,包括内外部网站、办公交流平台;在数字图书馆平台里所有的数据交换都通过XML格式进行,这些数据由表示层负责翻译成外部浏览者(HT2ML),无 线设备(WAP,Mobile)等可以理解的格式。这层包括门户Web应用、智能代理、商务智能等,以
及门户的各种功能Portlet。
通过商务智能、智能决策和智能代理把从不同业务系统中发掘出的知识以最恰当的方式表示出 来,为数字图书馆的决策者提供决策依据。数字图书馆平台通过门户PortLet、智能代理等为终端用户提供个性体验,提供定制内容和页面外观及版式的表现 形式,还可利用相应的工具,使主题专家可以编制个性化的内容,满足数字图书馆平台系统各个访问者的需求和兴趣。在这个层面通过对知识的分类和权限规划,将 基于浏览器的应用按照规则统一界面入口,并实现数字图书馆平台、部门门户和个人门户的多级需求,建立统一访问的界面规则和风格。
SOA应用层。
基于SOA数字图书馆应用集成是数字图书馆平台体系架构的首要问 题,包括数字图书馆应用系统服务的整合、资源的整合等内容。在数字图书馆平台中,基于SOA将数字图书馆的各种业务应用系统、工作流程等无缝整合,使数字 图书馆平台具备可扩展性,可以在系统中随时增加业务功能模块,使数字图书馆的前期投资可以被无限利用。基于SOA的数字图书馆平台整合主要包括业务流程的 整合以及数字图书馆应用服务及数字资源的整合。
在这种基于SOA的数字图书馆平台架构中,可以用一个服务替换另一个服务而无须关心其底 层的实现技术,唯一要考虑的就是服务接口,而它采用了通用的Web服务和XML标准。因此,可以在不牺牲同构环境的传统价值(即管理、安全性、可靠性、伸 缩性和性能)的情况下,提供将底层服务实现无缝地重新部署到其他技术、地理或组织领域的能力。它可以对数字图书馆的业务流程进行监控管理,对业务过程实时 数据进行分析计算,建立与完善过程监视、在线性能计算、可靠性管理、生产综合查询;实现运行优化指导和优化支持;结合历史数据和理论模型及专家经验,形成 对数字图书馆运行的决策支持,实现管理层与控制层的集成,同时也为上层应用提供统一的数据平台。采用SOA架构开发、配臵和管理的应用程序令数字图书馆拥 有更大的自主性和灵活度,基于SOA的数字图书馆应用与流程整合,数字图书馆所有的内容都被集成到一起。新的网络服务、应用程序更加简约、高效,对市场变 化能及时做出反应,并最终成为数字图书馆核心竞争力的一部分。
数据层。
数据层由数字图书馆知识库组成。利用知识挖掘管理工具,对数字图书馆的所 有数据资源进行多维分析,汲取有价值的数据信息,并采用关联规则及神经网络等挖掘算法,不仅挖掘各种结构化和非结构化知识文档和数据,而且包括相关的管理 组织、流程、管理制度,以及知识管理的方式与方法等,分类、分级进行组织管理,构建数字图书馆级知识库,并通过相应的管理手段保证其运行。
数字图书馆知识库包含着数字图书馆的事实、文档的元数据,以及描述事实和元数据结构的本 体,即本体知识库与实例知识库。知识库中存储了大量不同类型的结构化和非结构化知识,其主要的内容是本体、事实知识和文档表示。事实与概念被储存在一个关 系数据库中,不过,它们是以一种具象化格式被储存的。这种格式将关系和概念视为最重要的客体对象,因此,它在改变与修订方面非常灵活。系统中的组件是以存 储在知识库中的知识为中心而进行的。
6.2 数字图书的主要大类
A 马克思主义、列宁主义、毛泽东思想、邓小平理论
B 哲学
C 社会科学总论
D 政治、法律
E 军事
F 经济
G 文化、科学、教育、体育
H 语言、文字
I 文学
J 艺术
K 历史、地理
N 自然科学总论
O 数理科学和化学
P 天文学、地球科学
Q 生物科学
R 医药、卫生
S 农业科学
T 工业技术
U 交通运输
V 航空、航天
X 环境科学、劳动保护科学(安全科学)
Z 综合性图书
6.3 可行性分析
此方案从人源角度分析,需要一批精通计算机软硬件熟悉的专业人士,对好懂得云计算知识对本项目有积极帮助,所以在这看来人源最为重要。
此方案从经济角度分析,需要的前期投入资金估计30万足够,主要用于购买电脑方面的服务配臵以及软硬件资源。
此方案从技术角度分析,设计相当多的电脑技术,专业人士对此项目的帮助实现是很至关重要的。