云计算时代的数据库研究

数据库原理

云计算时代的数据库研究

摘要:叙述云计算基础知识,比较云计算数据库的优点,介绍云计算时代的数据

库研究。

关键词:云计算;数据库;关键型;NoSQL 数据库

1. 引言

随着云计算时代的到来,各种类型的互联网应用层出不穷,对与此相关的数据模型、分布式架构、数据存储等数据库相关的技术指标也提出了新的要求。虽然传统的关系型数据库已在数据存储方面占据了不可动摇的地位,但由于其天生的限制,已经越来越无法满足云计算时代对数据扩展、读写速度、支撑容量以及建设和运营成本的要求。云计算时代对数据库技术提出了新的需求,主要表现在以下几个方面。

● 海量数据处理:对类似搜索引擎和电信运营商级的经营分析系统这样大型的应用而言,需要能够处理PB 级的数据,同时应对百万级的流量。

● 大规模集群管理:分布式应用可以更加简单地部署、应用和管理。 ● 低延迟读写速度:快速的响应速度能够极大地提高用户的满意度。 ● 建设及运营成本:云计算应用的基本要求是希望在硬件成本、软件成本以及人力成本方面都有大幅度的降低。

云计算基础知识

公有云一般可通公有云: 公有云通常指第三方提供商用户能够使使用的云,

过 Internet 使用。能够以低廉的价格,提供有吸引力的服务给最终用户,创造新的业务价值,公有云作为一个支撑平台,还能够整合上游的服务(如增值业务,广告)提供者和下游最终用户,打造新的价值链和生态系统。

私有云: 私有云是为一个客户单独使用而构建的,因而提供对数据、安全性

和服务质量的最有效控制。该公司拥有基础设施,并可以控制在此基础设施上部署应用程序的方式。私有云可部署在企业数据中心的防火墙

内,也可以将它们部署在一个安全的主机托管场所。

私有云可由公司自己的 IT 机构,也可由云提供商进行构建。在此“托管式专用”模式中,像DMT 这样的云计算提供商可以安装、配置和运营基础设施,以支持一个公司企业数据中心内的专用云。此模式赋予公司对于云资源使用情况的极高水平的控制能力,同时带来建立并运作该环境所需的专门知识。

企业云: 一种基于云计算的,满足企业高扩展性、高可用性、组织和业务快

速变更,实现企业协同管理,满足企业扩张、创新升级需求的平台技术框架。随着产业链整合、市场竞争日趋全球化,企业的需求和用户的消费习惯都在改变,企业需要提供简单、快捷的商务云计算服务来满足企业扩张、产业链整合及创新升级的需要。

SaaS : SaaS 提供商为企业搭建信息化所需要的所有网络基础设施及软

件、硬件运作平台,并负责所有前期的实施、后期的维护等一系列服务,企业无需购买软硬件、建设机房、招聘IT 人员,即可通过互联网使用信息系统。就像打开自来水龙头就能用水一样,企业根据实际需要,从SaaS 提供商租赁软件服务。

IaaS : laaS 提供给消费者的服务是对所有设施的利用,包括处理、存储、

网络和其它基本的计、算资源,用户能够部署和运行任意软件,包括操作系统和应用程序。消费者不管理或控制任何云计算基础设施,但能控制操作系统的选择、储存空间、部署的应用,也有可能获得有限制的网络组件(例如,防火墙,负载均衡器等)的控制。

PaaS: Paas 提供给消费者的服务是把客户采用提供的开发语言和工具

(例如Java ,python, .Net等)开发的或收购的应用程序部署到供应商的云计算基础设施上去。客户不需要管理或控制底层的云基础设施,包括网络、服务器、操作系统、存储等,但客户能控制部署的应用程序,也可能控制运行应用程序的托

表格 1

2. 关系型数据库的劣势分析

“在云计算计划里将找不到关系数据库的影子,这并非偶然,因为关系数据库不适合用于云计算环境“Geir Magnusson ,10Gen 工程副总裁这样认为。10Gen 是一家按需平台服务供应商。

Magnusson 帮助编写过Apache Geronimo 应用服务器软件,本周在纽约举行的O'Reilly Web 2.0 会议上发言中他指出:“云计算是一种不同的技术,不同得足够改变开发者看待问题和解决问题的方式”。“我们将不得不重新审视我们做事的方式”,他说。

在发言期间,Magnusson 列举了许多被专门开发用于云计算环境的新型数据库,包括Google' 的Bigtable, Amazon 的 SimpleDB, 10Gen 自己的 Mongo, AppJet 的 AppJet 数据库以及甲骨文开源BerkelyDB 。

Magnusson 指出,这些数据库没有一个是关系型的(他特别强调了一个值得注意的例外“Drizzle ”,MySQL 应用于web 环境的一个精装版) 。

随着Web2.0的发展,传统的关系型数据库在应对超大规模和高并发的SNS 类型的网站方面暴露了许多难以克服的问题,主要表现在以下方面。

⑴高并发读写速度慢

这种情况主要发生在数据量达到一定规模时,由于关系型数据库的系统逻辑非常复杂,使得其非常容易发生死锁等并发问题,导致其读写速度下降非常严重。例如,We b2.0网站要根据用户个性化信息来实时生成动态页面、提供动态信息,所以基本上无法使用动态页面静态化技术,因此数据库并发负载非常高,往往要达到每秒上万次读写请求。关系型数据库勉强可以应付上万次SQL 查询,但硬盘I/O往往无法承担上万次的SQL 写数据请求。

⑵支撑容量有限

类似Facebook 、Twitter 这样的SNS 网站,用户每天产生海量的用户动态,每月会产生几亿条用户动态,对于关系型数据库来说,在一张数亿条记录的表里面进行SQL 查询,效率是极其低下乃至不可忍受的。

⑶扩展性差

在基于Web 的架构当中,数据库是最难进行横向扩展的,当一个应用系统的用户量和访问量与日俱增的时候,传统的关系型数据库却没有办法像Web Server

那样简单地通过添加更多的硬件和服务节点来扩展性能和负载能力。对于很多需要提供不间断服务的网站来说,对数据库系统进行升级和扩展是非常痛苦的事情,往往需要停机维护和数据迁移,因此迫切需要关系型数据库能够通过不断添加服务器节点来实现扩展。

⑷建设和运维成本高

企业级数据库的价格很高,并且随着系统的规模增大而不断上升。高昂的建设和运维成本无法满足云计算应用对数据库的需求。关系型数据库遇到上述难以克服的瓶颈,与此同时,它的很多主要特性在云计算应用中却往往无用武之地。例如,数据库事务一致性、数据库的写实时性和读实时性、复杂的SQL 查询特别是多表关联查询。因此,传统的关系型数据库已经无法独立应付云计算时代的各种应用。

3. NoSQL数据库数据模型

关系型数据库越来越无法满足云计算的应用场景,为了解决此类问题,非关系型数据库应运而生,由于在设计上和传统的关系型数据库相比有了很大的不同,所以此类数据库被称为“NoSQL (Not only SQL )”系列数据库。与关系型数据库相比,它们非常关注对数据高并发读写和海量数据的存储,在架构和数据模型方做了简化,而在扩展和并发等方面做了增强。目前,主流的Cassandra 、SimpleDB 、CouchDB 、MongoDB 以及Redis 等。NoSQL 常用数据模型包括以下3种。 ⑴Column-oriented (列式)

列式主要使用Table 这样的模型,但是它并不支持类似J o i n这样多表的操作,它的主要特点是在存储数据时,主要围绕着“列(Column )”,而不是像传统的关系型数据库那样根据“行(R o w )”进行存储,也就是说,属于同一列的数据会尽可能地存储在硬盘同一个页中,而不是将属于同一个行的数据存放在一

起。这样做的好处是,对于很多类似数据仓库的应用,虽然每次查询都会处理很多数据,但是每次所涉及的列并没有很多。使用列式数据库,将会节省大量I/O,并且大多数列式数据库都支持Column Family这个特性,能将多个列并为一个小组。这样做的好处是能将相似列放在一起存储,提高这些列的存储和查询效率。总体而言,这种数据模型的优点是比较适合汇总和数据仓库这类应用。 ⑵Key-value

虽然Key-value 这种模型和传统的关系型相比较简单,有点类似常见

HashTable ,一个Key 对应一个Value ,但是它能提供非常快的查询速度、大的数据存放量和高并发操作,非常适合通过主键对数据进行查询和修改等操作,虽然不支持复杂的操作,但是可以通过上层的开发来弥补这个缺陷。

⑶Document (文档)

在结构上,Document 和Key-value 是非常相似的,也是一个Key 对应一个Value ,但是这个Value 主要以JSON 或者XML 等格式的文档来进行存储,是有语义的,并且Document DB一般可以对Value 创建Secondary Index方便上层的应用,而这点是普通Key-Value DB所无法支持的。

4. 数据库新的研究领域 数据库技术和其他计算机技术相结合,能够产生新的研究领域。例如,数据库技术和面向对象技术相结合就产生了面向对象数据库;数据库技术和云计算技术相结合也就产生一个新的研究内容,称之为云计算数据库。云计算数据库当前的主要研究内容包括三个方面:云计算数据库管理系统、云计算数据库集成和支持新的云计算应用。

云计算数据库管理系统

云计算提供一个平台,这个平台支持系统化的身份鉴别和授权、资源发现、数据传输、进程创建和调度,以及跨异构平台的动态绑定。在云计算提供的这些功能的基础上,可以构造一个安全可靠、具有自主计算能力的高性能云计算数据库管理系统。云计算数据库管理系统最终将成为云计算上的一种重要资源,提供数据管理服务。

在构建云计算数据库管理系统方面,第一步的工作是提供一个中间件,将数据库管理系统包装成为云计算服务,以便云计算应用存取云计算数据库。这种做法的好处是,对已有的数据库管理系统基本上不需要做什么改动。

进一步的工作是扩展已有的数据库管理系统,让它直接利用云计算提供的功能来实现分布式的数据库和相关的云计算服务。下面是一些扩展已有数据库管理系统时可做的工作:

●在云计算上,用户只需要登录一次,就可以使用云计算上所有可用的资源。云计算数据库管理系统需要支持云计算中这种一致性的身份鉴别和授权机制。

●很多云计算应用程序在提交任务给数据库管理系统后,需要收到一个任务完成的通知,解决这种订阅/发布问题需要结合云计算数据库管理系统的触发器机制和云计算中的通知服务。

●在云计算中,查询结果可以被缓存以便传送给第三方,这意味着,在一个不确定的时间内,云计算数据库管理系统必须保留结果,然后利用云计算数据传输机制传送查询结果到第三方。

●在云计算中,分布式查询处理可以利用云计算的资源发现机制了解网络的状态、获得合适的资源来运行分布式查询或存储中间结果。

●云计算数据库管理系统应提供资源预留功能,以便参与云计算中的进程调度。

●云计算数据库管理系统应该能为云计算记账和支付标准提供必要的信息,以便用户为资源的使用付费。

有些云计算问题不是通过简单地扩展已有的数据库管理系统就能够解决的。下面举几个例子来说明这一点:

●云计算当中计算和数据资源之间耦合得很紧密,这对于数据库的查询优化是一个挑战。计算任务在哪里执行、需不需要迁移、数据怎样存放、存放在哪里、如何调度在数据上的操作和计算任务、短期优化还是长期优化等等,都需要在查询优化时给予一个整体的、多角度的考虑。

●在云计算中,当数据的规模增长到一定的程度时,传输在这些数据上的计算代码会比传输所有数据更为经济。数据上的计算比数据库支持的数据查询要复杂,它可以生成大量的中间结果,需要大量的处理器和在多个云计算结点间传输大量的数据。对于数据上的计算还需要进行监控。当前的数据库管理系统并未准备好成为这种大型计算的宿主,也不支持所需要的监控接口。

●传统的数据库管理系统是一个复杂的系统,运行时作为一个整体消耗大量的资源。云计算数据库管理系统最好能由一些组件构成,这些组件可以根据需要来组合完成数据库管理系统的部分或者全部功能。这样做的好处除了可以降低资源消耗,更重要的是,使得在整个系统规模的基础上优化使用数据库资源成为可能。

●在云计算中使用注册的方法来发布和查找资源。数据库里面存储有大量的元数据,手工注册这么多元数据是不可行的,但是又如何来完成自动注册呢?自动注册的问题不在于注册这些元数据到云计算中,而在于注册时如何保证这些元数据能为第三方所理解。这个问题也是云计算数据库集成时需要解决的问题。

[参考文献]

【1】程 莹,张云勇,房秉毅,等. 云计算时代的数据库研究[J]. 中国期刊全文数据库,2011,01:1~5

数据库原理

云计算时代的数据库研究

摘要:叙述云计算基础知识,比较云计算数据库的优点,介绍云计算时代的数据

库研究。

关键词:云计算;数据库;关键型;NoSQL 数据库

1. 引言

随着云计算时代的到来,各种类型的互联网应用层出不穷,对与此相关的数据模型、分布式架构、数据存储等数据库相关的技术指标也提出了新的要求。虽然传统的关系型数据库已在数据存储方面占据了不可动摇的地位,但由于其天生的限制,已经越来越无法满足云计算时代对数据扩展、读写速度、支撑容量以及建设和运营成本的要求。云计算时代对数据库技术提出了新的需求,主要表现在以下几个方面。

● 海量数据处理:对类似搜索引擎和电信运营商级的经营分析系统这样大型的应用而言,需要能够处理PB 级的数据,同时应对百万级的流量。

● 大规模集群管理:分布式应用可以更加简单地部署、应用和管理。 ● 低延迟读写速度:快速的响应速度能够极大地提高用户的满意度。 ● 建设及运营成本:云计算应用的基本要求是希望在硬件成本、软件成本以及人力成本方面都有大幅度的降低。

云计算基础知识

公有云一般可通公有云: 公有云通常指第三方提供商用户能够使使用的云,

过 Internet 使用。能够以低廉的价格,提供有吸引力的服务给最终用户,创造新的业务价值,公有云作为一个支撑平台,还能够整合上游的服务(如增值业务,广告)提供者和下游最终用户,打造新的价值链和生态系统。

私有云: 私有云是为一个客户单独使用而构建的,因而提供对数据、安全性

和服务质量的最有效控制。该公司拥有基础设施,并可以控制在此基础设施上部署应用程序的方式。私有云可部署在企业数据中心的防火墙

内,也可以将它们部署在一个安全的主机托管场所。

私有云可由公司自己的 IT 机构,也可由云提供商进行构建。在此“托管式专用”模式中,像DMT 这样的云计算提供商可以安装、配置和运营基础设施,以支持一个公司企业数据中心内的专用云。此模式赋予公司对于云资源使用情况的极高水平的控制能力,同时带来建立并运作该环境所需的专门知识。

企业云: 一种基于云计算的,满足企业高扩展性、高可用性、组织和业务快

速变更,实现企业协同管理,满足企业扩张、创新升级需求的平台技术框架。随着产业链整合、市场竞争日趋全球化,企业的需求和用户的消费习惯都在改变,企业需要提供简单、快捷的商务云计算服务来满足企业扩张、产业链整合及创新升级的需要。

SaaS : SaaS 提供商为企业搭建信息化所需要的所有网络基础设施及软

件、硬件运作平台,并负责所有前期的实施、后期的维护等一系列服务,企业无需购买软硬件、建设机房、招聘IT 人员,即可通过互联网使用信息系统。就像打开自来水龙头就能用水一样,企业根据实际需要,从SaaS 提供商租赁软件服务。

IaaS : laaS 提供给消费者的服务是对所有设施的利用,包括处理、存储、

网络和其它基本的计、算资源,用户能够部署和运行任意软件,包括操作系统和应用程序。消费者不管理或控制任何云计算基础设施,但能控制操作系统的选择、储存空间、部署的应用,也有可能获得有限制的网络组件(例如,防火墙,负载均衡器等)的控制。

PaaS: Paas 提供给消费者的服务是把客户采用提供的开发语言和工具

(例如Java ,python, .Net等)开发的或收购的应用程序部署到供应商的云计算基础设施上去。客户不需要管理或控制底层的云基础设施,包括网络、服务器、操作系统、存储等,但客户能控制部署的应用程序,也可能控制运行应用程序的托

表格 1

2. 关系型数据库的劣势分析

“在云计算计划里将找不到关系数据库的影子,这并非偶然,因为关系数据库不适合用于云计算环境“Geir Magnusson ,10Gen 工程副总裁这样认为。10Gen 是一家按需平台服务供应商。

Magnusson 帮助编写过Apache Geronimo 应用服务器软件,本周在纽约举行的O'Reilly Web 2.0 会议上发言中他指出:“云计算是一种不同的技术,不同得足够改变开发者看待问题和解决问题的方式”。“我们将不得不重新审视我们做事的方式”,他说。

在发言期间,Magnusson 列举了许多被专门开发用于云计算环境的新型数据库,包括Google' 的Bigtable, Amazon 的 SimpleDB, 10Gen 自己的 Mongo, AppJet 的 AppJet 数据库以及甲骨文开源BerkelyDB 。

Magnusson 指出,这些数据库没有一个是关系型的(他特别强调了一个值得注意的例外“Drizzle ”,MySQL 应用于web 环境的一个精装版) 。

随着Web2.0的发展,传统的关系型数据库在应对超大规模和高并发的SNS 类型的网站方面暴露了许多难以克服的问题,主要表现在以下方面。

⑴高并发读写速度慢

这种情况主要发生在数据量达到一定规模时,由于关系型数据库的系统逻辑非常复杂,使得其非常容易发生死锁等并发问题,导致其读写速度下降非常严重。例如,We b2.0网站要根据用户个性化信息来实时生成动态页面、提供动态信息,所以基本上无法使用动态页面静态化技术,因此数据库并发负载非常高,往往要达到每秒上万次读写请求。关系型数据库勉强可以应付上万次SQL 查询,但硬盘I/O往往无法承担上万次的SQL 写数据请求。

⑵支撑容量有限

类似Facebook 、Twitter 这样的SNS 网站,用户每天产生海量的用户动态,每月会产生几亿条用户动态,对于关系型数据库来说,在一张数亿条记录的表里面进行SQL 查询,效率是极其低下乃至不可忍受的。

⑶扩展性差

在基于Web 的架构当中,数据库是最难进行横向扩展的,当一个应用系统的用户量和访问量与日俱增的时候,传统的关系型数据库却没有办法像Web Server

那样简单地通过添加更多的硬件和服务节点来扩展性能和负载能力。对于很多需要提供不间断服务的网站来说,对数据库系统进行升级和扩展是非常痛苦的事情,往往需要停机维护和数据迁移,因此迫切需要关系型数据库能够通过不断添加服务器节点来实现扩展。

⑷建设和运维成本高

企业级数据库的价格很高,并且随着系统的规模增大而不断上升。高昂的建设和运维成本无法满足云计算应用对数据库的需求。关系型数据库遇到上述难以克服的瓶颈,与此同时,它的很多主要特性在云计算应用中却往往无用武之地。例如,数据库事务一致性、数据库的写实时性和读实时性、复杂的SQL 查询特别是多表关联查询。因此,传统的关系型数据库已经无法独立应付云计算时代的各种应用。

3. NoSQL数据库数据模型

关系型数据库越来越无法满足云计算的应用场景,为了解决此类问题,非关系型数据库应运而生,由于在设计上和传统的关系型数据库相比有了很大的不同,所以此类数据库被称为“NoSQL (Not only SQL )”系列数据库。与关系型数据库相比,它们非常关注对数据高并发读写和海量数据的存储,在架构和数据模型方做了简化,而在扩展和并发等方面做了增强。目前,主流的Cassandra 、SimpleDB 、CouchDB 、MongoDB 以及Redis 等。NoSQL 常用数据模型包括以下3种。 ⑴Column-oriented (列式)

列式主要使用Table 这样的模型,但是它并不支持类似J o i n这样多表的操作,它的主要特点是在存储数据时,主要围绕着“列(Column )”,而不是像传统的关系型数据库那样根据“行(R o w )”进行存储,也就是说,属于同一列的数据会尽可能地存储在硬盘同一个页中,而不是将属于同一个行的数据存放在一

起。这样做的好处是,对于很多类似数据仓库的应用,虽然每次查询都会处理很多数据,但是每次所涉及的列并没有很多。使用列式数据库,将会节省大量I/O,并且大多数列式数据库都支持Column Family这个特性,能将多个列并为一个小组。这样做的好处是能将相似列放在一起存储,提高这些列的存储和查询效率。总体而言,这种数据模型的优点是比较适合汇总和数据仓库这类应用。 ⑵Key-value

虽然Key-value 这种模型和传统的关系型相比较简单,有点类似常见

HashTable ,一个Key 对应一个Value ,但是它能提供非常快的查询速度、大的数据存放量和高并发操作,非常适合通过主键对数据进行查询和修改等操作,虽然不支持复杂的操作,但是可以通过上层的开发来弥补这个缺陷。

⑶Document (文档)

在结构上,Document 和Key-value 是非常相似的,也是一个Key 对应一个Value ,但是这个Value 主要以JSON 或者XML 等格式的文档来进行存储,是有语义的,并且Document DB一般可以对Value 创建Secondary Index方便上层的应用,而这点是普通Key-Value DB所无法支持的。

4. 数据库新的研究领域 数据库技术和其他计算机技术相结合,能够产生新的研究领域。例如,数据库技术和面向对象技术相结合就产生了面向对象数据库;数据库技术和云计算技术相结合也就产生一个新的研究内容,称之为云计算数据库。云计算数据库当前的主要研究内容包括三个方面:云计算数据库管理系统、云计算数据库集成和支持新的云计算应用。

云计算数据库管理系统

云计算提供一个平台,这个平台支持系统化的身份鉴别和授权、资源发现、数据传输、进程创建和调度,以及跨异构平台的动态绑定。在云计算提供的这些功能的基础上,可以构造一个安全可靠、具有自主计算能力的高性能云计算数据库管理系统。云计算数据库管理系统最终将成为云计算上的一种重要资源,提供数据管理服务。

在构建云计算数据库管理系统方面,第一步的工作是提供一个中间件,将数据库管理系统包装成为云计算服务,以便云计算应用存取云计算数据库。这种做法的好处是,对已有的数据库管理系统基本上不需要做什么改动。

进一步的工作是扩展已有的数据库管理系统,让它直接利用云计算提供的功能来实现分布式的数据库和相关的云计算服务。下面是一些扩展已有数据库管理系统时可做的工作:

●在云计算上,用户只需要登录一次,就可以使用云计算上所有可用的资源。云计算数据库管理系统需要支持云计算中这种一致性的身份鉴别和授权机制。

●很多云计算应用程序在提交任务给数据库管理系统后,需要收到一个任务完成的通知,解决这种订阅/发布问题需要结合云计算数据库管理系统的触发器机制和云计算中的通知服务。

●在云计算中,查询结果可以被缓存以便传送给第三方,这意味着,在一个不确定的时间内,云计算数据库管理系统必须保留结果,然后利用云计算数据传输机制传送查询结果到第三方。

●在云计算中,分布式查询处理可以利用云计算的资源发现机制了解网络的状态、获得合适的资源来运行分布式查询或存储中间结果。

●云计算数据库管理系统应提供资源预留功能,以便参与云计算中的进程调度。

●云计算数据库管理系统应该能为云计算记账和支付标准提供必要的信息,以便用户为资源的使用付费。

有些云计算问题不是通过简单地扩展已有的数据库管理系统就能够解决的。下面举几个例子来说明这一点:

●云计算当中计算和数据资源之间耦合得很紧密,这对于数据库的查询优化是一个挑战。计算任务在哪里执行、需不需要迁移、数据怎样存放、存放在哪里、如何调度在数据上的操作和计算任务、短期优化还是长期优化等等,都需要在查询优化时给予一个整体的、多角度的考虑。

●在云计算中,当数据的规模增长到一定的程度时,传输在这些数据上的计算代码会比传输所有数据更为经济。数据上的计算比数据库支持的数据查询要复杂,它可以生成大量的中间结果,需要大量的处理器和在多个云计算结点间传输大量的数据。对于数据上的计算还需要进行监控。当前的数据库管理系统并未准备好成为这种大型计算的宿主,也不支持所需要的监控接口。

●传统的数据库管理系统是一个复杂的系统,运行时作为一个整体消耗大量的资源。云计算数据库管理系统最好能由一些组件构成,这些组件可以根据需要来组合完成数据库管理系统的部分或者全部功能。这样做的好处除了可以降低资源消耗,更重要的是,使得在整个系统规模的基础上优化使用数据库资源成为可能。

●在云计算中使用注册的方法来发布和查找资源。数据库里面存储有大量的元数据,手工注册这么多元数据是不可行的,但是又如何来完成自动注册呢?自动注册的问题不在于注册这些元数据到云计算中,而在于注册时如何保证这些元数据能为第三方所理解。这个问题也是云计算数据库集成时需要解决的问题。

[参考文献]

【1】程 莹,张云勇,房秉毅,等. 云计算时代的数据库研究[J]. 中国期刊全文数据库,2011,01:1~5


相关内容

  • 大数据时代下数据分析理念的辨析_朱建平
  • 第31卷第2期2014年2月统计研究 Statistical ResearchVol.31,No. 2Feb.2014 大数据时代下数据分析理念的辨析 朱建平 章贵军 刘晓葳 * "大数据时代"内容提要:本文在剖析了国内外大数据研究和应用现状的基础上,提出了的定义,并从统计学的& ...

  • 大数据时代的机遇与变革(光明日报)
  • 今天,大数据(big data)一词正越来越多地被提及,人们用它来描述和定义信息爆炸时代产生的海量数据.随着经济社会的发展,大数据可能带来的深刻影响和巨大价值日益被认识,它通过技术的创新与发展,以及数据的全面感知.收集.分析.共享,为我们提供了一种全新的看待世界的方法,其带来的信息风暴正全方位地改变 ...

  • 社会计算:大数据时代的机遇与挑战
  • 社会计算:大数据时代的机遇与挑战* 孟小峰1 李 勇1† 祝建华2 12 (中国人民大学信息学院 北京 100872) (香港城市大学媒体和传播系 香港 999077) Social Computing in the Era of Big Data:Opportunities and Challen ...

  • 大数据所带来的数据安全问题
  • 大数据所带来的数据安全问题 刘 专 (广东省机械高级技工学校广东510450) [摘要]大数据是现在的研究热点,正在逐渐着改变着人们的生活,工作方式.但是目前在这方面存在着许许多多的数据安全问题.本文介绍了大数据的概念及其特征,浅析了目前实现大数据安全与隐私保护所面,临的技术挑战,简介了该领域内的一 ...

  • 大数据时代新闻传播人才培养模式探讨_胡兵
  • V ol.24 No.11 2014 大数据时代新闻传播人才培养模式探讨 胡 兵 郑 重 (华南理工大学 新闻与传播学院,广东广州 510006) 摘要:文章在简述大数据的定义与特点之后,阐述了大数据时代对新闻生产方式带来的变革,然后归纳出大数据时代对新闻传播人才需求的三种类型,即应用型人才.&qu ...

  • 大数据的发展和产业机遇
  • 大数据的发展和产业机遇 钱小聪 (江苏赛联信息产业研究院,江苏 南京 210012) 摘 要:随着物联网.社会化网络的快速发展所带来的数据爆炸式增长,从数据中挖掘事物之间的相互关系正成为知识和技术创新的新手段,也标志着大数据时代的来临.文章分析了大数据的发展内因和背景,并对大数据产业的战略地位以及大 ...

  • 江苏省有色金属华东地质勘查局/江苏省华东有色投资控股公司
  • 借力大数据  书写地质勘探新篇章 --地质信息技术发展论坛2015在南京圆满落幕 为广泛交流.总结地质信息化领域的最新成果,跟踪大数据.云计算等前沿信息技术的发展动向和研究成果,推动地质信息化事业的发展,2015年12月3日至5日,由中国国土资源部地质信息技术重点实验室和中国地质调查局发展研究中心联 ...

  • 大数据时代
  • 大数据时代的思维变革 如今,一个大规模生产,分享和应用数据的时代正在开启.大数据的真实价值就像是漂浮在海洋上的冰山,第一眼只能看到冰山的一角,绝大部分都隐藏在表面之下.随着计算机,互联网的迅速发展,大量的数据可以在云计算的计算,分析下,找到大量数据背后隐藏的更具研究和使用价值的数据,看到我们无法直接 ...

  • 数据科学与工程 大数据时代的新兴交叉学科
  • 数据科学与工程 大数据时代的新兴交叉学科 大数据时代的IT 发展的基本特点是:应用驱动创新,开源加速创新,硬件助力创新.基于对这些特点的认识,从社会创新发展.人才需求变化.技术发展趋势等方面论述了数据科学与工程这一新兴交叉学科的发展必然性,进一步阐述了数据科学与工程学科的特点.学科内涵与知识体系,最 ...