大数据时代下的企业管理与创新
IBM 全球业务咨询服务部业务分析与优化服务团队
中国区总经理 谢国忠
一、大数据的概念
在讲大数据之前先来看一下阿里巴巴,从阿里金融说起。目前金融界特别关注阿里巴巴的微贷,这是银行界未来最可怕的潜在对手。为什么可怕?阿里金融拿到金融执照短短几年时间,到2012年6月份其微贷企业已经达到12.9万家企业,贷款总额260亿万元,到2012年年底其服务的微小企业已经超过20万家。
阿里金融背后的实质是什么?有两个方面,一个方面叫大数据经营,另一个方面叫业务创新,这两方面结合在一起,颠覆了这个行业。具体而言,阿里金融利用网上的客户信用数据与行为数据,建立网络数据模型及信用体系。借此给每一个商铺、每一个店家做信用等级的评分,根据这个评分阿里金融去发放微贷,从500块钱到100万不等,并开发了很多业务产品,包括订单贷款、信用贷款等等。阿里金融打破了银行的传统做法,不需要抵押,不需要担保,只依赖于大数据,通过大数据应用和业务创新,改变了一个行业,改变了游戏规则。
大数据目前在全球已经用于各行各业,比如金融服务业、公共事业、数字媒体、零售、司法执法等。可是到底什么叫大数据?2011年5月份,麦肯锡全球研究院,发表了一篇非常有名的报告
—《大数据:创新、竞争和生产力的下一个新领域》,最早提出了大数据的概念。这篇研究报告主要提了两个观点,一是数据已经渗透到每一个行业、每一个业务职能领域;二是海量数据的应用意味着下一波或者新一轮生产率的增长和消费者盈余浪潮的到来。
从技术角度讲,大数据的产生是这个时代的产物。伴随物联网、移动网、云计算的兴起,特别是智能终端的应用,数据越来越大,越来越快,越来越复杂,推动了大数据这一全新概念的产生。大数据是一个数字集合,包括三类数据:一是结构化数据,如企业用的人事系统、财务系统、ERP系统,这些系统中的数据都是结构化的;二是半结构化数据,如电子邮件、用windows处理的文字、在网上看到的新闻;三是非结构化数据,如传感器、移动终端、社交网络产生的数据。根据全球统计,现在非结构化数据占到数据总量的85%左右,而传统的数据库技术没有办法对这些数据进行抓取、存储和分析。
IBM认为大数据具有四个特性。第一,数据量特别庞大;第二,数据种类特别多;第三,速度很快,像流水一样在运动,如微博、短信、微信、facebook每时每刻都在产生数据;第四,数据的准确性,如社交网络发表的言论可能带一些情绪化的内容,不一定真实准确,需要考虑这些数据的可预测性。
现在企业最常用的是交易数据,但还有很大一部分数据是交互数据,如社区网络数据、新闻媒体数据、微博数据、微信数据,如果能够把交易数据和交互数据糅合起来进行大数据处理,就有机会开展业务创新,促进整个业务的转型,这也正是
大数据的分析过程。
二、大数据的应用
不同类型数据的分析手段和分析能力不一样。静态的结构化数据,可以制作业务报表,进行数据挖掘,这是最传统的数据分析方式;文本的和非结构化数据,可以建立一个非结构化的数据平台,集中文本、影像、微博、社交网络数据,做企业搜索或者内容挖掘,开展舆情分析、声誉度分析,精准营销;流动的数据,即流数据,像流水一样,如果不用就流过去了,要进行实时的监测、监控,开展实时的产品与服务提供,即实时最佳行动推荐。一个企业要创新、要发展,除了传统的数据以外,还要把非结构化数据、流数据用在日常业务当中,对产品、流程、客户体验进行创新。不同类型的数据是相互融合的,可以互相配合来做分析,这样就突破了传统的分析模式,能够带来业务创意和创新。
传统的分析手段就不介绍了,主要介绍两个新的手段:流计算和企业非流数据的应用。流计算怎么实现?从传感器、网络日志、网上点击流实时采集下来,制定一些业务规则,实时满足业务规则的东西摘录出来,实时判断。比如某人在一天中打通了20个电话,但不到2分钟就挂断了,这个电话可能是欺诈电话,这就是业务规则,当下一个电话的数据流发生时,就会自动判断,这个是一个异常的话单,是一个欺诈的单位,这在电信企业中已经应用了。银行也一样,开展了信用卡的实时监测。另外一种手段是内容计算。传统处理都是数据库表格的方式,而现在要处理内容。什么叫内容?一篇新闻和一篇报道就
是内容。内容怎么处理?通过分词处理、内容归档,建立缩影,进而分析。这些新的技术在各行各业有广泛的应用前景,下面具体介绍一些具体的案例。
一是社交媒体跟舆情的分析。首先,从微博、社交媒体中把需要的文档、文章,通过爬虫从网上爬下来,放在非结构化的数据平台中,对内容进行分词、句法分析、情感分析,同时做一些关系实体的识别,通过这些内容、关系分析企业声誉度、品牌、服务质量,跟踪产品评价和市场动态,做企业层面舆情的监控。
二是利用360度全景客户视图开展营销、销售。传统的客户视图基于客户在本企业的交易数据,但是新的技术手段出现后,很多企业考虑全景的客户视图,除了企业本身的交易数据以外,把客户在社交网络上、媒体、交互数据上的一些信息集成起来,和原来传统的数据集中在一起,做全景的客户视图,全面了解客户。目前在银行、电信行业,很多企业都在做这个事情。360度全景视图怎么做?利用外部的社交网络数据,对客户社交网络进行画像,对客户在网络上的信息进行归类,有些是客户的评价讨论,有些是客户的倾向性信息,还有客户情绪的信息、行为的数据,全面整合,对客户进行网络的画像。基于这个画像,企业可以实现微观的客户细分、营销活动管理、信誉风险的评估以及竞争对手的分析。
三是通过大数据开展关联企业、交易对手风险暴露分析和事件监测。将交易所、证监会、银监会、安全部门、公安部门的监管文件,以及新闻、出版物、社交媒体数据爬下来,刻画企业的社交网络图,实时展示企业与外界的联系。
四是客户之声。客户微博的言论,对企业、对产品有评论,可以爬下来,做语意分析,提取关键词,建立模型,建立规则,自动识别客户反映的需求或问题。识别后主要有四个方面的用途,一是可以发现潜在的问题,二是可以预先做舆论导向,三是发现新产品的一些机会,四是提高客户的忠诚度。
五是客户的信用风险评估。比如花旗银行本身掌握客户的很多交易的数据,同时也会采集客户的一些外部信息,以及交易对手信息、市场信息、新闻评论,并且把这些数据关联起来。当客户贷款时,系统通过模型能自动判断贷款利率(因为美国的利率是浮动的,这个利率会给信贷员提供参考)。这与阿里金融异曲同工。这方面的应用还有很多,比如保险公司获取客户体检的信息以及病历,从而判断客户大概得了什么病,应该用什么药,并把这些结论提供给医生做实时参考。
六是应用场景对客户做社区划分,从而开展精准营销和销售。基于客户的外部数据及企业自身积累的非结构化数据、交易数据,对客户进行社区划分,当有新客户的时候,就能判断其大概属于哪个社区,主动推荐产品。现在,很多金融机构或营销企业,都利用这种手段做精准营销。
七是网点选择。把不同区域的宏观数据、微观数据,以及社交数据证合在一起,建立模型,判断应该在哪个地方、哪个区域开设一个网点。同时,还可以利用摄像、视频数据开展网点优化。比如,地铁人流上下高峰期都在流动,摄像头每时每刻都在监控,分析视频的数据后,可以发现人员流动的瓶颈,这就是布局不合理的地方,需要改进,疏导人流。同样地,银行业也在利用这一技术开展网点内部的优化,设置柜台,合理
布局,以符合客户的习惯。
三、开展大数据业务的措施
2012年6~9月份的时候,IBM公商业价值研究院和牛津大学赛德商学院联合开展研究,针对大数据的应用,对全球95个国家、26个行业、1144名企业高管和专业人士做了调研。结果显示,在全球各行各业中,企业高管都意识到自身需要更多地了解大数据、使用大数据。
大数据的使用包括四个阶段。首先是教育阶段,了解什么是大数据、大数据能做什么;第二是探索阶段,分析业务需求是什么,考虑如果有了大数据这种技术,要做什么;第三是接触阶段,做一些试点,做一些验证;第四是部署阶段,真正使用大数据。根据调查,目前已经有28%的企业开始做大数据的试验与实践,有47%的企业已经开始大数据的相关活动,有22%的企业进入接触阶段,6%的企业已经在部署大数据的应用。
大数据的应用,与企业组织的行为模式也是相关的,不同的阶段需要不同的资源支持。对此,报告提供了五点建议。第一,以客户为中心,推动大数据起步。第二,制订整个企业的大数据蓝图,规划数据如何应用。第三,从现有的数据开始,比如企业内部的网站、邮件等,实现近期目标。第四,根据业务优先级逐渐建立企业的分析能力。企业分析能力分为三大类,除了传统的数据库数据挖掘以外,还要培育内容挖掘能力、实时分析能力,并将三者结合起来。第五,基于可衡量的指标,制订投资回报的分析。
大数据时代下的企业管理与创新
IBM 全球业务咨询服务部业务分析与优化服务团队
中国区总经理 谢国忠
一、大数据的概念
在讲大数据之前先来看一下阿里巴巴,从阿里金融说起。目前金融界特别关注阿里巴巴的微贷,这是银行界未来最可怕的潜在对手。为什么可怕?阿里金融拿到金融执照短短几年时间,到2012年6月份其微贷企业已经达到12.9万家企业,贷款总额260亿万元,到2012年年底其服务的微小企业已经超过20万家。
阿里金融背后的实质是什么?有两个方面,一个方面叫大数据经营,另一个方面叫业务创新,这两方面结合在一起,颠覆了这个行业。具体而言,阿里金融利用网上的客户信用数据与行为数据,建立网络数据模型及信用体系。借此给每一个商铺、每一个店家做信用等级的评分,根据这个评分阿里金融去发放微贷,从500块钱到100万不等,并开发了很多业务产品,包括订单贷款、信用贷款等等。阿里金融打破了银行的传统做法,不需要抵押,不需要担保,只依赖于大数据,通过大数据应用和业务创新,改变了一个行业,改变了游戏规则。
大数据目前在全球已经用于各行各业,比如金融服务业、公共事业、数字媒体、零售、司法执法等。可是到底什么叫大数据?2011年5月份,麦肯锡全球研究院,发表了一篇非常有名的报告
—《大数据:创新、竞争和生产力的下一个新领域》,最早提出了大数据的概念。这篇研究报告主要提了两个观点,一是数据已经渗透到每一个行业、每一个业务职能领域;二是海量数据的应用意味着下一波或者新一轮生产率的增长和消费者盈余浪潮的到来。
从技术角度讲,大数据的产生是这个时代的产物。伴随物联网、移动网、云计算的兴起,特别是智能终端的应用,数据越来越大,越来越快,越来越复杂,推动了大数据这一全新概念的产生。大数据是一个数字集合,包括三类数据:一是结构化数据,如企业用的人事系统、财务系统、ERP系统,这些系统中的数据都是结构化的;二是半结构化数据,如电子邮件、用windows处理的文字、在网上看到的新闻;三是非结构化数据,如传感器、移动终端、社交网络产生的数据。根据全球统计,现在非结构化数据占到数据总量的85%左右,而传统的数据库技术没有办法对这些数据进行抓取、存储和分析。
IBM认为大数据具有四个特性。第一,数据量特别庞大;第二,数据种类特别多;第三,速度很快,像流水一样在运动,如微博、短信、微信、facebook每时每刻都在产生数据;第四,数据的准确性,如社交网络发表的言论可能带一些情绪化的内容,不一定真实准确,需要考虑这些数据的可预测性。
现在企业最常用的是交易数据,但还有很大一部分数据是交互数据,如社区网络数据、新闻媒体数据、微博数据、微信数据,如果能够把交易数据和交互数据糅合起来进行大数据处理,就有机会开展业务创新,促进整个业务的转型,这也正是
大数据的分析过程。
二、大数据的应用
不同类型数据的分析手段和分析能力不一样。静态的结构化数据,可以制作业务报表,进行数据挖掘,这是最传统的数据分析方式;文本的和非结构化数据,可以建立一个非结构化的数据平台,集中文本、影像、微博、社交网络数据,做企业搜索或者内容挖掘,开展舆情分析、声誉度分析,精准营销;流动的数据,即流数据,像流水一样,如果不用就流过去了,要进行实时的监测、监控,开展实时的产品与服务提供,即实时最佳行动推荐。一个企业要创新、要发展,除了传统的数据以外,还要把非结构化数据、流数据用在日常业务当中,对产品、流程、客户体验进行创新。不同类型的数据是相互融合的,可以互相配合来做分析,这样就突破了传统的分析模式,能够带来业务创意和创新。
传统的分析手段就不介绍了,主要介绍两个新的手段:流计算和企业非流数据的应用。流计算怎么实现?从传感器、网络日志、网上点击流实时采集下来,制定一些业务规则,实时满足业务规则的东西摘录出来,实时判断。比如某人在一天中打通了20个电话,但不到2分钟就挂断了,这个电话可能是欺诈电话,这就是业务规则,当下一个电话的数据流发生时,就会自动判断,这个是一个异常的话单,是一个欺诈的单位,这在电信企业中已经应用了。银行也一样,开展了信用卡的实时监测。另外一种手段是内容计算。传统处理都是数据库表格的方式,而现在要处理内容。什么叫内容?一篇新闻和一篇报道就
是内容。内容怎么处理?通过分词处理、内容归档,建立缩影,进而分析。这些新的技术在各行各业有广泛的应用前景,下面具体介绍一些具体的案例。
一是社交媒体跟舆情的分析。首先,从微博、社交媒体中把需要的文档、文章,通过爬虫从网上爬下来,放在非结构化的数据平台中,对内容进行分词、句法分析、情感分析,同时做一些关系实体的识别,通过这些内容、关系分析企业声誉度、品牌、服务质量,跟踪产品评价和市场动态,做企业层面舆情的监控。
二是利用360度全景客户视图开展营销、销售。传统的客户视图基于客户在本企业的交易数据,但是新的技术手段出现后,很多企业考虑全景的客户视图,除了企业本身的交易数据以外,把客户在社交网络上、媒体、交互数据上的一些信息集成起来,和原来传统的数据集中在一起,做全景的客户视图,全面了解客户。目前在银行、电信行业,很多企业都在做这个事情。360度全景视图怎么做?利用外部的社交网络数据,对客户社交网络进行画像,对客户在网络上的信息进行归类,有些是客户的评价讨论,有些是客户的倾向性信息,还有客户情绪的信息、行为的数据,全面整合,对客户进行网络的画像。基于这个画像,企业可以实现微观的客户细分、营销活动管理、信誉风险的评估以及竞争对手的分析。
三是通过大数据开展关联企业、交易对手风险暴露分析和事件监测。将交易所、证监会、银监会、安全部门、公安部门的监管文件,以及新闻、出版物、社交媒体数据爬下来,刻画企业的社交网络图,实时展示企业与外界的联系。
四是客户之声。客户微博的言论,对企业、对产品有评论,可以爬下来,做语意分析,提取关键词,建立模型,建立规则,自动识别客户反映的需求或问题。识别后主要有四个方面的用途,一是可以发现潜在的问题,二是可以预先做舆论导向,三是发现新产品的一些机会,四是提高客户的忠诚度。
五是客户的信用风险评估。比如花旗银行本身掌握客户的很多交易的数据,同时也会采集客户的一些外部信息,以及交易对手信息、市场信息、新闻评论,并且把这些数据关联起来。当客户贷款时,系统通过模型能自动判断贷款利率(因为美国的利率是浮动的,这个利率会给信贷员提供参考)。这与阿里金融异曲同工。这方面的应用还有很多,比如保险公司获取客户体检的信息以及病历,从而判断客户大概得了什么病,应该用什么药,并把这些结论提供给医生做实时参考。
六是应用场景对客户做社区划分,从而开展精准营销和销售。基于客户的外部数据及企业自身积累的非结构化数据、交易数据,对客户进行社区划分,当有新客户的时候,就能判断其大概属于哪个社区,主动推荐产品。现在,很多金融机构或营销企业,都利用这种手段做精准营销。
七是网点选择。把不同区域的宏观数据、微观数据,以及社交数据证合在一起,建立模型,判断应该在哪个地方、哪个区域开设一个网点。同时,还可以利用摄像、视频数据开展网点优化。比如,地铁人流上下高峰期都在流动,摄像头每时每刻都在监控,分析视频的数据后,可以发现人员流动的瓶颈,这就是布局不合理的地方,需要改进,疏导人流。同样地,银行业也在利用这一技术开展网点内部的优化,设置柜台,合理
布局,以符合客户的习惯。
三、开展大数据业务的措施
2012年6~9月份的时候,IBM公商业价值研究院和牛津大学赛德商学院联合开展研究,针对大数据的应用,对全球95个国家、26个行业、1144名企业高管和专业人士做了调研。结果显示,在全球各行各业中,企业高管都意识到自身需要更多地了解大数据、使用大数据。
大数据的使用包括四个阶段。首先是教育阶段,了解什么是大数据、大数据能做什么;第二是探索阶段,分析业务需求是什么,考虑如果有了大数据这种技术,要做什么;第三是接触阶段,做一些试点,做一些验证;第四是部署阶段,真正使用大数据。根据调查,目前已经有28%的企业开始做大数据的试验与实践,有47%的企业已经开始大数据的相关活动,有22%的企业进入接触阶段,6%的企业已经在部署大数据的应用。
大数据的应用,与企业组织的行为模式也是相关的,不同的阶段需要不同的资源支持。对此,报告提供了五点建议。第一,以客户为中心,推动大数据起步。第二,制订整个企业的大数据蓝图,规划数据如何应用。第三,从现有的数据开始,比如企业内部的网站、邮件等,实现近期目标。第四,根据业务优先级逐渐建立企业的分析能力。企业分析能力分为三大类,除了传统的数据库数据挖掘以外,还要培育内容挖掘能力、实时分析能力,并将三者结合起来。第五,基于可衡量的指标,制订投资回报的分析。