手机用户精准识别

手机用户精准识别

摘要

随着移动通信、互联网业务的迅速发展,手机已经从奢侈品变成了生活日

用品,是我们日常生活中不可缺少的一部分。人们随时随地使用手机打电话、发短信、上网,而用户的这些行为以及其个人基本信息均在运营商处有所记录。 今天我们就在这里讨论一下职场新人的识别问题。

针对问题一,在分析了职场新人的定义的基础上,我们用流量费、通话费、短信条数、上网时长四个加权因素来综合刻画职场新人。我们运用加权模糊聚类的方法筛选出职场新人,并逐步修改四个影响因素的范围来调整职场新人,最后我们得到在所给的手机用户中职场新人有334人。

针对问题二,在第一问确定的职场新人的基础上,我们用MATLAB对BP神经网络进行训练并最终对所给的数据进行了分类。我们将数据表中手机信息不详的职场新人单独列举出来,根据上问中信息完整的职场新人的相关指标因子来确定手机信息不详的职场新人终端大致的价格范围。

针对问题三,为了预测职业类型不详的职场新人的职业,我们运用朴素贝叶斯模型先对信息完整的职场新人进行分类。然后根据刻画职场新人的四个影响因素与职场新人职业之间的关系,我们预测出两个职业信息不详的职场新人分别是从事房地产经营产业和其他商务服务业的。

针对问题四,我们先将所有的职场新人根据这四个属性聚为四类。通过spss中的K-means算法我们得到了4个类的聚类中心,以及每个职场新人所属的类别,这个通过每个职场新人的属性值和聚类中心的属性值的大小来确定。当职场新人与聚类中心的距离小的时候,这个职场新人就属于这个类别;当这个距离大的时候,该职场新人就不属于这个类别。我们用马氏距离来刻画这个不同样本之间的距离,最后我们根据每个类别中用户的职业类型的大致情况来确定该用户的教育背景。

关键词:加权模糊聚类 BP神经网络 朴素贝叶斯模型 K-means聚类

一、 问题重述 1.1 问题背景

在当今这个信息飞速发展的时代,移动通信、互联网业务迅速发展,手机已经成为我们日常生活中不可缺少的一部分。人们随时随地使用手机打电话、发短信、上网,手机的功能也越来越强大,不同人群对手机的要求也是有很大的差别。年轻人更多追求的是新鲜事物,而中老年人还是只要求手机最基本的通话、短信等功能。每个手机用户的信息都存储在运营商的服务器中,为了便于针对不同用户推出合适的产品和服务,运营商们需要精准的识别用户类型。这里我们主要考虑这样几种类型的手机用户,异网高端型、种子用户型、职场新人型、空巢老人型。

职场新人,通常指处于毕业前的实习阶段或刚毕业离开校园(专科或专科以上)工作不到1年的年轻群体。他们虽然收入不高,但暂时也没有太多压力,经常追求新鲜事物、乐于且敢于消费。他们有着各自的职业追求,是社会的潜在精英,将成为运营商未来的高端用户。职场新人正处于人生的十字路口,在各方面即将进入全面转型。

今天我们就一起走进职场新人型手机用户的世界。 想知道你是属于哪个类型吗?那就一起来看看吧。 1.2 需要解决的问题

根据题中所给的某城市某运营商的手机公众用户数据,其中包括用户资料表、通话清单表、短信清单表。为了便于针对不同的用户推出合适的产品和服务,我们需要准确地识别用户类型,完成下面的问题: 1) 根据附表中的数据,识别该城市的职场新人;

2) 对于手机信息不详的职场新人,估算其终端大致的价格范围; 3) 对于职业类型不详的职场新人,请预测其职业类型;

4) 请识别职场新人的教育背景,如重点院校、非重点院校、专科本科、硕博等。

二、 问题分析

针对问题一,为了识别职场新人,我们首先要确定判定职场新人的标准。根据题目对职场新人的定义,我们选取了流量费、通话费、短信条数、上网时长四个影响因素作为识别的标准。然后我们确定每个因素属于职场新人的范围,从中筛选出了典型用户。我们运用加权模糊聚类的方法将这些典型用户聚为一类,然后对每个用户求这些主要因素的加权平均值,得到职场新人的加权平均值范围。我们将所有用户用这个加权平均值范围来筛选得到职场新人的总人数。

针对问题二,在第一问确定的职场新人的基础上,我们将数据表中的手机信息不详的职场新人单独列举出来。我们用BP神经网络得到了上问中信息完整的职场新人的相关指标因子与其手机价格之间的关系,从而确定了信息不完整的职场新人终端大致的价格范围。

针对问题三,我们采用了朴素贝叶斯网络模型来对信息完整的职场新人按照职业类型进行分类,得到了职场新人的职业类型与四个影响因素之间的关系。从而根据这个关系和信息不详的职场新人的因素特征得到了他们的职业类型。

针对问题四,我们先将所有的职场新人根据四个属性聚为四类,通过spss我们得到了4个类的聚类中心以及每个职场新人所属的类别。我们用马氏距离来刻画不同样本之间的距离大小,根据每个职场新人的属性值和聚类中心的属性值

的大小来确定职场新人所属的类别,最后我们根据每个用户聚类之后其职业类型的大致情况来确定该用户的教育背景。

三、 模型假设与符号系统 3.1 模型的假设

1) 本网手机用户的行为特征在很长的一段时间内没有太大的变化。 2) 假设手机用户在该月中都不存在换号的情况。

3) 假设题中附件所给的所有手机用户的信息数据真实可靠。

符号

含义 特性指标

第j个样本的第l个指标观测值

标准化后的观测值 第j个数据属于第i类的隶属度

模糊相对权重 网络的权系数 后验概率 先验概率

x1,x2,L,xn

xjl

x*jl

jl

FRW

ij

P(Yi|X)

P(X)

四、 问题一的建模与求解 4.1 问题一的分析

本问题主要研究如何精确识别职场新人,为了识别职场新人,我们首先要确定判定职场新人的标准,根据题目对职场新人的定义 ,我们筛选出了20到30岁之间的153890用户。为了简化问题,我们剔除了套餐档次、是否VIP、身份证区号等无效因素,最终得到四个主要因素(流量费、通话费、短信条数、上网时长)。然后我们确立每个因素属于职场新人的标准,从中筛选出了典型用户。我们运用加权模糊聚类的方法将这些典型用户聚为一类,综合分析这些主要因素,将这些因素量化且标准化,然后对每个用户求这些主要因素的加权平均值,得到职场新人的加权平均值范围。我们将所有用户用这个加权平均值范围来筛选得到职场新人的总人数。

我们使用的加权模糊聚类法是一种基于加权模糊推理网络的分类方法,网络的基本信息处理单元为模糊推理神经元,融合了模糊逻辑能够较完整的表达领域规则和先验知识以及神经网络自适应环境的优点。根据模糊推理规则的量化表示形式和微分方程数值解的动力学思想推导出网络一种新的学习算法。该算法以文本特征谓词的真度作为分类依据,体现了模糊分类的思想验证了该方法的有效性。

4.2 数据预处理

我们首先从原始数据中按照年龄选出年龄在20到30岁之间的用户信息,经过筛选后得到153890个用户(其中包括信息有缺失的用户)。我们分析这153890个用户的这4个主要因素,根据题目中对职场新人的定义我们可知他们的流量费、通话费、短信条数不会太小也不会太大,然后我们就设置了这四个主要因素的上下限。如表 年龄 流量费 通话费 短信条数 20-30 10-300(元) 10-300(元) 50-800(条) 外,我们将流量费、通话费、短信条数、上网时长这四个影响因素进行0-1标准化,消除其量纲的影响,然后我们给他们赋予权重分别为0.3,0.2,0.2,0.3。根据这几个权重我们算出模糊相对指标因子,最后再在这1662人中选出模糊相对指标因子大于0.25的用户,作为我们最终的职场新人。

4.3 模型的建立

设有n个样本x1,x2,L,xn,每个样本有f种特性指标,用xjl表示第j个样本

ˆl表示第l个特性指标的样本平均值和样本标准第l个指标的观测值,而用l与

偏差。这里由于这些主要因素的单位不同,必须先对原始数据进行标准化处理以

消除量纲的影响,我们考虑用

x*jl

xjllˆl

,j1,2,L,n;l1,2,Lf

作为标准化后的观测值数据。

令P{P,2,L,c}为论域X上的一个模糊分割。根据模糊集的概念,每一个i,i1样本点可以有属于一个以上类的隶属度。因而,定义第j个数据点属于第i类的隶属度为ijPi(xj)[0,1]且满足以下两个约束式



i1

c

ijn

1,j1,2,L,n

0ijn

j1

对c类分类与n个数据点定义一个加权模糊c分割空间,也就是Mwfc

Mwfc{P|ij[0,1],



i1

c

ij

1,0ijn}

j1

n

故对于任何的PMwfc,一个加权模糊分割矩阵为P。 我们假设代表各样本的统计特性指标因子的模糊相对权重为

FRW(FRW1,FRW2,FRW3,FRW4),其中FRW1,FRW2,FRW3,FRW4分别表示流量费、通话费、短信条数、上网时长对是否是职场新人的影响权重大小。则加权模糊分割矩阵P的聚类准则为

Jwfc(P,v)(ij)m(dij)2

j1i1

nc

其中dijd(xj*FRWvi)[(xjl(t)FRWlvi(t))2]1/2,第i个类中心到第j个数据

l1

f

点的欧几里得距离,ij表示第j个数据点属于第j类的隶属度,vi表示第i个类中心,FRWl表示第l个评价因素的模糊相对权重值。如果考虑到个别时期的分类,只要对第t期聚类准则条件下求ij及vi使满足

(t)2

minJ(P,v)(ij)m(dij) (1)

(t)

wfc

(t)

j1i1cn

c

s.t



i1

ij

1,0

j=1

n

利用拉格朗日乘数法,将式(1)分别对ij及vi求偏微分后,得到第j个样本对第i类类中心的隶属度

1

mm1(t)(t)2(xkjFRWl-vij)cj=1uik=f

i=1(x(t)FRWv(t))2

kjllj

l1



1

及第i类的类中心

vi(t)

FRWl(ij)mx(jlt)

j1

n

(

j1

n

ij

)m

(t)

然后更新分割矩阵P(t)ij,计算新的模糊分类

(t1)

P(t1)P,P2(t1),L,Pc(t1) 1

对样本点至各类中心的隶属度中选取最大值,即为该点隶属于该类。

4.4 模型的求解

已知FRW10.3,FRW20.2,FRW30.2,FRW4=0.3,最终可以得到

490624 251961 494156 86106 803742 233515 622007 128899 679707 376737 1154200 …

28 21 26 30 29 25 21 21 23 23 29 …

56 56 56 56 57 19 56 56 56 56 56 …

0 android2.1 android2.1 android android1.6 android2.1 android 0 android1.6 android2.1 android2.1

638 0 0 0 0 0 0 0 0 0 0 …

0 1 1 0 1 1 0 0 0 0 1 …

10.07 13.35 20.03

41.59 35.47 14.73

97 262 73 84 135 95 63 81 699 140 786 …

520.22 482.12 620.39 547.26 597.69 465.08 467.37 475.22 421.01 573.56 416.57 …

38.54 188.79 49.57 156.24 14.33 23.21 23.02 14.2 13.73 60.1 …

91.63 38.32 12.87 80.66 12.16 156.01 …

数据图。我们总共统计有334个职场新人。

五、 问题二的建模与求解 5.1 问题的分析

在第一问确定的职场新人的基础上,我们将数据表中的手机信息不详的职场新人单独列举出来,根据上问中信息完整的职场新人的相关指标因子来确定信息不完整的职场新人终端大致的价格范围。这一问我们采用神经网络的方法,因为神经网络具有大规模并行处理、自适应性、自组织性及容错性等其他算法无法比拟的优点,从而得到了广泛的应用。我们借用神经网络中的BP神经网络算法对问题进行分析,它是前向神经网络的核心部分,体现了神经网络最精华的部分。BP分类算法的具体过程如下:1.根据网络要求对输入进行预处理:2.采用BP网络对已处理的输入进行学习与训练;3.用训练好的BP网络对待分类样本进行模式分类。BP神经网络算法的学习训练过程如下:1.初始化网络对网络参数及各权系数进行赋值,其中权系数应取随机数;2.输入训练样本,计算各层节点的网络输出值,并与真实值相比较,得出网络的输出误差;3.依据误差反向传播规则,调整隐层之间以及隐层与输入层之间的权系数;4.重复步骤(2)和(3),直至预测预测误差满足条件或训练次数达到规定次数。在建立了有关BP神经网络算法的基本概念后,我们就可以运用Matlab已有的神经网络工具箱对BP神经网络进行训练并最终对所给的数据进行分类。

5.2 数据预处理

表5.2.1 手机价格信息不详的职场新人

209986 245353 274827 359853 433869 456636 495912 773068 852432 1096268 未知 未知 未知 未知 未知 未知 未知 未知 未知 未知 35.34 44.61 21.67 47.17 47.74 23.8 118.48 70.21 18.91 12.97 33.21 55.15 90.61 61.4 19.76 99.9 19.9 13.7 26.13 13.32 101 163 590 111 187 92 240 183 132 217 502.43 507.04 515.21 607.06 469.51 549.93 619.46 435.58 505.77 535.47

面将上表中的已知的4个综合因子利用神经网络的方法赋予权重而且不停地改变权重,最后得出终端的价格。

5.3 模型的建立

BP神经网络是反向传播网络。它是一种多层向前网络,采用最小均方误差的学习方式。BP算法中对网络的权系数ij进行递归求取的执行步骤如下:

第一步:对权系数ij置初值,对各层的权系数ij置一个较小的非零随机数,但其中

j,n1i。

第二步:输入一个样本x(x1,x2,L,xn,1),以及对应期望输出

y(y1,y2,L,yn,1)

第三步:计算各层的输出,对于第k层第i个神经元的输出xik,有

yikf[uik]

其中,

1k

uikijxkji

j

式中,

k1xn11,i(n1)

第四步,求各层的学习误差dik,对于输出层有k=m,有:

dimxim(1xim)(ximyim)

对于其它层,有:

dikxik(1xik)(ijxij1ik)

j

第五步:修正权系数

1

ij(t1)ij(t)dikxkj

第六步:当求出了各层各个系数之后,可按照给定品质指标判别是否满足要

求。如果为满足,则返回第三步继续执行;如果满足要求,则算结束。

BP神经网络图如下:

图5.3.2 BP神经网络流程图

5.4模型的求解

这里的求解我们仍考虑模型一所考虑的4个影响因素对手机用户价格的影响,在利用BP网络求解问题过程中,可把问题分成以下6个模块进行处理: 1) 输入原始数据的矩阵,其中包括输入数据矩阵和目标矩阵;

2) 对输入数据矩阵和目标数据矩阵的数据进行归一化处理,即将每组数据都变

换到0-1之间的数;

3) 利用处理好的对BP网络进行训练;

4) 利用训练好的BP网络对原始数据进行仿真; 5) 用原始数据仿真的结果与已知数据进行对比测试 6) 利用训练好的BP网络对新数据进行仿真。

图5.4.1 用户与手机价格的关联图

上图表示是用BP神经网络的方法模拟出来的手机价格和实际手机价格之间的关系图 。

107803 209986 245353 274827 359853 433869 456636 495912 773068 852432 1096268

1036 3850 3850 382 348 3850 475 3850 3850 2040 277

19.88 35.34 44.61 21.67 47.17 47.74 23.8 118.48 70.21 18.91 12.97

51.96 33.21 55.15 90.61 61.4 19.76 99.9 19.9 13.7 26.13 13.32

56 101 163 590 111 187 92 240 183 132 217

548.69 502.43 507.04 515.21 607.06 469.51 549.93 619.46 435.58 505.77 535.47

[904,1168] [3604,4096] [3615,4085] [280,484] [261,435] [3681,4019] [373,578] [3619,4081] [3172,3988] [1904,2176] [205,350]

六、 问题三的建模与求解 6.1 问题的分析

问题需要对所涉及的职业信息不详的职场新人的职业类型进行预测。在这个分类问题中,常常需要把一个事物分到某个类别。一个事物具有很多属性,把它的众多属性看成一个向量,即X=( x1,x2,x3,L,xn),用X这个向量来代表这个事物。类别也有很多种,用集合Y(y1,y2,L,yn)表示。如果x属于y1级别,就可以给x 打上y1 标签,意思是说x属于y1 类别。这就是所谓的分类。针对这一问,我们最终采用了朴素贝叶斯网络模型来对其进行分类。其中我们考虑过模糊数学模型和神经网络模型,但是对比着朴素贝叶斯网络模型,我们觉得在模糊数学模型中,在确定影响某因素的诸因子在各因素重所占的比重时,遇到的主要困难是这些比重常常不易定量化。此外,当影响某因素的因子较多时,直接考虑个因子对该因素有多大程度的影响时,常常会因考虑不周全、顾此失彼而是决策者提出与他实际认为的重要程度不相一致的数据,甚至有可能提出一组隐含矛盾的数据。而朴素贝叶斯模型发源于古典数学理论,有着坚实的数学基础,以及稳定的分类效率。同时,朴素贝叶斯模型所需要的参数很少,对数据缺失不敏感,算法也比较简单。理论上,朴素贝叶斯模型与其他分类方法相比具有最小的误差率。在属性相关性较小时,朴素贝叶斯模型的性能最为良好。

6.2 数据预处理

这是从第一问所确定的职场新人中提取出来的职业类型不详的职场新人,其

6.3 模型的建立

朴素贝叶斯网络分类器的流程如下:

C

图4.3.1.1 朴素贝叶斯网络结构

(1) 每个数据样本用一个n维特征向量X(x1,x2,x3,...xn)表示,分别描述对n

个属性A1,A2,...,An样本的n个度量。

(2) 假定有m个类Y1,Y2,...,Yn。给定一个未知的数据样本X(即没有属于具有

类标号),分类法将预测X属于具有最高后验概率(条件X下)的类。就是说,朴素贝叶斯分类器将未知的样本分配给类Yi,当且仅当

P(Yi|X)P(Yj|X),1jm,ji

这样,最大化P(Yi|X)。使P(Yi|X)最大的类Yi称为最大后验假定。根据贝叶斯定理有

P(Yi|X)

P(X|Yi)P(Yi)

P(X)

(3) 由于P(X)对于所有类为常数,只需要P(X|Yi)P(Yi)最大即可。如果类的

先验概率未知,则通常假设这些类是等概率的,即P(Y1)P(Y2)...P(Ym)。并据此只对P(X|Yi)最大化。否则,最大化P(X|Yi)P(Yi)。注意,类的先验概率可以用P(Yi)si/s计算,其中si是类Yi中的训练样本数,而s是训练样本总数。

图4.3.1.2 计算流程图

(4) 为对未知样本X分类,对每个类Yi,计算P(X|Yi)P(Yi)。样本X被指派

到类Yi,当且仅当

P(X|Yi)P(Yi)P(X|Yj),1jm,ji

即X被指派到P(X|Yi)P(Yi)最大的类Yi。

6.3 模型的求解

利用朴素贝叶斯算法,由于在原始职场新人数据中都只是缺失行业的信息,针对这样的问题,我们首先是要把职场新人分派在不同的行业中进行分析。那么,对于原始数据中给的那么多的综合因子,在我们进行数据处理之后变成了4个属性(x1,x2,x3,x4)。于是用这4个属性对这13类行业的职场新人进行区间划分,就是说先将这些行业聚成几大类,然后当确定了职业类型不详的职场新人属于哪一大类之后,再在这一大类中继续上述工作。但若只是把这些行业划分成几个固定的区间,则会带有很大的偶然性。为了避免这种偶然性的影响,我们将这些行业划分的区间个数从2个一直增加到10个。比如对于属性x1,将这个区间分别分成2,3,4…,10个小区间di,其中i2,3,...,10,分析未知职业的职场新人相应的属性X的数据最大可能处在的职业类型Yi(即该未知职业的职场新人的属性X处在职业类型Yi的概率最大),那么这样针对不同的区间划分会出现13种不同的结果,接着将这13个结果进行分类计数,则可以得到该未知行业类型处在各个行

业的次数,出现次数最多的行业类型就是该职场新人的行业类型。通过MATLAB编程求解,分析对处理后的4个属性的变化。

图6.4.1 朴素贝叶斯分类器主体程序流程图

通过贝叶斯分类器的计算,我们得到了这两个职场新人的职业类型结果分别为:

的可能性最大,为0.0055;手机号为201840的用户,他处于其他商务服务业的可能性最大,为0.0018,综上,我们确定了职业信息不详的职场新人的职业类型。

七、 问题四的建模与求解 7.1 问题的分析

经过上面三问的解答,我们对职场新人的定义以及附件中所缺少的信息都有了一定的了解。那么这一问,我们主要根据上面几问对于职场新人的识别来区分职场新人的教育背景。我们大致的思路是这样的:我们先将所有的职场新人根据四个属性聚为四类,通过spss我们先得到4个类的聚类中心,以及每个职场新人所属的类别,这个通过每个职场新人的属性值和聚类中心的属性值的大小来确定。当这个距离小的时候,这个职场新人就属于这个类别;但是当这个距离大的时候,该职场新人就不属于这个类别。我们用马氏距离来刻画这个不同样本之间的距离大小。最后我们根据每个用户聚类之后其职业类型的大致情况来确定该用户的教育背景。我们使用马氏距离是因为其不受量纲的影响,两点之间的马氏距离与原始数据的测量单位无关;由标准化数据和中心化数据(即原始数据与均值之差)计算出的二点之间的马氏距离相同,而且马氏距离还可以排除变量之间的相关性的干扰。 7.2 模型的建立

首先确定按照这4个属性分类之后职场新人的聚类中心,其聚类中心如下:

由聚类中心之间的距离我们确定出第一类是专科本科、第二类是重点院校、第三类是硕博、第四类是非重点院校。

马氏距离是一种有效的计算两个未知样本集的相似度的方法。与欧氏距离不同的是它考虑到各种特性之间的联系(例如:一条关于身高的信息会带来一条关于体重的信息,因为两者是有关联的)并且是尺度无关的(scale-invariant),即独立于测量尺度。 对于一个均值为,协方差矩阵为的多变量矢量

x(x1,x2,x3,L,xp)T,其马氏距离为

1n



xi

ni1

DM(x)

我们计算出样本的协方差矩阵,最后得到

然后我们用spss求得每个聚类中的案例数。

每个聚类中的案例数 聚类

1 2 3 4

有效 缺失

由上表我们得到这样的结论:第一类是专科本科类、第二类是重点院校类、第三个是硕博类、第四个是非重点类。

由上面的两个表,我们得知这四种类(专科本科、重点院校、硕博、非重点院校)中手机号码的分布情况,即每个职场新人的都对应到一个教育背景,这就是第四问中要求我们得到的结论。

八、 模型的优缺点 8.1 模型的优点

1.问题一中的加权模糊聚类模型选择了四个有代表性的影响因素,既保证了结果的准确性又减少了复杂度。

2.问题三中的朴素贝叶斯模型所需要的参数很少,对数据缺失不敏感,算法也比较简单。

3.问题四中选择的马氏距离不受量纲的影响,而且还可以排除变量之间的相关性的干扰。

8.2 模型的缺点

1.模型的假设中有些理想化的情况,与实际有偏差。

2.问题四中对教育背景的预测只是考虑了与职业的关系,这还不能完全反映 一个人的教育背景。

九、 参考文献

[1] 王忠玉.模糊数据统计学[M].哈尔滨:哈尔滨工业大学出版社,2008.

[2] 卓金武,魏永生,秦健,李必文.MATLAB在数学建模中的应用[M].北京:北京

航空航天大学大学出版社,2011.

梁宏胜,徐建民,成岳鹏.一种改进的朴素贝叶斯文本分类方法[J].河北大学学报(自然科学版),2007,27(3):327-331.

手机用户精准识别

摘要

随着移动通信、互联网业务的迅速发展,手机已经从奢侈品变成了生活日

用品,是我们日常生活中不可缺少的一部分。人们随时随地使用手机打电话、发短信、上网,而用户的这些行为以及其个人基本信息均在运营商处有所记录。 今天我们就在这里讨论一下职场新人的识别问题。

针对问题一,在分析了职场新人的定义的基础上,我们用流量费、通话费、短信条数、上网时长四个加权因素来综合刻画职场新人。我们运用加权模糊聚类的方法筛选出职场新人,并逐步修改四个影响因素的范围来调整职场新人,最后我们得到在所给的手机用户中职场新人有334人。

针对问题二,在第一问确定的职场新人的基础上,我们用MATLAB对BP神经网络进行训练并最终对所给的数据进行了分类。我们将数据表中手机信息不详的职场新人单独列举出来,根据上问中信息完整的职场新人的相关指标因子来确定手机信息不详的职场新人终端大致的价格范围。

针对问题三,为了预测职业类型不详的职场新人的职业,我们运用朴素贝叶斯模型先对信息完整的职场新人进行分类。然后根据刻画职场新人的四个影响因素与职场新人职业之间的关系,我们预测出两个职业信息不详的职场新人分别是从事房地产经营产业和其他商务服务业的。

针对问题四,我们先将所有的职场新人根据这四个属性聚为四类。通过spss中的K-means算法我们得到了4个类的聚类中心,以及每个职场新人所属的类别,这个通过每个职场新人的属性值和聚类中心的属性值的大小来确定。当职场新人与聚类中心的距离小的时候,这个职场新人就属于这个类别;当这个距离大的时候,该职场新人就不属于这个类别。我们用马氏距离来刻画这个不同样本之间的距离,最后我们根据每个类别中用户的职业类型的大致情况来确定该用户的教育背景。

关键词:加权模糊聚类 BP神经网络 朴素贝叶斯模型 K-means聚类

一、 问题重述 1.1 问题背景

在当今这个信息飞速发展的时代,移动通信、互联网业务迅速发展,手机已经成为我们日常生活中不可缺少的一部分。人们随时随地使用手机打电话、发短信、上网,手机的功能也越来越强大,不同人群对手机的要求也是有很大的差别。年轻人更多追求的是新鲜事物,而中老年人还是只要求手机最基本的通话、短信等功能。每个手机用户的信息都存储在运营商的服务器中,为了便于针对不同用户推出合适的产品和服务,运营商们需要精准的识别用户类型。这里我们主要考虑这样几种类型的手机用户,异网高端型、种子用户型、职场新人型、空巢老人型。

职场新人,通常指处于毕业前的实习阶段或刚毕业离开校园(专科或专科以上)工作不到1年的年轻群体。他们虽然收入不高,但暂时也没有太多压力,经常追求新鲜事物、乐于且敢于消费。他们有着各自的职业追求,是社会的潜在精英,将成为运营商未来的高端用户。职场新人正处于人生的十字路口,在各方面即将进入全面转型。

今天我们就一起走进职场新人型手机用户的世界。 想知道你是属于哪个类型吗?那就一起来看看吧。 1.2 需要解决的问题

根据题中所给的某城市某运营商的手机公众用户数据,其中包括用户资料表、通话清单表、短信清单表。为了便于针对不同的用户推出合适的产品和服务,我们需要准确地识别用户类型,完成下面的问题: 1) 根据附表中的数据,识别该城市的职场新人;

2) 对于手机信息不详的职场新人,估算其终端大致的价格范围; 3) 对于职业类型不详的职场新人,请预测其职业类型;

4) 请识别职场新人的教育背景,如重点院校、非重点院校、专科本科、硕博等。

二、 问题分析

针对问题一,为了识别职场新人,我们首先要确定判定职场新人的标准。根据题目对职场新人的定义,我们选取了流量费、通话费、短信条数、上网时长四个影响因素作为识别的标准。然后我们确定每个因素属于职场新人的范围,从中筛选出了典型用户。我们运用加权模糊聚类的方法将这些典型用户聚为一类,然后对每个用户求这些主要因素的加权平均值,得到职场新人的加权平均值范围。我们将所有用户用这个加权平均值范围来筛选得到职场新人的总人数。

针对问题二,在第一问确定的职场新人的基础上,我们将数据表中的手机信息不详的职场新人单独列举出来。我们用BP神经网络得到了上问中信息完整的职场新人的相关指标因子与其手机价格之间的关系,从而确定了信息不完整的职场新人终端大致的价格范围。

针对问题三,我们采用了朴素贝叶斯网络模型来对信息完整的职场新人按照职业类型进行分类,得到了职场新人的职业类型与四个影响因素之间的关系。从而根据这个关系和信息不详的职场新人的因素特征得到了他们的职业类型。

针对问题四,我们先将所有的职场新人根据四个属性聚为四类,通过spss我们得到了4个类的聚类中心以及每个职场新人所属的类别。我们用马氏距离来刻画不同样本之间的距离大小,根据每个职场新人的属性值和聚类中心的属性值

的大小来确定职场新人所属的类别,最后我们根据每个用户聚类之后其职业类型的大致情况来确定该用户的教育背景。

三、 模型假设与符号系统 3.1 模型的假设

1) 本网手机用户的行为特征在很长的一段时间内没有太大的变化。 2) 假设手机用户在该月中都不存在换号的情况。

3) 假设题中附件所给的所有手机用户的信息数据真实可靠。

符号

含义 特性指标

第j个样本的第l个指标观测值

标准化后的观测值 第j个数据属于第i类的隶属度

模糊相对权重 网络的权系数 后验概率 先验概率

x1,x2,L,xn

xjl

x*jl

jl

FRW

ij

P(Yi|X)

P(X)

四、 问题一的建模与求解 4.1 问题一的分析

本问题主要研究如何精确识别职场新人,为了识别职场新人,我们首先要确定判定职场新人的标准,根据题目对职场新人的定义 ,我们筛选出了20到30岁之间的153890用户。为了简化问题,我们剔除了套餐档次、是否VIP、身份证区号等无效因素,最终得到四个主要因素(流量费、通话费、短信条数、上网时长)。然后我们确立每个因素属于职场新人的标准,从中筛选出了典型用户。我们运用加权模糊聚类的方法将这些典型用户聚为一类,综合分析这些主要因素,将这些因素量化且标准化,然后对每个用户求这些主要因素的加权平均值,得到职场新人的加权平均值范围。我们将所有用户用这个加权平均值范围来筛选得到职场新人的总人数。

我们使用的加权模糊聚类法是一种基于加权模糊推理网络的分类方法,网络的基本信息处理单元为模糊推理神经元,融合了模糊逻辑能够较完整的表达领域规则和先验知识以及神经网络自适应环境的优点。根据模糊推理规则的量化表示形式和微分方程数值解的动力学思想推导出网络一种新的学习算法。该算法以文本特征谓词的真度作为分类依据,体现了模糊分类的思想验证了该方法的有效性。

4.2 数据预处理

我们首先从原始数据中按照年龄选出年龄在20到30岁之间的用户信息,经过筛选后得到153890个用户(其中包括信息有缺失的用户)。我们分析这153890个用户的这4个主要因素,根据题目中对职场新人的定义我们可知他们的流量费、通话费、短信条数不会太小也不会太大,然后我们就设置了这四个主要因素的上下限。如表 年龄 流量费 通话费 短信条数 20-30 10-300(元) 10-300(元) 50-800(条) 外,我们将流量费、通话费、短信条数、上网时长这四个影响因素进行0-1标准化,消除其量纲的影响,然后我们给他们赋予权重分别为0.3,0.2,0.2,0.3。根据这几个权重我们算出模糊相对指标因子,最后再在这1662人中选出模糊相对指标因子大于0.25的用户,作为我们最终的职场新人。

4.3 模型的建立

设有n个样本x1,x2,L,xn,每个样本有f种特性指标,用xjl表示第j个样本

ˆl表示第l个特性指标的样本平均值和样本标准第l个指标的观测值,而用l与

偏差。这里由于这些主要因素的单位不同,必须先对原始数据进行标准化处理以

消除量纲的影响,我们考虑用

x*jl

xjllˆl

,j1,2,L,n;l1,2,Lf

作为标准化后的观测值数据。

令P{P,2,L,c}为论域X上的一个模糊分割。根据模糊集的概念,每一个i,i1样本点可以有属于一个以上类的隶属度。因而,定义第j个数据点属于第i类的隶属度为ijPi(xj)[0,1]且满足以下两个约束式



i1

c

ijn

1,j1,2,L,n

0ijn

j1

对c类分类与n个数据点定义一个加权模糊c分割空间,也就是Mwfc

Mwfc{P|ij[0,1],



i1

c

ij

1,0ijn}

j1

n

故对于任何的PMwfc,一个加权模糊分割矩阵为P。 我们假设代表各样本的统计特性指标因子的模糊相对权重为

FRW(FRW1,FRW2,FRW3,FRW4),其中FRW1,FRW2,FRW3,FRW4分别表示流量费、通话费、短信条数、上网时长对是否是职场新人的影响权重大小。则加权模糊分割矩阵P的聚类准则为

Jwfc(P,v)(ij)m(dij)2

j1i1

nc

其中dijd(xj*FRWvi)[(xjl(t)FRWlvi(t))2]1/2,第i个类中心到第j个数据

l1

f

点的欧几里得距离,ij表示第j个数据点属于第j类的隶属度,vi表示第i个类中心,FRWl表示第l个评价因素的模糊相对权重值。如果考虑到个别时期的分类,只要对第t期聚类准则条件下求ij及vi使满足

(t)2

minJ(P,v)(ij)m(dij) (1)

(t)

wfc

(t)

j1i1cn

c

s.t



i1

ij

1,0

j=1

n

利用拉格朗日乘数法,将式(1)分别对ij及vi求偏微分后,得到第j个样本对第i类类中心的隶属度

1

mm1(t)(t)2(xkjFRWl-vij)cj=1uik=f

i=1(x(t)FRWv(t))2

kjllj

l1



1

及第i类的类中心

vi(t)

FRWl(ij)mx(jlt)

j1

n

(

j1

n

ij

)m

(t)

然后更新分割矩阵P(t)ij,计算新的模糊分类

(t1)

P(t1)P,P2(t1),L,Pc(t1) 1

对样本点至各类中心的隶属度中选取最大值,即为该点隶属于该类。

4.4 模型的求解

已知FRW10.3,FRW20.2,FRW30.2,FRW4=0.3,最终可以得到

490624 251961 494156 86106 803742 233515 622007 128899 679707 376737 1154200 …

28 21 26 30 29 25 21 21 23 23 29 …

56 56 56 56 57 19 56 56 56 56 56 …

0 android2.1 android2.1 android android1.6 android2.1 android 0 android1.6 android2.1 android2.1

638 0 0 0 0 0 0 0 0 0 0 …

0 1 1 0 1 1 0 0 0 0 1 …

10.07 13.35 20.03

41.59 35.47 14.73

97 262 73 84 135 95 63 81 699 140 786 …

520.22 482.12 620.39 547.26 597.69 465.08 467.37 475.22 421.01 573.56 416.57 …

38.54 188.79 49.57 156.24 14.33 23.21 23.02 14.2 13.73 60.1 …

91.63 38.32 12.87 80.66 12.16 156.01 …

数据图。我们总共统计有334个职场新人。

五、 问题二的建模与求解 5.1 问题的分析

在第一问确定的职场新人的基础上,我们将数据表中的手机信息不详的职场新人单独列举出来,根据上问中信息完整的职场新人的相关指标因子来确定信息不完整的职场新人终端大致的价格范围。这一问我们采用神经网络的方法,因为神经网络具有大规模并行处理、自适应性、自组织性及容错性等其他算法无法比拟的优点,从而得到了广泛的应用。我们借用神经网络中的BP神经网络算法对问题进行分析,它是前向神经网络的核心部分,体现了神经网络最精华的部分。BP分类算法的具体过程如下:1.根据网络要求对输入进行预处理:2.采用BP网络对已处理的输入进行学习与训练;3.用训练好的BP网络对待分类样本进行模式分类。BP神经网络算法的学习训练过程如下:1.初始化网络对网络参数及各权系数进行赋值,其中权系数应取随机数;2.输入训练样本,计算各层节点的网络输出值,并与真实值相比较,得出网络的输出误差;3.依据误差反向传播规则,调整隐层之间以及隐层与输入层之间的权系数;4.重复步骤(2)和(3),直至预测预测误差满足条件或训练次数达到规定次数。在建立了有关BP神经网络算法的基本概念后,我们就可以运用Matlab已有的神经网络工具箱对BP神经网络进行训练并最终对所给的数据进行分类。

5.2 数据预处理

表5.2.1 手机价格信息不详的职场新人

209986 245353 274827 359853 433869 456636 495912 773068 852432 1096268 未知 未知 未知 未知 未知 未知 未知 未知 未知 未知 35.34 44.61 21.67 47.17 47.74 23.8 118.48 70.21 18.91 12.97 33.21 55.15 90.61 61.4 19.76 99.9 19.9 13.7 26.13 13.32 101 163 590 111 187 92 240 183 132 217 502.43 507.04 515.21 607.06 469.51 549.93 619.46 435.58 505.77 535.47

面将上表中的已知的4个综合因子利用神经网络的方法赋予权重而且不停地改变权重,最后得出终端的价格。

5.3 模型的建立

BP神经网络是反向传播网络。它是一种多层向前网络,采用最小均方误差的学习方式。BP算法中对网络的权系数ij进行递归求取的执行步骤如下:

第一步:对权系数ij置初值,对各层的权系数ij置一个较小的非零随机数,但其中

j,n1i。

第二步:输入一个样本x(x1,x2,L,xn,1),以及对应期望输出

y(y1,y2,L,yn,1)

第三步:计算各层的输出,对于第k层第i个神经元的输出xik,有

yikf[uik]

其中,

1k

uikijxkji

j

式中,

k1xn11,i(n1)

第四步,求各层的学习误差dik,对于输出层有k=m,有:

dimxim(1xim)(ximyim)

对于其它层,有:

dikxik(1xik)(ijxij1ik)

j

第五步:修正权系数

1

ij(t1)ij(t)dikxkj

第六步:当求出了各层各个系数之后,可按照给定品质指标判别是否满足要

求。如果为满足,则返回第三步继续执行;如果满足要求,则算结束。

BP神经网络图如下:

图5.3.2 BP神经网络流程图

5.4模型的求解

这里的求解我们仍考虑模型一所考虑的4个影响因素对手机用户价格的影响,在利用BP网络求解问题过程中,可把问题分成以下6个模块进行处理: 1) 输入原始数据的矩阵,其中包括输入数据矩阵和目标矩阵;

2) 对输入数据矩阵和目标数据矩阵的数据进行归一化处理,即将每组数据都变

换到0-1之间的数;

3) 利用处理好的对BP网络进行训练;

4) 利用训练好的BP网络对原始数据进行仿真; 5) 用原始数据仿真的结果与已知数据进行对比测试 6) 利用训练好的BP网络对新数据进行仿真。

图5.4.1 用户与手机价格的关联图

上图表示是用BP神经网络的方法模拟出来的手机价格和实际手机价格之间的关系图 。

107803 209986 245353 274827 359853 433869 456636 495912 773068 852432 1096268

1036 3850 3850 382 348 3850 475 3850 3850 2040 277

19.88 35.34 44.61 21.67 47.17 47.74 23.8 118.48 70.21 18.91 12.97

51.96 33.21 55.15 90.61 61.4 19.76 99.9 19.9 13.7 26.13 13.32

56 101 163 590 111 187 92 240 183 132 217

548.69 502.43 507.04 515.21 607.06 469.51 549.93 619.46 435.58 505.77 535.47

[904,1168] [3604,4096] [3615,4085] [280,484] [261,435] [3681,4019] [373,578] [3619,4081] [3172,3988] [1904,2176] [205,350]

六、 问题三的建模与求解 6.1 问题的分析

问题需要对所涉及的职业信息不详的职场新人的职业类型进行预测。在这个分类问题中,常常需要把一个事物分到某个类别。一个事物具有很多属性,把它的众多属性看成一个向量,即X=( x1,x2,x3,L,xn),用X这个向量来代表这个事物。类别也有很多种,用集合Y(y1,y2,L,yn)表示。如果x属于y1级别,就可以给x 打上y1 标签,意思是说x属于y1 类别。这就是所谓的分类。针对这一问,我们最终采用了朴素贝叶斯网络模型来对其进行分类。其中我们考虑过模糊数学模型和神经网络模型,但是对比着朴素贝叶斯网络模型,我们觉得在模糊数学模型中,在确定影响某因素的诸因子在各因素重所占的比重时,遇到的主要困难是这些比重常常不易定量化。此外,当影响某因素的因子较多时,直接考虑个因子对该因素有多大程度的影响时,常常会因考虑不周全、顾此失彼而是决策者提出与他实际认为的重要程度不相一致的数据,甚至有可能提出一组隐含矛盾的数据。而朴素贝叶斯模型发源于古典数学理论,有着坚实的数学基础,以及稳定的分类效率。同时,朴素贝叶斯模型所需要的参数很少,对数据缺失不敏感,算法也比较简单。理论上,朴素贝叶斯模型与其他分类方法相比具有最小的误差率。在属性相关性较小时,朴素贝叶斯模型的性能最为良好。

6.2 数据预处理

这是从第一问所确定的职场新人中提取出来的职业类型不详的职场新人,其

6.3 模型的建立

朴素贝叶斯网络分类器的流程如下:

C

图4.3.1.1 朴素贝叶斯网络结构

(1) 每个数据样本用一个n维特征向量X(x1,x2,x3,...xn)表示,分别描述对n

个属性A1,A2,...,An样本的n个度量。

(2) 假定有m个类Y1,Y2,...,Yn。给定一个未知的数据样本X(即没有属于具有

类标号),分类法将预测X属于具有最高后验概率(条件X下)的类。就是说,朴素贝叶斯分类器将未知的样本分配给类Yi,当且仅当

P(Yi|X)P(Yj|X),1jm,ji

这样,最大化P(Yi|X)。使P(Yi|X)最大的类Yi称为最大后验假定。根据贝叶斯定理有

P(Yi|X)

P(X|Yi)P(Yi)

P(X)

(3) 由于P(X)对于所有类为常数,只需要P(X|Yi)P(Yi)最大即可。如果类的

先验概率未知,则通常假设这些类是等概率的,即P(Y1)P(Y2)...P(Ym)。并据此只对P(X|Yi)最大化。否则,最大化P(X|Yi)P(Yi)。注意,类的先验概率可以用P(Yi)si/s计算,其中si是类Yi中的训练样本数,而s是训练样本总数。

图4.3.1.2 计算流程图

(4) 为对未知样本X分类,对每个类Yi,计算P(X|Yi)P(Yi)。样本X被指派

到类Yi,当且仅当

P(X|Yi)P(Yi)P(X|Yj),1jm,ji

即X被指派到P(X|Yi)P(Yi)最大的类Yi。

6.3 模型的求解

利用朴素贝叶斯算法,由于在原始职场新人数据中都只是缺失行业的信息,针对这样的问题,我们首先是要把职场新人分派在不同的行业中进行分析。那么,对于原始数据中给的那么多的综合因子,在我们进行数据处理之后变成了4个属性(x1,x2,x3,x4)。于是用这4个属性对这13类行业的职场新人进行区间划分,就是说先将这些行业聚成几大类,然后当确定了职业类型不详的职场新人属于哪一大类之后,再在这一大类中继续上述工作。但若只是把这些行业划分成几个固定的区间,则会带有很大的偶然性。为了避免这种偶然性的影响,我们将这些行业划分的区间个数从2个一直增加到10个。比如对于属性x1,将这个区间分别分成2,3,4…,10个小区间di,其中i2,3,...,10,分析未知职业的职场新人相应的属性X的数据最大可能处在的职业类型Yi(即该未知职业的职场新人的属性X处在职业类型Yi的概率最大),那么这样针对不同的区间划分会出现13种不同的结果,接着将这13个结果进行分类计数,则可以得到该未知行业类型处在各个行

业的次数,出现次数最多的行业类型就是该职场新人的行业类型。通过MATLAB编程求解,分析对处理后的4个属性的变化。

图6.4.1 朴素贝叶斯分类器主体程序流程图

通过贝叶斯分类器的计算,我们得到了这两个职场新人的职业类型结果分别为:

的可能性最大,为0.0055;手机号为201840的用户,他处于其他商务服务业的可能性最大,为0.0018,综上,我们确定了职业信息不详的职场新人的职业类型。

七、 问题四的建模与求解 7.1 问题的分析

经过上面三问的解答,我们对职场新人的定义以及附件中所缺少的信息都有了一定的了解。那么这一问,我们主要根据上面几问对于职场新人的识别来区分职场新人的教育背景。我们大致的思路是这样的:我们先将所有的职场新人根据四个属性聚为四类,通过spss我们先得到4个类的聚类中心,以及每个职场新人所属的类别,这个通过每个职场新人的属性值和聚类中心的属性值的大小来确定。当这个距离小的时候,这个职场新人就属于这个类别;但是当这个距离大的时候,该职场新人就不属于这个类别。我们用马氏距离来刻画这个不同样本之间的距离大小。最后我们根据每个用户聚类之后其职业类型的大致情况来确定该用户的教育背景。我们使用马氏距离是因为其不受量纲的影响,两点之间的马氏距离与原始数据的测量单位无关;由标准化数据和中心化数据(即原始数据与均值之差)计算出的二点之间的马氏距离相同,而且马氏距离还可以排除变量之间的相关性的干扰。 7.2 模型的建立

首先确定按照这4个属性分类之后职场新人的聚类中心,其聚类中心如下:

由聚类中心之间的距离我们确定出第一类是专科本科、第二类是重点院校、第三类是硕博、第四类是非重点院校。

马氏距离是一种有效的计算两个未知样本集的相似度的方法。与欧氏距离不同的是它考虑到各种特性之间的联系(例如:一条关于身高的信息会带来一条关于体重的信息,因为两者是有关联的)并且是尺度无关的(scale-invariant),即独立于测量尺度。 对于一个均值为,协方差矩阵为的多变量矢量

x(x1,x2,x3,L,xp)T,其马氏距离为

1n



xi

ni1

DM(x)

我们计算出样本的协方差矩阵,最后得到

然后我们用spss求得每个聚类中的案例数。

每个聚类中的案例数 聚类

1 2 3 4

有效 缺失

由上表我们得到这样的结论:第一类是专科本科类、第二类是重点院校类、第三个是硕博类、第四个是非重点类。

由上面的两个表,我们得知这四种类(专科本科、重点院校、硕博、非重点院校)中手机号码的分布情况,即每个职场新人的都对应到一个教育背景,这就是第四问中要求我们得到的结论。

八、 模型的优缺点 8.1 模型的优点

1.问题一中的加权模糊聚类模型选择了四个有代表性的影响因素,既保证了结果的准确性又减少了复杂度。

2.问题三中的朴素贝叶斯模型所需要的参数很少,对数据缺失不敏感,算法也比较简单。

3.问题四中选择的马氏距离不受量纲的影响,而且还可以排除变量之间的相关性的干扰。

8.2 模型的缺点

1.模型的假设中有些理想化的情况,与实际有偏差。

2.问题四中对教育背景的预测只是考虑了与职业的关系,这还不能完全反映 一个人的教育背景。

九、 参考文献

[1] 王忠玉.模糊数据统计学[M].哈尔滨:哈尔滨工业大学出版社,2008.

[2] 卓金武,魏永生,秦健,李必文.MATLAB在数学建模中的应用[M].北京:北京

航空航天大学大学出版社,2011.

梁宏胜,徐建民,成岳鹏.一种改进的朴素贝叶斯文本分类方法[J].河北大学学报(自然科学版),2007,27(3):327-331.


相关内容

  • 新媒体平台商业计划书
  • 新媒体平台商业计划书 (此文档为word 格式,下载后你可任意修改编辑) 一.摘 要 重庆一惠信息科技有限公司是一家新型的互动传媒公司,业已建立融合了无线.互联网和触摸屏终端网络的个性化互动媒体好优汇,运用手机二维码识别技术为广大商家和广告主提供精准的营销渠道和全新的互动广告服务. 好优汇个性化互动 ...

  • 微信营销有哪些优点?微信营销常见的运营方式
  • 微信营销有哪些优点?微信营销常见的运营方式 随着微信的火热兴起,微信营销已经慢慢成为了网络经济时代一种创新的网络营销方式.微信是融合文本.图片.音频.视频于一体的社交化媒体通道,使得企业客户可以把传统需要通过短信.彩信.邮件等多种渠道结合才能够进行的客户服务通过微信一个渠道就可以完成,从而实现统一的 ...

  • 微信营销培训的概念
  • 阿飞给大家介绍下微信营销的概念,不懂的可以学习下.微信号:chinalyle 1.什么是微信营销? 微信营销是网络经济时代企业对营销模式的创新,是伴随着微信的火热产生的一种网络营销方式,微信不存在距离的限制,用户注册微信后,可与周围同样注册的"朋友"形成一种联系,用户订阅自己所需 ...

  • 大数据时代的精准营销_宋晓菲
  • /商务传播/ 大数据时代的精准营销 文/宋晓菲 吕继红 很多人应该有过飞机晚点的量巨大,各种意想不到的来源都会烦恼,然后不得不缩短旅游时间,产生大数据.单一的数据集是从几不得不推迟会议时间,不得不留在十TB到数PB不等的规模范围,而机场看着时间一点一滴的流逝,然配备50GB硬盘的PC若存储1PB后上 ...

  • 餐饮业解决方案2
  • 餐饮行业智慧Wi-Fi 覆盖 项 目 方 案 一.项目介绍 ...................................................................................... 1 二.智慧WiFi 对餐馆的价值 ............... ...

  • 浙江你的课大数据营销案例:直击移动大数据助力宽带精准营销全过程
  • 近来,一些小区中国移动客户不约而同地向笔者提出了这样一个问题:他们并没有装移动宽带,但最近他们到附近移动营业厅办理其他移动业务时,营业员几乎无一例外地向他们推荐了移动宽带业务,在此之前有的还接到了10086外呼人员给他们打来的服务营销电话.更令客户惊讶的是,有些前台营业员和10086话务员还结合客户 ...

  • 律师网络营销大全
  • 律师网络营销大全 一. 网络广告营销 [特点] 我们生活在一个广告的世界当中,而网络的出现,造就了一个全新的广告媒体,速度最快.效果很理想,是中小企业迅速发展的好途径. [简介] 网络广告就是在网络上做的广告,即利用网站上的BANNER.FLASH.文本.多媒体等方法,在网络发布广告,传递到互联网用 ...

  • 京东搜索排名规则
  • 京东搜索介绍 1.排序算法 当用户输入关键词进行搜索的时候,系统会根据用户输入的关键词去和系统中的商品做匹配,并根据商品匹配程度和其他相关因素对商品进行排序最后将结果展示给用户. 京东搜索排序考虑的因素如下: 1.1文本相关性 文本相关性即商品的文本描述信息(包括:商品标题.类目名称.品牌名.图书类 ...

  • 智慧城市简述
  • 智慧城市简述 智慧城市是通过综合运用现代科学技术.整合信息资源.统筹业务应用系统,加强城市规划.建设和管理的新模式.智慧城市综合运用以物联网.云计算和公共信息平台为代表的现代科学技术和手段,通过对城市信息资源的全面感知.全面整合.全面挖掘.全面分析.全面共享和全面协同,提高城市管理和服务水平. 一. ...