第4卷S1北京理工大学学报(社会科学版) Vol. 4S12002年10月JOURNAL OF BEIJING INSTITUTE OF T EC HNOLOGY (SOCIAL SCIENCES EDITION) Oct. 2002
专利情报分析方法综述
暴海龙 朱东华
(北京理工大学, 北京:100081)
摘 要:随着科学技术的迅速发展, 技术创新是企业获取竞争优势的重要手段; 而专利情报由于反映了最新的技术发展情况, 使得专利情报分析成为技术创新研究的一个主要方面。本文从技术创新管理角度, 综述了专利情报分析方法。关键词:专利情报; 技术创新; 专利情报分析
中图分类号:G35 文献标识码:A 文章编号:1009-3370(2002)S1-0091-03 企业技术创新竞争的实质就是企业抢先开发技术、抢先获取和利用新技术的竞争。专利情报分析是指对来自专利说明书、专利公报中大量的、个别的专利信息进行加工及组合, 并利用统计方法或技术手段使这些信息具有纵览全局及预测的功能, 并且通过分析将原始的专利信息从量变到质变, 使它们由普通的信息上升为企业经营活动中有价值的情报。专利情报分析是保障企业技术竞争领先的有效措施和得力手段, 成为企业技术创新的重要内容, 是企业获取竞争优势的重要手段[1]。
一、常用的专利情报分析方法
专利情报分析方法是以文献计量学为基础、借助于其它学科的知识和有关工具而进行的。以前,
专利情报分析主要是手工从专利文献中抽取大量的专利信息, 利用有关统计方法, 结合行业经验进行分析处理、探索隐藏在专利文献背后的情报, 来为企业技术创新管理的决策服务。因此当时的主要分析方法有原文分析法、简单统计分析法、以简单统计为基础的图表法、动态矢量法等。
1. 原文分析法。通过检索竞争对手企业的专利说明书, 对其进行仔细阅读、认真分析来掌握竞争对手新产品新技术的开发特点, 包括寻找空隙法、技术改进法、技术综合法和专利技术原理法[3]。
2. 简单统计分析。按照专利发明人、专利申请
收稿日期:2002-06-18
作者简介:暴海龙, 北京理工大学管理与经济学院, 博士研究生。
朱东华, 北京理工大学管理与经济学院教授, 博士生导师。
图1 专利技术细分示意图
人、专利分类号和专利文献的数量分别进行统计分
析。通过对相关情况的统计分析, 能够了解各国科技进步的现状、技术研究兴趣或热点的转移情况、能在一定程度上摸清当前技术发明人的注意力以及该项技术领域发展的去向、可以看出在某一技术领域的竞争情况, 甚至可以判断出最活跃的领域。3. 组配统计分析。通过对专利统计中专利分类号、专利权人、专利申请日(授权公布日) 和专利申请国进行组配统计, 由此获得各种统计信息, 然后对这些统计信息进行分析。
4. 关键词频统计。 删除重复申请的专利, 然后从专利权项、摘要和标题中抽取若干带有技术实验概念的关键词; 对关键词的频数进行统计; ! 是读意, 对出现概率比较高的关键词进行逻辑组配, 进行技术概念的再理解[4]。
5. 技术细分后再统计。按等级树原则对某一技术进行技术细分展开, 对其下位概念逐项进行统计[4], 见图1
。
6. 指标变化图表和技术动态及特性比较表。技术动态及特性表主要用来从技术领域、产品的某些功能等角度, 反映不同年度和不同企业申请专利的技术动态和特性, 从而比较诸企业的技术开发趋势和方向。主要形式有:企业在不同年度、不同技术领域中技术开发比较, 不同科研选题的比较、不同企业不同科研选题比较, 各种因素之间的回归分析[5]。
7. 矢量动态模型法。专利文献除反映科学技术的量变关系外, 还隐含着科技发展的方向。因此借用矢量的概念来加以表示。应用矢量模型法就是把统计的动态数据实行矢量模型化, 尔后对科学发展动向加以评价和预测[6]。
8. 专利引文分析法。对专利文献引用参考文献的现象进行分析研究, 揭示其数量特征和内存规律, 并据此进行技术发展趋势的评价。
9. 专题资料分析法。所谓#专题资料分析法∃, 就是根据专利文献在国际发明分类表中的分散性, 在某专题文献资料的地理分布、研究内容等进行排列组合和分析研究, 从中预测世界上创造发明活动最活跃的国家以及侧重研究的领域等[7][8]。定性分析。它是以专利的技术内容或专利的#质∃来识别专利, 并按技术特征来归并有关专利使其有序化。定性分析一般用来获得技术动向、企业动向、特定权利状况等方面的情况。可以从发明的用途、原理、材料、结构和方法等5个方面来考虑重要专利的内容, 并将重要专利按照内容的异同分类[8]。
二、专利情报分析方法最新发展
随着计算机的普及、信息技术和网络技术的发展, 专利情报分析逐渐从手工处理过渡到了以计算机为工具的时代。这对专利情报分析提供了极大的便利条件, 而且也促使专利情报分析方法向自动化、智能化、可视化方向发展。1. 计算机的量化处理。要对每个领域中所包括的成百上千专利文献进行量化分析, 应必须对这些专利文献的申请日、主分类号、优先权申请国、申请人、公开号等著录项进行检索、筛选、统计, 并绘制图表。用手工方法显然是极费时费力的。为此需要创建专利情报分析数据库, 并采用计算机分
在专利情报分析数据库中, 运用EXCEL 电子表格所具有的强大功能, 对每一项著录项目进行排序, 从中筛选出每年、各国、各公司的专利申请号, 再对上述各项进行数量统计, 就可有针对性地做出统计图表, 从各个方面了解该领域的专利发展情况。具体来说, 主要包括:
专利申请数量的年代分布, 可以栅测出某技术领域的未来发展态势; 专利文献的技术主题分类, 可对技术主题进行分类统计并做成技术主题分布图; ! 以优先权所属国统计各国的本国专利申请量, 可以了解各国家在该领域的技术实力; %各公司所拥有的专利数量统计, 可了解各公司在该技术领域的技术经济实力; &各公司国外专利申请情况, 对具有两个国家以上的专利申请进行数量统计, 画出各公司国外专利申请数量的分布图; ∋各国专利申请数量的分布情况, 查清在不同国家所面临的竞争对手, 可以了解外国公司在这些国家的市场竞争程度; (各国家专利的申请情况统计分析, 可了解在每一个国家内各公司的竞争态势。2. 基于相似函数的专利情报分析方法。这里所述的相似函数包括:基于专利引文的相似函数和基于术语并发的相似函数。对于引文分为直接引文和间接引文。直接引文相似函数设计如下:
1 文献i 引用文献j
dc i j =
1 文献j 引用文献i 0 其它
(1)
[11]
间接引文相似函数设计如下:
1 文献i 引用文献k , 文献k 引用文献j
lc i j (k ) =
1 文献j 引用文献k, 文献k 引用文献i 0 其它
(2)
1 文献k 引用文献i, 文献k 引用文献j 0 其它
(3)
1 文献k 引用文献i, 文献k 引用文献j 0 其它
(4)
c c i j (k) =
c c i j (k) =
间接引文函数lc, cc 和bc 分别表示了纵向引文、共同引文和文献引文。文献的相似值构成了相似矩阵S 的元素, 并且按照权重和每对文献间的直接、间接引文函数总计值来建造:
s ij =2dc ij +
k =1
析、统计数据库中专利文献著录项的方式对专利文
献进行量化分析[2]。
) [lc ij (k) +
N
cc i j (k) +bc ij (k ) ]
(5)
N 是数据库中专利文献的数量。很容易通过矩阵算法来生成由这个函数产生的相似矩阵。关于文献和它们作为有向图的引文, 通过下面的函数能够建立引用图形的邻接矩阵的元素:
a ij =
1 文献j 引用文献i 0 其它+(AA+(AA
) T ) +
A T A
+AA T
(6)
引术语, 这些用来建立基于术语并发的相似函数。术语并发的相似函数如下[13]:
1 术语k 是文献i 中一个索引术语,
c ij (k) =
也是文献j 中索引术语0 其它
(9)
相似矩阵S 的元素使用下面的函数建造:
s ij =
所有的k , i +j
相似矩阵可以运用下面矩阵方程计算:
S =2(A +
A T )
(7)
)
c ij (k )
在上述矩阵方程中的第一项对应于直接引文, 然而后面三项内容分别对应于纵向引文、共同引文
这个函数使用SQL 查询语句很容易执行。
计算出文献间的相似值后, 利用力定向配置法
和文献引文。对直接引文给予相对于间接引文2(f orce direct place ment) 或自组织神经网络技术来将倍的权重, 主要是强调直接引文; 并且倾向于在映文献映射到二维空间中, 形成文献聚类, 以探索文
[9]
射后生成大量的有意义的聚类。作为计算相似性献间的关系。
力定向配置法就是在开始的时候, 所有的文献的最后一步, 测量相似矩阵的元素的值(0或1) 是非常必要的。然后对测量结果使用下述公式进行
矩阵的标准化:
s ij ∗=
s ij
(N i +1) (N j +1)
(8)
都放置在平面中心位置, 文献之间的作用力与它们的距离成反比, 与它们的相似值成正比; 如果相似值大于0, 则为吸引力, 否则为排斥力; 力的方向遵守力学中库仑法则。此过程反复进行, 直到形成一个稳定的文献映射图。
自组织神经网络技术是以相似矩阵的行为输入变量, 训练矩形的自组织神经网络。一般使用的是一个5, 5的自组织神经元矩阵。在训练完成后, N 维空间中的神经元连接权的密度分布与训练矢量的密度分布相匹配。
N i 和N j 分别是文献i 和文献j 间接引文的总数, 从引文计算相似性通常生成有意义的文献映射, 这些映射的模型揭示了文献的聚类和这些聚类的关系。
基于文献中术语的并发性的相似函数也是有效的。可靠的数据源提供了每篇文献的一致的索
参考文献:
[1] 姜彦福等. 企业技术创新管理[J]. 企业管理出版社, 1999年6月.
[2] 邹雪梅. 专利文献计算机量化分析方法[J]. 石化技术, 1998, 5(2) :122-124.
[3] 包昌火, 谢新洲. 竞争情报与企业竞争力[J].华夏出版社, 2001, 4.
[4] 时中一. 根据专利情报进行技术评价和预测的程序与方法[J]. 科技情报工作, 1984, (8) , 28. [5] 王崇德. 专利文献的定量分析[J]. 图书情报工作, 1985, (1) , 12.
[6] 安慧, 柳衡琪. 专利情报流的矢量动态模型研究−−−美国固体分选技术发展动向[J].情报理论与实践, 1989, (2) , 50.
[7] 杨桂荣. 通过专利文献的统计分析, 探索发达国家的技术发展动向[J].科技情报工作, 1984, (8) , 28-29.
[8] 彭爱东. 一种重要竞争情报−−−−专利情报的分析研究[J]. 情报理论与实践, 2000年第3期. [9] Steven Morri s et al. DIVA:a visualization system for exploring document databases for technology forecast
ing[N].www. elsevier. com/locate/ds w, 2002. [10] V K Gupta, N B Pangannaya. Carbon nanotubes:bi bliometric analysis of patents[P].World Patent Infor
mation, 2000, 185-189. [11] Small H. Update on science mapping:creating large document spaces[J]. Scientometrics, 1997, 38(2) ,
275-293.
第4卷S1北京理工大学学报(社会科学版) Vol. 4S12002年10月JOURNAL OF BEIJING INSTITUTE OF T EC HNOLOGY (SOCIAL SCIENCES EDITION) Oct. 2002
专利情报分析方法综述
暴海龙 朱东华
(北京理工大学, 北京:100081)
摘 要:随着科学技术的迅速发展, 技术创新是企业获取竞争优势的重要手段; 而专利情报由于反映了最新的技术发展情况, 使得专利情报分析成为技术创新研究的一个主要方面。本文从技术创新管理角度, 综述了专利情报分析方法。关键词:专利情报; 技术创新; 专利情报分析
中图分类号:G35 文献标识码:A 文章编号:1009-3370(2002)S1-0091-03 企业技术创新竞争的实质就是企业抢先开发技术、抢先获取和利用新技术的竞争。专利情报分析是指对来自专利说明书、专利公报中大量的、个别的专利信息进行加工及组合, 并利用统计方法或技术手段使这些信息具有纵览全局及预测的功能, 并且通过分析将原始的专利信息从量变到质变, 使它们由普通的信息上升为企业经营活动中有价值的情报。专利情报分析是保障企业技术竞争领先的有效措施和得力手段, 成为企业技术创新的重要内容, 是企业获取竞争优势的重要手段[1]。
一、常用的专利情报分析方法
专利情报分析方法是以文献计量学为基础、借助于其它学科的知识和有关工具而进行的。以前,
专利情报分析主要是手工从专利文献中抽取大量的专利信息, 利用有关统计方法, 结合行业经验进行分析处理、探索隐藏在专利文献背后的情报, 来为企业技术创新管理的决策服务。因此当时的主要分析方法有原文分析法、简单统计分析法、以简单统计为基础的图表法、动态矢量法等。
1. 原文分析法。通过检索竞争对手企业的专利说明书, 对其进行仔细阅读、认真分析来掌握竞争对手新产品新技术的开发特点, 包括寻找空隙法、技术改进法、技术综合法和专利技术原理法[3]。
2. 简单统计分析。按照专利发明人、专利申请
收稿日期:2002-06-18
作者简介:暴海龙, 北京理工大学管理与经济学院, 博士研究生。
朱东华, 北京理工大学管理与经济学院教授, 博士生导师。
图1 专利技术细分示意图
人、专利分类号和专利文献的数量分别进行统计分
析。通过对相关情况的统计分析, 能够了解各国科技进步的现状、技术研究兴趣或热点的转移情况、能在一定程度上摸清当前技术发明人的注意力以及该项技术领域发展的去向、可以看出在某一技术领域的竞争情况, 甚至可以判断出最活跃的领域。3. 组配统计分析。通过对专利统计中专利分类号、专利权人、专利申请日(授权公布日) 和专利申请国进行组配统计, 由此获得各种统计信息, 然后对这些统计信息进行分析。
4. 关键词频统计。 删除重复申请的专利, 然后从专利权项、摘要和标题中抽取若干带有技术实验概念的关键词; 对关键词的频数进行统计; ! 是读意, 对出现概率比较高的关键词进行逻辑组配, 进行技术概念的再理解[4]。
5. 技术细分后再统计。按等级树原则对某一技术进行技术细分展开, 对其下位概念逐项进行统计[4], 见图1
。
6. 指标变化图表和技术动态及特性比较表。技术动态及特性表主要用来从技术领域、产品的某些功能等角度, 反映不同年度和不同企业申请专利的技术动态和特性, 从而比较诸企业的技术开发趋势和方向。主要形式有:企业在不同年度、不同技术领域中技术开发比较, 不同科研选题的比较、不同企业不同科研选题比较, 各种因素之间的回归分析[5]。
7. 矢量动态模型法。专利文献除反映科学技术的量变关系外, 还隐含着科技发展的方向。因此借用矢量的概念来加以表示。应用矢量模型法就是把统计的动态数据实行矢量模型化, 尔后对科学发展动向加以评价和预测[6]。
8. 专利引文分析法。对专利文献引用参考文献的现象进行分析研究, 揭示其数量特征和内存规律, 并据此进行技术发展趋势的评价。
9. 专题资料分析法。所谓#专题资料分析法∃, 就是根据专利文献在国际发明分类表中的分散性, 在某专题文献资料的地理分布、研究内容等进行排列组合和分析研究, 从中预测世界上创造发明活动最活跃的国家以及侧重研究的领域等[7][8]。定性分析。它是以专利的技术内容或专利的#质∃来识别专利, 并按技术特征来归并有关专利使其有序化。定性分析一般用来获得技术动向、企业动向、特定权利状况等方面的情况。可以从发明的用途、原理、材料、结构和方法等5个方面来考虑重要专利的内容, 并将重要专利按照内容的异同分类[8]。
二、专利情报分析方法最新发展
随着计算机的普及、信息技术和网络技术的发展, 专利情报分析逐渐从手工处理过渡到了以计算机为工具的时代。这对专利情报分析提供了极大的便利条件, 而且也促使专利情报分析方法向自动化、智能化、可视化方向发展。1. 计算机的量化处理。要对每个领域中所包括的成百上千专利文献进行量化分析, 应必须对这些专利文献的申请日、主分类号、优先权申请国、申请人、公开号等著录项进行检索、筛选、统计, 并绘制图表。用手工方法显然是极费时费力的。为此需要创建专利情报分析数据库, 并采用计算机分
在专利情报分析数据库中, 运用EXCEL 电子表格所具有的强大功能, 对每一项著录项目进行排序, 从中筛选出每年、各国、各公司的专利申请号, 再对上述各项进行数量统计, 就可有针对性地做出统计图表, 从各个方面了解该领域的专利发展情况。具体来说, 主要包括:
专利申请数量的年代分布, 可以栅测出某技术领域的未来发展态势; 专利文献的技术主题分类, 可对技术主题进行分类统计并做成技术主题分布图; ! 以优先权所属国统计各国的本国专利申请量, 可以了解各国家在该领域的技术实力; %各公司所拥有的专利数量统计, 可了解各公司在该技术领域的技术经济实力; &各公司国外专利申请情况, 对具有两个国家以上的专利申请进行数量统计, 画出各公司国外专利申请数量的分布图; ∋各国专利申请数量的分布情况, 查清在不同国家所面临的竞争对手, 可以了解外国公司在这些国家的市场竞争程度; (各国家专利的申请情况统计分析, 可了解在每一个国家内各公司的竞争态势。2. 基于相似函数的专利情报分析方法。这里所述的相似函数包括:基于专利引文的相似函数和基于术语并发的相似函数。对于引文分为直接引文和间接引文。直接引文相似函数设计如下:
1 文献i 引用文献j
dc i j =
1 文献j 引用文献i 0 其它
(1)
[11]
间接引文相似函数设计如下:
1 文献i 引用文献k , 文献k 引用文献j
lc i j (k ) =
1 文献j 引用文献k, 文献k 引用文献i 0 其它
(2)
1 文献k 引用文献i, 文献k 引用文献j 0 其它
(3)
1 文献k 引用文献i, 文献k 引用文献j 0 其它
(4)
c c i j (k) =
c c i j (k) =
间接引文函数lc, cc 和bc 分别表示了纵向引文、共同引文和文献引文。文献的相似值构成了相似矩阵S 的元素, 并且按照权重和每对文献间的直接、间接引文函数总计值来建造:
s ij =2dc ij +
k =1
析、统计数据库中专利文献著录项的方式对专利文
献进行量化分析[2]。
) [lc ij (k) +
N
cc i j (k) +bc ij (k ) ]
(5)
N 是数据库中专利文献的数量。很容易通过矩阵算法来生成由这个函数产生的相似矩阵。关于文献和它们作为有向图的引文, 通过下面的函数能够建立引用图形的邻接矩阵的元素:
a ij =
1 文献j 引用文献i 0 其它+(AA+(AA
) T ) +
A T A
+AA T
(6)
引术语, 这些用来建立基于术语并发的相似函数。术语并发的相似函数如下[13]:
1 术语k 是文献i 中一个索引术语,
c ij (k) =
也是文献j 中索引术语0 其它
(9)
相似矩阵S 的元素使用下面的函数建造:
s ij =
所有的k , i +j
相似矩阵可以运用下面矩阵方程计算:
S =2(A +
A T )
(7)
)
c ij (k )
在上述矩阵方程中的第一项对应于直接引文, 然而后面三项内容分别对应于纵向引文、共同引文
这个函数使用SQL 查询语句很容易执行。
计算出文献间的相似值后, 利用力定向配置法
和文献引文。对直接引文给予相对于间接引文2(f orce direct place ment) 或自组织神经网络技术来将倍的权重, 主要是强调直接引文; 并且倾向于在映文献映射到二维空间中, 形成文献聚类, 以探索文
[9]
射后生成大量的有意义的聚类。作为计算相似性献间的关系。
力定向配置法就是在开始的时候, 所有的文献的最后一步, 测量相似矩阵的元素的值(0或1) 是非常必要的。然后对测量结果使用下述公式进行
矩阵的标准化:
s ij ∗=
s ij
(N i +1) (N j +1)
(8)
都放置在平面中心位置, 文献之间的作用力与它们的距离成反比, 与它们的相似值成正比; 如果相似值大于0, 则为吸引力, 否则为排斥力; 力的方向遵守力学中库仑法则。此过程反复进行, 直到形成一个稳定的文献映射图。
自组织神经网络技术是以相似矩阵的行为输入变量, 训练矩形的自组织神经网络。一般使用的是一个5, 5的自组织神经元矩阵。在训练完成后, N 维空间中的神经元连接权的密度分布与训练矢量的密度分布相匹配。
N i 和N j 分别是文献i 和文献j 间接引文的总数, 从引文计算相似性通常生成有意义的文献映射, 这些映射的模型揭示了文献的聚类和这些聚类的关系。
基于文献中术语的并发性的相似函数也是有效的。可靠的数据源提供了每篇文献的一致的索
参考文献:
[1] 姜彦福等. 企业技术创新管理[J]. 企业管理出版社, 1999年6月.
[2] 邹雪梅. 专利文献计算机量化分析方法[J]. 石化技术, 1998, 5(2) :122-124.
[3] 包昌火, 谢新洲. 竞争情报与企业竞争力[J].华夏出版社, 2001, 4.
[4] 时中一. 根据专利情报进行技术评价和预测的程序与方法[J]. 科技情报工作, 1984, (8) , 28. [5] 王崇德. 专利文献的定量分析[J]. 图书情报工作, 1985, (1) , 12.
[6] 安慧, 柳衡琪. 专利情报流的矢量动态模型研究−−−美国固体分选技术发展动向[J].情报理论与实践, 1989, (2) , 50.
[7] 杨桂荣. 通过专利文献的统计分析, 探索发达国家的技术发展动向[J].科技情报工作, 1984, (8) , 28-29.
[8] 彭爱东. 一种重要竞争情报−−−−专利情报的分析研究[J]. 情报理论与实践, 2000年第3期. [9] Steven Morri s et al. DIVA:a visualization system for exploring document databases for technology forecast
ing[N].www. elsevier. com/locate/ds w, 2002. [10] V K Gupta, N B Pangannaya. Carbon nanotubes:bi bliometric analysis of patents[P].World Patent Infor
mation, 2000, 185-189. [11] Small H. Update on science mapping:creating large document spaces[J]. Scientometrics, 1997, 38(2) ,
275-293.