辽宁中医杂志2010年第37卷第9期
·1667·
几种测量尺度形式的比较
121
张艳宏,刘保延,何丽云
(1.中国中医科学院中医临床基础医学研究所,北京100700;2.中国中医科学院,北京100700)
摘要:量表条目问题答案的设计是量表研制过程中一个重要环节,其中线性尺度、等级尺度和两分类是最常用的
测量尺度形式。每种测量尺度都有其特点,线性尺度更适用于评价同一个体随时间的变化情况;等级尺度的使用要注意各选项间的等距性;两分类尺度可能提供的信息相对较少。在实际设计过程中,各类型的测量尺度设计并不是很严格,往往是根据所测内容的特质、被试者的理解能力及应答率等多方面综合考虑尺度的合理设计,并且多种方式融合使用。
关键词:测量尺度;视觉类比;利克特;两分类中图分类号:R2-03文献标识码:A文章编号:1000-1719(2010)09-1667-03
TheDifferenceAboutSeveralResponseScaleTypes
ZHANGYan-hong1,LIUBao-yan2,HELi-yun1
(1.ClinicalEvaluationCenterofInstituteofClinicalBasicMedicine,ChinaAcademyofChineseMedicalSciences,Beijing100700,China;
2.ChinaAcademyofChineseMedicalSciences,Beijing100700,China)
Abstract:Itisanimportantcoursefordesigningtheanswerstotheitemsduringthedevelopmentofaninstrument.Linear
rankingscaleandbinarycategoryareincommonuse,andeachonehasitsspecialty.Thelinearscaleisusedtomeasurethescale,
changeofthesameindividualwithtime;therankingscaleispaidmoreattentiontotheequaldistancebetweenthepoints;while,thebinarycategorymaybeprovidelessinformation.Infact,thedesignofresponsescaleisnotinvariable,andweusuallyusesev-eraltypessimultaneously,consideringtheparticularityofwhatwearetomeasure,thecomprehensionoftheinterviewer,there-sponserate,etc.
Keywords:responsescale;visualanalog;ikertscale;binarycategory量表是用来量化观察结果的一种测量工具,被广泛应用于医学、心理、社会等领域的评估,不仅是收集资料的重要手段,也是开展科研、临床工作的重要方法
其最显著的特点是和途径。量表作为一种测量手段,
能够对主观判断进行量化分级。从量表设计者角度讲,选择合适的测量尺度,构建可信、有效的测量,是确《简明医彀·口渴内溃》:“口渴者,有篇中一条因毒热攻冲,致胃火上炎,口作大渴也。内溃者,胃脘溃烂,穿出胸背而死,惨伤莫此为甚。群书皆谓风寒外袭,腠理
。”《简明医固密,壅塞不通,阳气挟同毒火,内攻而溃
,彀》明代孙志宏撰,成书于1629年,他针对口渴与胃脘溃烂提出了“毒热”致病的理论,风寒外袭,壅塞不通,化为毒热,毒热上攻于胃致口渴,毒热壅盛,血败肉
“胃毒热证”腐致胃脘溃烂。明代之后,孙志宏有关的
更没有得到继承与发扬。他的理论没有被医家提起,
“毒热”致病的理论也仅仅提到口渴与胃脘溃烂两证。6胃癌前状态疾病活动期符合“毒热”的病因学特征
“毒热”周学文教授创立病因学说
胃癌前状态疾病活动期以胃脘灼痛、吞酸嘈杂、口干口苦、舌红苔黄,或腻或腐、脉弦为主要证候表现,胃镜下可见局部红肿、糜烂、溃疡等变化。其发病的原因主要是幽门螺旋杆菌感染、吸烟、饮酒、不良饮食习惯
收稿日期:2010-01-27
基金项目:国家科技部973计划项目(2006CB504601);中国中医科学院
自主选题项目(ZZ2006025)(),,:保得到理想的测量结构的关键环节。针对量表条目的测量尺度,笔者查阅了近30年国内外有关量表设计的文献,对几种常用的测量尺度形式的使用特点进行了
拟为量表研制中测量尺度的设计提供参考。阐述,
1测量尺度的内涵
对于量表来讲,条目是量表的主体,而条目又包括以及胃酸、胆盐、存物(胃体、胃窦存物),精神情志的异常变化也是导致疾病发生的重要因素。对比上文所述中医文献中的“毒热”病因,上述的病因均属于“毒
。“毒热”范围病邪包括从口而入的毒邪,或情志热”
过极气郁化热蕴毒,或胆汁不循常道反流入胃化毒,而脾虚为发病的内在根据。病由毒起,热由毒化,毒热之邪蕴结于胃,损伤胃络,胃膜失养,热盛肉腐,而成痈
——胃黏膜的糜烂、疡—坏死、溃疡组织形成。
国家名中医周学文教授继承国家级名老中医李玉“内痈”“毒热”奇之说,创立了病因学说,认为胃癌前状态疾病活动期病机以脾胃虚弱为本;毒热为标;久病入络,气血瘀滞为变,久致热盛毒腐成痈。毒邪或从口入;或情志过极气郁化热蕴毒;或胆汁逆流入胃化毒等,也正因为脾气不旺,正气亏虚,机体无力驱邪排毒,使毒邪日深,正气愈损,病程缠绵,其活动期则热盛毒
,“实中夹虚”腐,胃膜失养。因此为基本病机特点,
“胃毒热证”,“以痈论治”,“清热为基本证候基本治则解毒、消痈生肌”为基本治法。这一创新病因假说的提出,为不同疾病的发生做出了相同的病因解释,从而
)提供了理论为不同疾病应用同一治法(“以痈论治”
·1668·
问题和测量尺度两方面。条目的问题是表达一个观点的不同语句,与每个问题伴随的测量尺度是一系列表示对该语句赞同程度的描述。测量尺度指将被测者所具有的测量特征以数字的形式分配到特定位置,从而形成一个连续体的过程。如例1是一个完整的条目,“□极差□差□不好也不差□好□极好”这些供选择的选项即为测量尺度。如果将量表看作是一把标准尺子,用这把尺子对被测的属性进行测量,那么这把尺子的刻度就相当于测量尺度。
例1:利克特测量尺度(1)您的食欲怎么样?
□极差□差□不好也不差□好□极好测量尺度的设计是一个复杂的过程,不仅仅是词语简单的构想和罗列,需要有严密的设计方案和可操作的验证方法,与量表结构、条目特点、测试对象对条目的理解程度、统计学要求以及量表性能密切相关,涉及到医学、心理学、统计学等多个领域。2测量尺度的形式
测量尺度形式有很多种类,大体可分为线性尺度、等级尺度、两分类。每种形式都有各自的特点,可以将多种形式组合在一起进行设计。
2.1线性尺度线性尺度是在标有刻度的线段上划记选择,其最常见的设计形式是视觉类比测量。
视觉类比(VisualAnalog)视觉类比,即测量尺度呈现一根连续的线条,表示对一个连续体的相反两端的一对描述。被测者在线条上做一个标记来表示他们的观点、体验、信念或者其他
所标记点的得分差异由设计者决任何被测量的东西,
定。例2是典型的视觉类比测量尺度。
例2:视觉类比测量尺度您的食欲怎么样?极差极好视觉类比测量尺度最大的特点是,能够非常敏感地测量同一个体随时间的变化而发生的改变。因为任何一个被测者都很难准确地回想出在一条没有特征的
除非他(她)选择的是两个端线上所标记的点在哪里,
点,否则就很难或者根本不可能精确地回想起他们过去对该问题的反应。所以,视觉类比测量在评价某种干预措施的效果时就占有一定的优势。因为,对于评价性量表来讲,主要是说明量表随时间的变化情况,重
不同个体间的差异并不太重要,如果量表内视敏感性,
测量时间相对较短,那么不妨采用视觉类比测容不多,
量尺度。
需要注意的是,不同的人沿着这条线在特定的点
即使所有的所做的记号可能并不意味着相同的意义,
被测者在这条线上所标注的点都相同,其意义也可能
既可以理解为“被测者不一样。如例2所做的标记,
,感觉自己的食欲不太好,没有达到极好的标准”也可
“被测者感觉自己的食欲还可以,以理解为离极好的
。也就是说,即使若干被测者在这标准已经不远了”
条线上所标记的点相同,这些点在这些人心中的分量
这种测量尺度形式的量表在被测者间也不一定相同,
没有可比性,它只能反映单个被测者对相关问题态度的变化情况,即在被测者内具有一定的可比性。2.2等级尺度等级尺度是用一些表示程度、频度的7点、11量尺度形式。我们常用的Likert测量,如5点、
辽宁中医杂志2010年第37卷第9期
点等,都是此种类型的尺度形式。
利克特测量(LikertScale)
利克特测量是1932年美国社会心理学家R.利克特提出的一种简化的测量方法。这种测量尺度的形式
针对提出的问题,采用若干个有一定等级排列的形是,
表示对该问题赞同或认可的程度。例1容词或副词,
就是典型的利克特测量尺度。
利克特测量尺度的特点是,各选项由一系列口语化的形容词或副词组成,并且是等距序列。如果答案
“中立点”,选项有那么中立点两侧的答案是对称均匀
,的,如例1;如果答案选项没有“中立点”那么前半部如例3。只有满分和后半部分的答案也要对称均匀,
足以上特征的测量形式才可以认为是合格的、真实的利克特测量尺度。
例3:利克特测量尺度(2)您的食欲怎么样?
□极差□差□好□极好利克特测量尺度的设计要求有:
(1)答案选项间等距:由于利克特测量尺度设计实际要求并不严格,很难提供一个普遍应用的一套规则,但可以肯定的是,利克特测量尺度间的距离相等,答案选项的得分可以设置成连续的整数,这是运用利克特测量尺度的一个基本假设前提,然而在利克特测
答案选项间保持等距这一量尺度的实际设计过程中,
环节往往被忽视。
(2)答案选项的奇偶数视实际情况而定:答案选项的级数可以设置成奇数,也可以设置成偶数,如5
6点、7点、10点、11点等。两种形式的最大区别点、
,是,奇数量的答案选项意味着存在一个“中立点”允
许被测者对所提出问题持模棱两可或不确定的态度;偶数量的答案选项就要迫使被测者一定要对所提出的问题在两个极端方向至少做出一个弱的许可。
(3)答案选项的级数不宜过多:因为被测者对答案选项的识别能力有限,所以通常情况下采用5级至10级的答案选项。即使设置非常多的级数,多数被测
对者也只是使用那些与5或10的倍数相对应的选项,
于35和37这样的差别,被测者通常是无法区分的;况且把事物分成50个离散的级别,几乎是不可能的1。虽然选项越多,从被测者那里得到的信息就越多,但这也可能增加被测者的负担,产生疲劳或厌倦心理而影
人的辨别力不超过7个响测量的信度。有学者提出,
或在7个水平左右(7±2)3,量表的信度不会水平2,
随着答案选项数量的增加而提高4,采用7级以上尺
5级、6级度形式以提高量表信度,其作用是很轻微的,
或7级的答案选项对量表信度的影响很小。
利克特测量尺度形式经久不衰,是传统测量中惯
主要因为其具有简便易行,省时、省力、省财,用格式,
浅显易懂,易于实施。然而我们在使用中也会发现,同视觉类比测量类似,利克特测量在被测者间也不一定
即使不同被测者得分相同,也并不意味着存在可比性,
他们对所提出问题的态度完全相同。也就是说,相同
利克特测量尺度的分数所代表的意义并不一定相同,
可以区分个体间态度的大致趋势,但无法进一步描述他们态度的结构差异。如甲、乙两个被测者对例3的
,问题回答都是“好”所得分数相同,这只能表示甲和
,。此外,
辽宁中医杂志2010年第37卷第9期
者内也不一定存在可比性。比如,对被测者兴趣爱好
“常常”“常常”同一被测者所谓的看电影与打的测量,
篮球,所表示的实际频率可能不同。
2.3两分类两分类尺度即采用两个绝对相反的立场让被测者进行二选一的选择,相当于利克特测量的2级尺度。这种类型测量尺度的特点是,强迫被测者一定要对两种截然相反的态度选项选择出比较接近自己想法的选项。例4即是两分类尺度形式。
例4:两分类尺度您的食欲怎么样?□差□好
两分类测量尺度的基本条件有两个:一是答案选项必须完全互斥,二是能够包容所有可能的选择。有些问题研究者可能无法只用两个相反方面就能够完全
“其它”表达了问题可能出现的态度,因此在最后增加
一项,并要求被测者将资料补在空格处。但是往往被试所填答的资料对于分析并没有任何作用。此外,还
“其它”容易使那些填答的问卷成为废卷。因此,除非
“其它”一般不鼓励在问卷设计中加入一项万不得已,
作为选项。
两分类尺度最大的优点是,被测者对所提出问题的态度非常明确,拒绝中庸模糊的态度,这样可以改善利克特测量对于两极端态度测量敏感度不足的问题。此外,两分类尺度给予被测者的负担较轻,大多数人很
所快就容易决定某些形容词是否表达了他们的态度,
以,被测者通常愿意完成这类题项,而不愿意完成那些需要集中精力来辨析的题项。当然,由于这种尺度使每一个问题答案的可变性最小,通常需要设置更多的
因而增加了编题者的工作量。条目以获得信息,
2.4各类型尺度的比较量表设计过程中,不同形式尺度的应用也不是独立的、单一的,常常是交互使用,对同一测量内容,可以采用多种不同的尺度形式进行测量,总的原则是符合量表设计的实际需求,根据测量要求、被试者特点等多方面考虑,优选最合适的反应尺度。比如,对于疼痛,目前常用多种的尺度形式进行测量。最常见的有视觉模拟测量(Visualanaloguescale,VAS)(图1)。口述分级评分法(Verbalratingscale,VRS)4点口述分级评分法(VRS-4):①无疼;②轻微疼痛;③中等度疼痛;④剧烈疼痛。5点口述分级评分法(VRS-5):①轻微疼痛;②引起不适感疼痛;③具有窘迫感的疼痛;④严重疼痛;⑤剧烈疼痛。0-10数字
NRS)(图2)等。疼痛强度量表(Numericalratingscale,
此4种测量疼痛的尺度万变不离其宗,都是线性尺度、等级尺度形式的变异
。
·1669·
列描绘疼痛的形容词组成,最轻度疼痛的描述常被评为0分,以后每级增加1分,但无论是4点还是5点评分法,都不是利克特测量形式,因为各答案选项的等距
评估耗时性无法判断。但VRS比VAS更容易理解,
少。NRS既具有线性尺度又具有等级尺度形式的特点,要求患者用0~10这11个数字描述疼痛强度,其
因此这种测量尺度中在两端和中央又有描述提示语,
比VAS方法更为直观。有学者曾对VRS和VAS进行了比较,结果发现两种测量尺度形式有很好的相关性,而且VRS得分要比VAS高,认为VRS可以替代VAS
NRS和Likert3种测量慢性疼痛。也有学者将VAS、
测量尺度形式用于测试儿童的相对信度比较。通过用
让被测儿童对3种测量尺一个标有从0到10的尺子,
度的偏爱和容易度进行等级判定,结果发现3种反应
儿童更偏爱Likert尺度,他们尺度的信度具有可比性,
因此推荐测试儿童的问卷采用认为Likert容易填写,
Likert测量尺度形式。3讨论
在实际设计过程中,各类型的测量尺度设计并不是很严格,往往是根据所测内容的特质、被试者的理解能力及应答率等多方面综合考虑尺度的合理设计,并且多种方式融合使用。比如,对于对于那些文化水平
Wong-Baker面部表情量低或丧失表达能力的患者,
表(图3)用6种面部表情从微笑至悲伤至哭泣来表达,。
图3Wong-Baker面部表情量表
图1视觉模拟测量(VAS
)
以上介绍的三种尺度形式都是量表条目设计过程中最常用的尺度类型。线性尺度设计简便,但对被测者的应答理解能力有一定的要求。等级尺度设计看似简单,实际上有许多细节问题,诸如选项措辞、选项间距离、被测者理解程度、得分要求等都影响着测量的精
“在过去4个星期里,准性。如在SF-36中,条目6您
的身体健康或情绪不好在多大程度上影响了您与家
,人、朋友、邻居或集体的正常社交活动?”答案“根本
没有影响、很少有影响、有中度影响、有较大影响、有极
“1、2、3、4、5”;而条目7“在过去4个大影响”分别评分
,“根本没有星期里,您有身体上的疼痛吗?”可供选项
有很轻微疼痛、有轻微疼痛、有中度疼痛、有严重疼痛、
“1.0、2.2、3.1、4.2、5.疼痛、有很严重疼痛”分别评分
4、6.0”,虽然都是等级尺度,但设计的细节直接影响量表评分及测量的准确性。两分类尺度设计时要考虑得到的信息量大小,为提高测量效率和可行性,既要使
又要保持信度不变或下降很少是一项重条目数较少,
要研究内容。因此,在实际运用中,往往采用合理的折中方式,既可以使被测者可接受,又达到理论最优化,通常只有那些刻度标准、合理,节省时间、成本和人力,
“廉价”相对的反应尺度才经常使用。
参考文献[1]罗伯特·F·德威利斯.量表编制理论与应用[M].重庆:重庆大
2006:84.学出版社,
[2]StreinerDLandNormanGR.Healthmeasurementscales:apractical
guidetotheirdevelopmentanduse[M].SecondEdition.Oxford:Ox-fordUniversityPress,1995.[3]MillerGA.Themagicnumbersevenplusorminustwo:Somelimitson
,63:-图20-10数字疼痛强度量表(NRS)
VAS是典型的视觉类比测量,可以对患者治疗前
后效果可进行较为客观的评价,但是患者在作答时比较耗时,需要理解线条抽象概念的能力,许多患者很难判断精确的距离,同时VAS不能做患者之间的比较,
,
辽宁中医杂志2010年第37卷第9期
·1667·
几种测量尺度形式的比较
121
张艳宏,刘保延,何丽云
(1.中国中医科学院中医临床基础医学研究所,北京100700;2.中国中医科学院,北京100700)
摘要:量表条目问题答案的设计是量表研制过程中一个重要环节,其中线性尺度、等级尺度和两分类是最常用的
测量尺度形式。每种测量尺度都有其特点,线性尺度更适用于评价同一个体随时间的变化情况;等级尺度的使用要注意各选项间的等距性;两分类尺度可能提供的信息相对较少。在实际设计过程中,各类型的测量尺度设计并不是很严格,往往是根据所测内容的特质、被试者的理解能力及应答率等多方面综合考虑尺度的合理设计,并且多种方式融合使用。
关键词:测量尺度;视觉类比;利克特;两分类中图分类号:R2-03文献标识码:A文章编号:1000-1719(2010)09-1667-03
TheDifferenceAboutSeveralResponseScaleTypes
ZHANGYan-hong1,LIUBao-yan2,HELi-yun1
(1.ClinicalEvaluationCenterofInstituteofClinicalBasicMedicine,ChinaAcademyofChineseMedicalSciences,Beijing100700,China;
2.ChinaAcademyofChineseMedicalSciences,Beijing100700,China)
Abstract:Itisanimportantcoursefordesigningtheanswerstotheitemsduringthedevelopmentofaninstrument.Linear
rankingscaleandbinarycategoryareincommonuse,andeachonehasitsspecialty.Thelinearscaleisusedtomeasurethescale,
changeofthesameindividualwithtime;therankingscaleispaidmoreattentiontotheequaldistancebetweenthepoints;while,thebinarycategorymaybeprovidelessinformation.Infact,thedesignofresponsescaleisnotinvariable,andweusuallyusesev-eraltypessimultaneously,consideringtheparticularityofwhatwearetomeasure,thecomprehensionoftheinterviewer,there-sponserate,etc.
Keywords:responsescale;visualanalog;ikertscale;binarycategory量表是用来量化观察结果的一种测量工具,被广泛应用于医学、心理、社会等领域的评估,不仅是收集资料的重要手段,也是开展科研、临床工作的重要方法
其最显著的特点是和途径。量表作为一种测量手段,
能够对主观判断进行量化分级。从量表设计者角度讲,选择合适的测量尺度,构建可信、有效的测量,是确《简明医彀·口渴内溃》:“口渴者,有篇中一条因毒热攻冲,致胃火上炎,口作大渴也。内溃者,胃脘溃烂,穿出胸背而死,惨伤莫此为甚。群书皆谓风寒外袭,腠理
。”《简明医固密,壅塞不通,阳气挟同毒火,内攻而溃
,彀》明代孙志宏撰,成书于1629年,他针对口渴与胃脘溃烂提出了“毒热”致病的理论,风寒外袭,壅塞不通,化为毒热,毒热上攻于胃致口渴,毒热壅盛,血败肉
“胃毒热证”腐致胃脘溃烂。明代之后,孙志宏有关的
更没有得到继承与发扬。他的理论没有被医家提起,
“毒热”致病的理论也仅仅提到口渴与胃脘溃烂两证。6胃癌前状态疾病活动期符合“毒热”的病因学特征
“毒热”周学文教授创立病因学说
胃癌前状态疾病活动期以胃脘灼痛、吞酸嘈杂、口干口苦、舌红苔黄,或腻或腐、脉弦为主要证候表现,胃镜下可见局部红肿、糜烂、溃疡等变化。其发病的原因主要是幽门螺旋杆菌感染、吸烟、饮酒、不良饮食习惯
收稿日期:2010-01-27
基金项目:国家科技部973计划项目(2006CB504601);中国中医科学院
自主选题项目(ZZ2006025)(),,:保得到理想的测量结构的关键环节。针对量表条目的测量尺度,笔者查阅了近30年国内外有关量表设计的文献,对几种常用的测量尺度形式的使用特点进行了
拟为量表研制中测量尺度的设计提供参考。阐述,
1测量尺度的内涵
对于量表来讲,条目是量表的主体,而条目又包括以及胃酸、胆盐、存物(胃体、胃窦存物),精神情志的异常变化也是导致疾病发生的重要因素。对比上文所述中医文献中的“毒热”病因,上述的病因均属于“毒
。“毒热”范围病邪包括从口而入的毒邪,或情志热”
过极气郁化热蕴毒,或胆汁不循常道反流入胃化毒,而脾虚为发病的内在根据。病由毒起,热由毒化,毒热之邪蕴结于胃,损伤胃络,胃膜失养,热盛肉腐,而成痈
——胃黏膜的糜烂、疡—坏死、溃疡组织形成。
国家名中医周学文教授继承国家级名老中医李玉“内痈”“毒热”奇之说,创立了病因学说,认为胃癌前状态疾病活动期病机以脾胃虚弱为本;毒热为标;久病入络,气血瘀滞为变,久致热盛毒腐成痈。毒邪或从口入;或情志过极气郁化热蕴毒;或胆汁逆流入胃化毒等,也正因为脾气不旺,正气亏虚,机体无力驱邪排毒,使毒邪日深,正气愈损,病程缠绵,其活动期则热盛毒
,“实中夹虚”腐,胃膜失养。因此为基本病机特点,
“胃毒热证”,“以痈论治”,“清热为基本证候基本治则解毒、消痈生肌”为基本治法。这一创新病因假说的提出,为不同疾病的发生做出了相同的病因解释,从而
)提供了理论为不同疾病应用同一治法(“以痈论治”
·1668·
问题和测量尺度两方面。条目的问题是表达一个观点的不同语句,与每个问题伴随的测量尺度是一系列表示对该语句赞同程度的描述。测量尺度指将被测者所具有的测量特征以数字的形式分配到特定位置,从而形成一个连续体的过程。如例1是一个完整的条目,“□极差□差□不好也不差□好□极好”这些供选择的选项即为测量尺度。如果将量表看作是一把标准尺子,用这把尺子对被测的属性进行测量,那么这把尺子的刻度就相当于测量尺度。
例1:利克特测量尺度(1)您的食欲怎么样?
□极差□差□不好也不差□好□极好测量尺度的设计是一个复杂的过程,不仅仅是词语简单的构想和罗列,需要有严密的设计方案和可操作的验证方法,与量表结构、条目特点、测试对象对条目的理解程度、统计学要求以及量表性能密切相关,涉及到医学、心理学、统计学等多个领域。2测量尺度的形式
测量尺度形式有很多种类,大体可分为线性尺度、等级尺度、两分类。每种形式都有各自的特点,可以将多种形式组合在一起进行设计。
2.1线性尺度线性尺度是在标有刻度的线段上划记选择,其最常见的设计形式是视觉类比测量。
视觉类比(VisualAnalog)视觉类比,即测量尺度呈现一根连续的线条,表示对一个连续体的相反两端的一对描述。被测者在线条上做一个标记来表示他们的观点、体验、信念或者其他
所标记点的得分差异由设计者决任何被测量的东西,
定。例2是典型的视觉类比测量尺度。
例2:视觉类比测量尺度您的食欲怎么样?极差极好视觉类比测量尺度最大的特点是,能够非常敏感地测量同一个体随时间的变化而发生的改变。因为任何一个被测者都很难准确地回想出在一条没有特征的
除非他(她)选择的是两个端线上所标记的点在哪里,
点,否则就很难或者根本不可能精确地回想起他们过去对该问题的反应。所以,视觉类比测量在评价某种干预措施的效果时就占有一定的优势。因为,对于评价性量表来讲,主要是说明量表随时间的变化情况,重
不同个体间的差异并不太重要,如果量表内视敏感性,
测量时间相对较短,那么不妨采用视觉类比测容不多,
量尺度。
需要注意的是,不同的人沿着这条线在特定的点
即使所有的所做的记号可能并不意味着相同的意义,
被测者在这条线上所标注的点都相同,其意义也可能
既可以理解为“被测者不一样。如例2所做的标记,
,感觉自己的食欲不太好,没有达到极好的标准”也可
“被测者感觉自己的食欲还可以,以理解为离极好的
。也就是说,即使若干被测者在这标准已经不远了”
条线上所标记的点相同,这些点在这些人心中的分量
这种测量尺度形式的量表在被测者间也不一定相同,
没有可比性,它只能反映单个被测者对相关问题态度的变化情况,即在被测者内具有一定的可比性。2.2等级尺度等级尺度是用一些表示程度、频度的7点、11量尺度形式。我们常用的Likert测量,如5点、
辽宁中医杂志2010年第37卷第9期
点等,都是此种类型的尺度形式。
利克特测量(LikertScale)
利克特测量是1932年美国社会心理学家R.利克特提出的一种简化的测量方法。这种测量尺度的形式
针对提出的问题,采用若干个有一定等级排列的形是,
表示对该问题赞同或认可的程度。例1容词或副词,
就是典型的利克特测量尺度。
利克特测量尺度的特点是,各选项由一系列口语化的形容词或副词组成,并且是等距序列。如果答案
“中立点”,选项有那么中立点两侧的答案是对称均匀
,的,如例1;如果答案选项没有“中立点”那么前半部如例3。只有满分和后半部分的答案也要对称均匀,
足以上特征的测量形式才可以认为是合格的、真实的利克特测量尺度。
例3:利克特测量尺度(2)您的食欲怎么样?
□极差□差□好□极好利克特测量尺度的设计要求有:
(1)答案选项间等距:由于利克特测量尺度设计实际要求并不严格,很难提供一个普遍应用的一套规则,但可以肯定的是,利克特测量尺度间的距离相等,答案选项的得分可以设置成连续的整数,这是运用利克特测量尺度的一个基本假设前提,然而在利克特测
答案选项间保持等距这一量尺度的实际设计过程中,
环节往往被忽视。
(2)答案选项的奇偶数视实际情况而定:答案选项的级数可以设置成奇数,也可以设置成偶数,如5
6点、7点、10点、11点等。两种形式的最大区别点、
,是,奇数量的答案选项意味着存在一个“中立点”允
许被测者对所提出问题持模棱两可或不确定的态度;偶数量的答案选项就要迫使被测者一定要对所提出的问题在两个极端方向至少做出一个弱的许可。
(3)答案选项的级数不宜过多:因为被测者对答案选项的识别能力有限,所以通常情况下采用5级至10级的答案选项。即使设置非常多的级数,多数被测
对者也只是使用那些与5或10的倍数相对应的选项,
于35和37这样的差别,被测者通常是无法区分的;况且把事物分成50个离散的级别,几乎是不可能的1。虽然选项越多,从被测者那里得到的信息就越多,但这也可能增加被测者的负担,产生疲劳或厌倦心理而影
人的辨别力不超过7个响测量的信度。有学者提出,
或在7个水平左右(7±2)3,量表的信度不会水平2,
随着答案选项数量的增加而提高4,采用7级以上尺
5级、6级度形式以提高量表信度,其作用是很轻微的,
或7级的答案选项对量表信度的影响很小。
利克特测量尺度形式经久不衰,是传统测量中惯
主要因为其具有简便易行,省时、省力、省财,用格式,
浅显易懂,易于实施。然而我们在使用中也会发现,同视觉类比测量类似,利克特测量在被测者间也不一定
即使不同被测者得分相同,也并不意味着存在可比性,
他们对所提出问题的态度完全相同。也就是说,相同
利克特测量尺度的分数所代表的意义并不一定相同,
可以区分个体间态度的大致趋势,但无法进一步描述他们态度的结构差异。如甲、乙两个被测者对例3的
,问题回答都是“好”所得分数相同,这只能表示甲和
,。此外,
辽宁中医杂志2010年第37卷第9期
者内也不一定存在可比性。比如,对被测者兴趣爱好
“常常”“常常”同一被测者所谓的看电影与打的测量,
篮球,所表示的实际频率可能不同。
2.3两分类两分类尺度即采用两个绝对相反的立场让被测者进行二选一的选择,相当于利克特测量的2级尺度。这种类型测量尺度的特点是,强迫被测者一定要对两种截然相反的态度选项选择出比较接近自己想法的选项。例4即是两分类尺度形式。
例4:两分类尺度您的食欲怎么样?□差□好
两分类测量尺度的基本条件有两个:一是答案选项必须完全互斥,二是能够包容所有可能的选择。有些问题研究者可能无法只用两个相反方面就能够完全
“其它”表达了问题可能出现的态度,因此在最后增加
一项,并要求被测者将资料补在空格处。但是往往被试所填答的资料对于分析并没有任何作用。此外,还
“其它”容易使那些填答的问卷成为废卷。因此,除非
“其它”一般不鼓励在问卷设计中加入一项万不得已,
作为选项。
两分类尺度最大的优点是,被测者对所提出问题的态度非常明确,拒绝中庸模糊的态度,这样可以改善利克特测量对于两极端态度测量敏感度不足的问题。此外,两分类尺度给予被测者的负担较轻,大多数人很
所快就容易决定某些形容词是否表达了他们的态度,
以,被测者通常愿意完成这类题项,而不愿意完成那些需要集中精力来辨析的题项。当然,由于这种尺度使每一个问题答案的可变性最小,通常需要设置更多的
因而增加了编题者的工作量。条目以获得信息,
2.4各类型尺度的比较量表设计过程中,不同形式尺度的应用也不是独立的、单一的,常常是交互使用,对同一测量内容,可以采用多种不同的尺度形式进行测量,总的原则是符合量表设计的实际需求,根据测量要求、被试者特点等多方面考虑,优选最合适的反应尺度。比如,对于疼痛,目前常用多种的尺度形式进行测量。最常见的有视觉模拟测量(Visualanaloguescale,VAS)(图1)。口述分级评分法(Verbalratingscale,VRS)4点口述分级评分法(VRS-4):①无疼;②轻微疼痛;③中等度疼痛;④剧烈疼痛。5点口述分级评分法(VRS-5):①轻微疼痛;②引起不适感疼痛;③具有窘迫感的疼痛;④严重疼痛;⑤剧烈疼痛。0-10数字
NRS)(图2)等。疼痛强度量表(Numericalratingscale,
此4种测量疼痛的尺度万变不离其宗,都是线性尺度、等级尺度形式的变异
。
·1669·
列描绘疼痛的形容词组成,最轻度疼痛的描述常被评为0分,以后每级增加1分,但无论是4点还是5点评分法,都不是利克特测量形式,因为各答案选项的等距
评估耗时性无法判断。但VRS比VAS更容易理解,
少。NRS既具有线性尺度又具有等级尺度形式的特点,要求患者用0~10这11个数字描述疼痛强度,其
因此这种测量尺度中在两端和中央又有描述提示语,
比VAS方法更为直观。有学者曾对VRS和VAS进行了比较,结果发现两种测量尺度形式有很好的相关性,而且VRS得分要比VAS高,认为VRS可以替代VAS
NRS和Likert3种测量慢性疼痛。也有学者将VAS、
测量尺度形式用于测试儿童的相对信度比较。通过用
让被测儿童对3种测量尺一个标有从0到10的尺子,
度的偏爱和容易度进行等级判定,结果发现3种反应
儿童更偏爱Likert尺度,他们尺度的信度具有可比性,
因此推荐测试儿童的问卷采用认为Likert容易填写,
Likert测量尺度形式。3讨论
在实际设计过程中,各类型的测量尺度设计并不是很严格,往往是根据所测内容的特质、被试者的理解能力及应答率等多方面综合考虑尺度的合理设计,并且多种方式融合使用。比如,对于对于那些文化水平
Wong-Baker面部表情量低或丧失表达能力的患者,
表(图3)用6种面部表情从微笑至悲伤至哭泣来表达,。
图3Wong-Baker面部表情量表
图1视觉模拟测量(VAS
)
以上介绍的三种尺度形式都是量表条目设计过程中最常用的尺度类型。线性尺度设计简便,但对被测者的应答理解能力有一定的要求。等级尺度设计看似简单,实际上有许多细节问题,诸如选项措辞、选项间距离、被测者理解程度、得分要求等都影响着测量的精
“在过去4个星期里,准性。如在SF-36中,条目6您
的身体健康或情绪不好在多大程度上影响了您与家
,人、朋友、邻居或集体的正常社交活动?”答案“根本
没有影响、很少有影响、有中度影响、有较大影响、有极
“1、2、3、4、5”;而条目7“在过去4个大影响”分别评分
,“根本没有星期里,您有身体上的疼痛吗?”可供选项
有很轻微疼痛、有轻微疼痛、有中度疼痛、有严重疼痛、
“1.0、2.2、3.1、4.2、5.疼痛、有很严重疼痛”分别评分
4、6.0”,虽然都是等级尺度,但设计的细节直接影响量表评分及测量的准确性。两分类尺度设计时要考虑得到的信息量大小,为提高测量效率和可行性,既要使
又要保持信度不变或下降很少是一项重条目数较少,
要研究内容。因此,在实际运用中,往往采用合理的折中方式,既可以使被测者可接受,又达到理论最优化,通常只有那些刻度标准、合理,节省时间、成本和人力,
“廉价”相对的反应尺度才经常使用。
参考文献[1]罗伯特·F·德威利斯.量表编制理论与应用[M].重庆:重庆大
2006:84.学出版社,
[2]StreinerDLandNormanGR.Healthmeasurementscales:apractical
guidetotheirdevelopmentanduse[M].SecondEdition.Oxford:Ox-fordUniversityPress,1995.[3]MillerGA.Themagicnumbersevenplusorminustwo:Somelimitson
,63:-图20-10数字疼痛强度量表(NRS)
VAS是典型的视觉类比测量,可以对患者治疗前
后效果可进行较为客观的评价,但是患者在作答时比较耗时,需要理解线条抽象概念的能力,许多患者很难判断精确的距离,同时VAS不能做患者之间的比较,
,