系别:心理学系 班级:03级 姓名:范妍 本组成员:廖卉、范妍、杨扬子、吴俊玮 实验日期:2004年11月9日
教师评定:
工作记忆广度
摘要 该实验以中文句子为材料,用Daneman和Carpenter的阅读理解测验的范式测量被试的工作记忆广度,结果表明:被试的工作记忆广度近似呈现一个均值为3.0,标准差为1.098的正态分布;男性和女性在工作记忆广度方面没有显著差别。
关键词 工作记忆 短时记忆 工作记忆容量 阅读理解测验 性别差异
1、 导言
1974年,Baddeley和Hitch在早期短时记忆概念的基础上提出了工作记忆概念,用工作记忆模型代替了原来单一系统的短时存储的概念。总的来说,工作记忆指的是一种系统,它为复杂的认知任务比如言语理解、学习和推理等提供临时的储存空间和加工时所必需的信
[1]
息。其特点有二,一是能够同时储存和加工信息,即记忆与其他高级认知功能,如言语理解、思考、计划等同时进行,这是工作记忆与只强调存贮信息的短时记忆的一大区别。二是其容量是有限的。
工作记忆由三个子系统构成。由注意控制的中枢执行系统,与集中注意、计划和行为有密切的关系,它与两个服务系统协同工作:一个是保持和处理视觉的和空间的映象的视觉空间初步加工系统,另一个是语音回路,它存储和复述以言语为基础的信息,对于新知识的获得比如母语和新语言词汇的学习是必需的。有许多的实验证据表明了这三个系统的存在。图1是简化了的三个系统的图示:
视觉空间初步加工系统 中枢执行系统 语音回路
[1]
[1]
图1 Baddeley和Hitch(1974)简化了的工作记忆模型
工作记忆广度即工作记忆的容量。
[2]
Daneman和Carpenter 1980年创造出的测量工作记忆容量的方法,要求被试阅读一系列句子,随后回忆每个句子最后一个单词,工作记忆阅读广度用被试能够正确阅读并记住尾词的句子的个数来测量。与单纯的数字记忆广度、单词记忆广度测验不同,工作记忆测试要求被试能够正确理解句子并且记住单词,即要同时完成理解与记忆两种工作,这符合工作记
[2]
忆的理论概念。Daneman等人的实验证实了工作记忆容量与许多理解测验有高相关,即工
作记忆在理解中起着重要的作用,但短时记忆广度与理解测验则没有相关。
此后,还有研究者用其他方法对工作记忆进行了研究。比如Turner和Engle的操作-单
[3]
字广度测验。他们给被试呈现如下的算式与单字: (4×2)-1=1? SNOW (3×1)+4=7? TABLE
要求被试口算这些式子并验证结果,然后读单字,最后让被试回忆所有的单字。算式-单字串是逐步增加的,能回忆出的单字数代表记忆广度,而且这种测验结果与阅读理解测验也存在相关。这种方法测量的即是被试的工作记忆能力。
[2]
Daneman和Merikle在1996还证明工作记忆容量是存在个体差异的。用上述方法测量工作记忆广度,如果被试能回忆4个以上的单词,通常就被认为有高的记忆广度,而如果他们回忆2.5个单词以下就是低的记忆广度——这些是多次试验和多个句子的平均数。
因为工作记忆广度是个体可用于完成短时认知任务资源的测量,研究者们能利用它来预测各种任务中被试的表现行为。容量有限的工作记忆概念已经很有成效地应用于个别差异的研究中[4],激动人心的是工作记忆测验还和以推理为基础的智力测验之间有非常高的相关[4]
。工作记忆的概念和智力的概念联系起来,显示了其对心理测量学的巨大潜在价值。 本实验以中文句子为材料,用Daneman和Carpenter的范式测量工作记忆广度,考察这些被试工作记忆广度的分布状况,并检查被试性别对它的影响。
2、 方法
2.1 被试
被试为北京大学心理学系03级本科生24人,其中男性12人,女性12人,年龄17~23岁,均为右利手,视力或矫正视力正常,无色盲色弱,按照性别自然分为两组。 2.2 仪器和材料
装有Psykey装有Psykey心理教学系统大学版的计算机 红黄绿三色反应键盒 纸 笔 145个中等长度的简单句,分为练习阶段以及2~7这五个广度水平,每个广度水平都有5套句子,每套中的句子数等于该套的广度水平,练习阶段句子数与2水平的相同。句子半随机呈现,以保证在每一水平上,每套句子都有一半是通顺的,另一半是不通顺的。
句子示例:我没有任何理由反对这参加他次比赛。
每个句子的最后一个词都是双音词,词频大致相等,都比较高。 字体为宋体,大小14。 2.3 实验设计
本实验依次向被试呈现一个一个句子,要求被试在判断句子通顺与否的同时记忆句子的最后一个词。若每一套的每一个句子被试要判断正确并且记忆正确,才计这一套为“正确”,若这套中有任何一处错误,则这一套为“错误”。
只有当上一个水平的五套中做对了两套或以上,才能够进入下一个水平的测验。最后的记忆广度值按以下方法计算:当最高水平的测验做对了三套或以上时,其工作记忆广度就是该水平数(也就是该水平每套中的句子数);做对两套时,则为水平数减0.5;只做对一套,则退到前一水平看其正确个数。例如在3水平上,5套中做对了3套,阅读广度计为3;做对了2套,阅读广度计为2.5;做对了1套,阅读广度计为2。
本实验根据性别把被试自然分为两组,测量每名被试的工作记忆广度,并考察性别对它的影响。
实验中对句子的长度和复杂程度、句末词语的次品、句子的呈现时间、红色叹号的呈现时间(即提供给被试对句子通顺与否做出反应的时间)、被试的年龄、学历等变量都作了控制。
实验在安静的公共计算机机房进行,对被试的视力和利手性也作了控制。 2.4 实验程序
2.4.1 被试距计算机显示屏一臂距离坐好,拿好反应键盒,桌上准备好纸和笔。
2.4.2 先进行练习:屏幕中央依次显示句子,一次一句,每句呈现4s。要求被试大声朗读句子。句子呈现完毕后,出现一红色叹号,要求被试迅速判断刚才阅读的句子是否通顺并作出反应。如果通顺,按“红”键;不通顺,按“绿”键。同时还要在心里记忆句子的最后一个词。例如:呈现句子:
我没有任何理由反对这参加他次比赛。
被试按键判断(这题应按绿键)并记住“比赛”。
按键反应后红色叹号消失,接着呈现下一个句子。如果被试不按键反应,4秒后红色叹号自动消失,呈现下一个句子。
每套句子呈现完毕后,暂停,被试把所记忆的句子的最后一个词按先后顺序写在纸上,写完后点击“确定”再开始继续下一套句子。五套全部做完之后,屏幕呈现输入框。被试把写在纸上的词按顺序输入,如有回忆不起来的,空出那个位置,输入完毕点击“确定”。
被试可以通过练习阶段调整朗读句子的速度。
2.4.3 正式开始实验:被试从记忆广度水平2开始做。对于每套句子,只有当判断通顺的任务和最后词语的输入两者都正确,才能算这一套做对了。每个水平做对了2套或以上的,才能够进入下一个水平,直到记忆广度水平7。被试要一直做到自己所能做到的最高水平。 2.4.4 按照记忆广度值的计算方法计算每位被试的记忆广度值,并填在记录表中。
3、 结果
附录中列出的,是全体被试的工作记忆广度及性别对照。 表1中是全体被试工作记忆广度的分组次数分布表。
表1 工作记忆广度的分组次数分布表 工作记忆广度
7.0 6.5 6.0 5.5 5.0 4.5 4.0 3.5 3.0 2.5 2.0 1.5 1.0
次数 0 0 0 1 1 1 2 3 6 4 3 2 1
百分数p 0.0000 0.0000 0.0000 0.0417 0.0417 0.0417 0.0833 0.1250 0.2500 0.1667 0.1250 0.0833 0.0417
p% 0.00 0.00 0.00 4.17 4.17 4.17 8.33 12.50 25.00 16.67 12.50 8.33 4.17
累计次数 累计百分比(%) 24 24 24 24 23 22 21 19 16 10 6 3 1
100.00 100.00 100.00 100.00 95.83 91.67 87.50 79.17 66.67 41.67 25.00 12.50 4.17
根据表1画出全体被试的工作记忆广度的分组次数分布图,如图2。
7
6
5
4
人数
3210
1.0
1.5
2.0
2.5
3.0
3.5
4.0工作记忆广度
4.5
5.0
5.5
6.0
6.5
7.0
图2 工作记忆广度的分组次数分布图
算得以上分布平均值和众数为3.0,中数为2.92,标准差为1.098,全距为5,四分距为4.58。
分别算得男女被试的平均工作记忆广度及标准差,列在表2中。
表2
男 女
根据表2画出男女被试平均工作记忆广度的对比图,如图3。
4.0
2.833(.3276) 3.125(.3146)
3.5
3.0
2.5
工作记忆广
2.0
1.5
1.0
0.5
0.0
被试
图3 男女两组的平均记忆广度(标准差)对比
对男女两组被试的工作记忆广度作0.05水平的独立样本t检验(双尾),结果表明:男性被试(M=2.833,SE=.3276)与女性被试(M=3.125,SE=.3146)在工作记忆广度上没有
显著差异:t(22).642,p.527。
4、 讨论
从表1和图2中知道,工作记忆广度的分布,全体被试的平均值是3.0,其中记忆广度为3.0的人数最多,有50%的人得分小于等于2.92。均值等于众数,又约等于中数,再结合标准差、全距和四分距,虽然从图2中看到6.0、6.5、7.0三个分数的人数都是0,但我们仍认为工作记忆广度的分布近似是一个均值为3.0,标准差为1.098的正态分布。一般来说,这种心理能力的测验,总体大都呈正态分布,所以这个结果符合我们的预期,也符合前人关于工作记忆容量的个体差异在大量实验和统计结果的基础上得出的结论,即,如果被试能回忆4个以上的单词,通常就被认为有高的记忆广度,而如果他们回忆2.5个单词以下就是低的记忆广度。大部分人的工作记忆容量都处于中等水平,高水平或低水平的工作记忆容量都是少数的。
观察表2和图3,以及0.05水平的独立样本t检验(双尾),都显示在17~23岁这个年龄段,男性和女性在工作记忆广度上的差异不明显,这也是符合预期的。两个性别在这方面的容量差不多。
从方法上看,本实验中测量工作记忆广度的方法,要求被试判断句子是否正确的同时要求记住一个数字,符合工作记忆同时加工和存储的概念,抓住了工作记忆和短时记忆的关键区别,所以测量的是工作记忆而不是短时记忆。
对比Turner和Engle(1989)的测量方法,本实验用对句子的阅读和理解这个任务来体现工作记忆的“加工”部分,而Turner和Engle(1989)用的是口算算式的任务。前人证实这两个方法之间存在相关。本实验用的阅读理解测验的方法,加工和记忆都是针对文字信息,也许更符合在人在学习书本时工作记忆所发挥的作用。并且,本实验使用中文材料,而Daneman和Carpenter的经典实验使用的材料是英语。本方法适合于测量中国人的工作记忆容量。
5、 参考文献
[1] Baddeley,A.D.,and G.Hitch.Working memory.In The Psychology of Leaning and
Motivation,vol.8,G.A.Bower,ed.New York:Academic Press,pp.1974,47—89.
[2] Daneman.M.,and P.A.Carpenter.Individual differences in working memory and
reading.J.Verb.Learn.Verb.Be.19:1980,450—466.
[3] Baddeley A D. Working memory. Science 1992 255:556-559.
[4] 加尔扎尼著,王甦等译.认知神经科学.北京,北京大学出版社.1997.431—441.
附录 全体被试工作记忆广度及性别对照 被试号 工作记忆广度 性别 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 3.0 1.5 3.0 5.5 3.0 2.0 2.5 2.5 3.0 1.0 3.5 3.5 3.5 3.0 5.0 4.0 2.5 4.5 1.5 3.0 2.0 2.5 2.0 男 男 男 男 男 男 男 男 男 男 男 男 女 女 女 女 女 女 女 女 女 女 女
系别:心理学系 班级:03级 姓名:范妍 本组成员:廖卉、范妍、杨扬子、吴俊玮 实验日期:2004年11月9日
教师评定:
工作记忆广度
摘要 该实验以中文句子为材料,用Daneman和Carpenter的阅读理解测验的范式测量被试的工作记忆广度,结果表明:被试的工作记忆广度近似呈现一个均值为3.0,标准差为1.098的正态分布;男性和女性在工作记忆广度方面没有显著差别。
关键词 工作记忆 短时记忆 工作记忆容量 阅读理解测验 性别差异
1、 导言
1974年,Baddeley和Hitch在早期短时记忆概念的基础上提出了工作记忆概念,用工作记忆模型代替了原来单一系统的短时存储的概念。总的来说,工作记忆指的是一种系统,它为复杂的认知任务比如言语理解、学习和推理等提供临时的储存空间和加工时所必需的信
[1]
息。其特点有二,一是能够同时储存和加工信息,即记忆与其他高级认知功能,如言语理解、思考、计划等同时进行,这是工作记忆与只强调存贮信息的短时记忆的一大区别。二是其容量是有限的。
工作记忆由三个子系统构成。由注意控制的中枢执行系统,与集中注意、计划和行为有密切的关系,它与两个服务系统协同工作:一个是保持和处理视觉的和空间的映象的视觉空间初步加工系统,另一个是语音回路,它存储和复述以言语为基础的信息,对于新知识的获得比如母语和新语言词汇的学习是必需的。有许多的实验证据表明了这三个系统的存在。图1是简化了的三个系统的图示:
视觉空间初步加工系统 中枢执行系统 语音回路
[1]
[1]
图1 Baddeley和Hitch(1974)简化了的工作记忆模型
工作记忆广度即工作记忆的容量。
[2]
Daneman和Carpenter 1980年创造出的测量工作记忆容量的方法,要求被试阅读一系列句子,随后回忆每个句子最后一个单词,工作记忆阅读广度用被试能够正确阅读并记住尾词的句子的个数来测量。与单纯的数字记忆广度、单词记忆广度测验不同,工作记忆测试要求被试能够正确理解句子并且记住单词,即要同时完成理解与记忆两种工作,这符合工作记
[2]
忆的理论概念。Daneman等人的实验证实了工作记忆容量与许多理解测验有高相关,即工
作记忆在理解中起着重要的作用,但短时记忆广度与理解测验则没有相关。
此后,还有研究者用其他方法对工作记忆进行了研究。比如Turner和Engle的操作-单
[3]
字广度测验。他们给被试呈现如下的算式与单字: (4×2)-1=1? SNOW (3×1)+4=7? TABLE
要求被试口算这些式子并验证结果,然后读单字,最后让被试回忆所有的单字。算式-单字串是逐步增加的,能回忆出的单字数代表记忆广度,而且这种测验结果与阅读理解测验也存在相关。这种方法测量的即是被试的工作记忆能力。
[2]
Daneman和Merikle在1996还证明工作记忆容量是存在个体差异的。用上述方法测量工作记忆广度,如果被试能回忆4个以上的单词,通常就被认为有高的记忆广度,而如果他们回忆2.5个单词以下就是低的记忆广度——这些是多次试验和多个句子的平均数。
因为工作记忆广度是个体可用于完成短时认知任务资源的测量,研究者们能利用它来预测各种任务中被试的表现行为。容量有限的工作记忆概念已经很有成效地应用于个别差异的研究中[4],激动人心的是工作记忆测验还和以推理为基础的智力测验之间有非常高的相关[4]
。工作记忆的概念和智力的概念联系起来,显示了其对心理测量学的巨大潜在价值。 本实验以中文句子为材料,用Daneman和Carpenter的范式测量工作记忆广度,考察这些被试工作记忆广度的分布状况,并检查被试性别对它的影响。
2、 方法
2.1 被试
被试为北京大学心理学系03级本科生24人,其中男性12人,女性12人,年龄17~23岁,均为右利手,视力或矫正视力正常,无色盲色弱,按照性别自然分为两组。 2.2 仪器和材料
装有Psykey装有Psykey心理教学系统大学版的计算机 红黄绿三色反应键盒 纸 笔 145个中等长度的简单句,分为练习阶段以及2~7这五个广度水平,每个广度水平都有5套句子,每套中的句子数等于该套的广度水平,练习阶段句子数与2水平的相同。句子半随机呈现,以保证在每一水平上,每套句子都有一半是通顺的,另一半是不通顺的。
句子示例:我没有任何理由反对这参加他次比赛。
每个句子的最后一个词都是双音词,词频大致相等,都比较高。 字体为宋体,大小14。 2.3 实验设计
本实验依次向被试呈现一个一个句子,要求被试在判断句子通顺与否的同时记忆句子的最后一个词。若每一套的每一个句子被试要判断正确并且记忆正确,才计这一套为“正确”,若这套中有任何一处错误,则这一套为“错误”。
只有当上一个水平的五套中做对了两套或以上,才能够进入下一个水平的测验。最后的记忆广度值按以下方法计算:当最高水平的测验做对了三套或以上时,其工作记忆广度就是该水平数(也就是该水平每套中的句子数);做对两套时,则为水平数减0.5;只做对一套,则退到前一水平看其正确个数。例如在3水平上,5套中做对了3套,阅读广度计为3;做对了2套,阅读广度计为2.5;做对了1套,阅读广度计为2。
本实验根据性别把被试自然分为两组,测量每名被试的工作记忆广度,并考察性别对它的影响。
实验中对句子的长度和复杂程度、句末词语的次品、句子的呈现时间、红色叹号的呈现时间(即提供给被试对句子通顺与否做出反应的时间)、被试的年龄、学历等变量都作了控制。
实验在安静的公共计算机机房进行,对被试的视力和利手性也作了控制。 2.4 实验程序
2.4.1 被试距计算机显示屏一臂距离坐好,拿好反应键盒,桌上准备好纸和笔。
2.4.2 先进行练习:屏幕中央依次显示句子,一次一句,每句呈现4s。要求被试大声朗读句子。句子呈现完毕后,出现一红色叹号,要求被试迅速判断刚才阅读的句子是否通顺并作出反应。如果通顺,按“红”键;不通顺,按“绿”键。同时还要在心里记忆句子的最后一个词。例如:呈现句子:
我没有任何理由反对这参加他次比赛。
被试按键判断(这题应按绿键)并记住“比赛”。
按键反应后红色叹号消失,接着呈现下一个句子。如果被试不按键反应,4秒后红色叹号自动消失,呈现下一个句子。
每套句子呈现完毕后,暂停,被试把所记忆的句子的最后一个词按先后顺序写在纸上,写完后点击“确定”再开始继续下一套句子。五套全部做完之后,屏幕呈现输入框。被试把写在纸上的词按顺序输入,如有回忆不起来的,空出那个位置,输入完毕点击“确定”。
被试可以通过练习阶段调整朗读句子的速度。
2.4.3 正式开始实验:被试从记忆广度水平2开始做。对于每套句子,只有当判断通顺的任务和最后词语的输入两者都正确,才能算这一套做对了。每个水平做对了2套或以上的,才能够进入下一个水平,直到记忆广度水平7。被试要一直做到自己所能做到的最高水平。 2.4.4 按照记忆广度值的计算方法计算每位被试的记忆广度值,并填在记录表中。
3、 结果
附录中列出的,是全体被试的工作记忆广度及性别对照。 表1中是全体被试工作记忆广度的分组次数分布表。
表1 工作记忆广度的分组次数分布表 工作记忆广度
7.0 6.5 6.0 5.5 5.0 4.5 4.0 3.5 3.0 2.5 2.0 1.5 1.0
次数 0 0 0 1 1 1 2 3 6 4 3 2 1
百分数p 0.0000 0.0000 0.0000 0.0417 0.0417 0.0417 0.0833 0.1250 0.2500 0.1667 0.1250 0.0833 0.0417
p% 0.00 0.00 0.00 4.17 4.17 4.17 8.33 12.50 25.00 16.67 12.50 8.33 4.17
累计次数 累计百分比(%) 24 24 24 24 23 22 21 19 16 10 6 3 1
100.00 100.00 100.00 100.00 95.83 91.67 87.50 79.17 66.67 41.67 25.00 12.50 4.17
根据表1画出全体被试的工作记忆广度的分组次数分布图,如图2。
7
6
5
4
人数
3210
1.0
1.5
2.0
2.5
3.0
3.5
4.0工作记忆广度
4.5
5.0
5.5
6.0
6.5
7.0
图2 工作记忆广度的分组次数分布图
算得以上分布平均值和众数为3.0,中数为2.92,标准差为1.098,全距为5,四分距为4.58。
分别算得男女被试的平均工作记忆广度及标准差,列在表2中。
表2
男 女
根据表2画出男女被试平均工作记忆广度的对比图,如图3。
4.0
2.833(.3276) 3.125(.3146)
3.5
3.0
2.5
工作记忆广
2.0
1.5
1.0
0.5
0.0
被试
图3 男女两组的平均记忆广度(标准差)对比
对男女两组被试的工作记忆广度作0.05水平的独立样本t检验(双尾),结果表明:男性被试(M=2.833,SE=.3276)与女性被试(M=3.125,SE=.3146)在工作记忆广度上没有
显著差异:t(22).642,p.527。
4、 讨论
从表1和图2中知道,工作记忆广度的分布,全体被试的平均值是3.0,其中记忆广度为3.0的人数最多,有50%的人得分小于等于2.92。均值等于众数,又约等于中数,再结合标准差、全距和四分距,虽然从图2中看到6.0、6.5、7.0三个分数的人数都是0,但我们仍认为工作记忆广度的分布近似是一个均值为3.0,标准差为1.098的正态分布。一般来说,这种心理能力的测验,总体大都呈正态分布,所以这个结果符合我们的预期,也符合前人关于工作记忆容量的个体差异在大量实验和统计结果的基础上得出的结论,即,如果被试能回忆4个以上的单词,通常就被认为有高的记忆广度,而如果他们回忆2.5个单词以下就是低的记忆广度。大部分人的工作记忆容量都处于中等水平,高水平或低水平的工作记忆容量都是少数的。
观察表2和图3,以及0.05水平的独立样本t检验(双尾),都显示在17~23岁这个年龄段,男性和女性在工作记忆广度上的差异不明显,这也是符合预期的。两个性别在这方面的容量差不多。
从方法上看,本实验中测量工作记忆广度的方法,要求被试判断句子是否正确的同时要求记住一个数字,符合工作记忆同时加工和存储的概念,抓住了工作记忆和短时记忆的关键区别,所以测量的是工作记忆而不是短时记忆。
对比Turner和Engle(1989)的测量方法,本实验用对句子的阅读和理解这个任务来体现工作记忆的“加工”部分,而Turner和Engle(1989)用的是口算算式的任务。前人证实这两个方法之间存在相关。本实验用的阅读理解测验的方法,加工和记忆都是针对文字信息,也许更符合在人在学习书本时工作记忆所发挥的作用。并且,本实验使用中文材料,而Daneman和Carpenter的经典实验使用的材料是英语。本方法适合于测量中国人的工作记忆容量。
5、 参考文献
[1] Baddeley,A.D.,and G.Hitch.Working memory.In The Psychology of Leaning and
Motivation,vol.8,G.A.Bower,ed.New York:Academic Press,pp.1974,47—89.
[2] Daneman.M.,and P.A.Carpenter.Individual differences in working memory and
reading.J.Verb.Learn.Verb.Be.19:1980,450—466.
[3] Baddeley A D. Working memory. Science 1992 255:556-559.
[4] 加尔扎尼著,王甦等译.认知神经科学.北京,北京大学出版社.1997.431—441.
附录 全体被试工作记忆广度及性别对照 被试号 工作记忆广度 性别 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 3.0 1.5 3.0 5.5 3.0 2.0 2.5 2.5 3.0 1.0 3.5 3.5 3.5 3.0 5.0 4.0 2.5 4.5 1.5 3.0 2.0 2.5 2.0 男 男 男 男 男 男 男 男 男 男 男 男 女 女 女 女 女 女 女 女 女 女 女