实用工具|美国当代英语语料库 COCA

美国当代英语语料库(Corpus of Contemporary American English,简称COCA)是目前最大的免费英语语料库,也是第一个大型的语料平衡的美国英语语料库。语料库由包含4.5亿词的文本构成,文本分为口语、小说、流行杂志、报纸以及学术文章五种不同的文体,各占库容的20%。

它不仅是一个简单的在线词典,而且从建立之初就体现了其作为检索语料库的特征,能够协助研究者追溯语言发展中的变迁(Davies,2010)。该语料库由美国杨百翰大学的Mark Davies教授主持创立并在2008年正式上线。其除了强大的文本检索功能外,由于将语料按照年份进行了细致的划分,使得研究者追溯语言发展中的变迁成为可能。

下面小编就来简要介绍一下COCA的主要功能和使用注意事项

这就是COCA的网站封面,看起来还是很有设计感的吧

封面过后,终于进入主界面了,看起来不是很繁琐,但实际上功能多多

这里就是最主要的操作处,也就是输入查询词的地方,先来个最简单的单词查询看看,直接输入cause(注:此处直接输入仅显示cause本身的搜索结果,不包括causes,caused等等,如需检索单词的全部形式,检索时需加[],下同),下图则是检索的结果,右上是检索概要,右下是索引行信息。

COCA的一大特点是将文本分成了不同的语体,我们可以比较同一个词在不同语体中的出现状况,还是以上文的搜索词cause为例,我们试图对比其在人文类学术文章和科技类学术文章的分布差异,下图是其具体的检索结果,小编先解释一下,几个数据分别的含义,tokens1指检索词在第一部分语体中的出现频次(即图例中的人文类学术文章),tokens2指检索词在第二部分语体中的出现频次(即图例中的科技类学术文章),PM1和PM2则分别指两个语体中的百万词词频,RATIO则是二者的比值;下图中检索词在两种语体中差异还是相对明显的,科技类学术文章中的使用明显多于人文类学术文章。

就这点内容似乎还不够精彩,COCA还支持检索词的搭配关系搜索,看到图中的POST LIST选项了嘛,从中可以选出想要的搭配词类,比如说小编搜索与reflect后面出现的名词,并按相关度排序(见下图),便得到了reflect后面关联度最高的名词成分。

COCA同样可以让检索者方便的进行文本细读,比如说想知道检索词有哪些左邻词和右邻词,选择KWIC检索,便可以得到下图的索引行检索结果,索引行信息中完整的包含了语体、出处和年份信息,还对节点词附近的邻词按照不同的词类用不同颜色进行高亮表示。

除了列表显示(list),COCA还支持图标显示检索词在各语体中的分布情况,下图便是cause在语料库各语体中的分布情况。

更令人感到欣喜的是,COCA还支持不同语料库检索词语体分布信息的比较,如下图所示,可以与BNC、COHA、TIME等众多语料库的词语语体分布或历时变化特征比较(视对比语料库而定)

不仅如此,COCA还可以进行同义词辨析,比如说smart和clever,中国学生可能会分不清二者的区别,而借助语料库,可以轻松发现两者的常用搭配完全不同。

美国当代英语语料库(Corpus of Contemporary American English,简称COCA)是目前最大的免费英语语料库,也是第一个大型的语料平衡的美国英语语料库。语料库由包含4.5亿词的文本构成,文本分为口语、小说、流行杂志、报纸以及学术文章五种不同的文体,各占库容的20%。

它不仅是一个简单的在线词典,而且从建立之初就体现了其作为检索语料库的特征,能够协助研究者追溯语言发展中的变迁(Davies,2010)。该语料库由美国杨百翰大学的Mark Davies教授主持创立并在2008年正式上线。其除了强大的文本检索功能外,由于将语料按照年份进行了细致的划分,使得研究者追溯语言发展中的变迁成为可能。

下面小编就来简要介绍一下COCA的主要功能和使用注意事项

这就是COCA的网站封面,看起来还是很有设计感的吧

封面过后,终于进入主界面了,看起来不是很繁琐,但实际上功能多多

这里就是最主要的操作处,也就是输入查询词的地方,先来个最简单的单词查询看看,直接输入cause(注:此处直接输入仅显示cause本身的搜索结果,不包括causes,caused等等,如需检索单词的全部形式,检索时需加[],下同),下图则是检索的结果,右上是检索概要,右下是索引行信息。

COCA的一大特点是将文本分成了不同的语体,我们可以比较同一个词在不同语体中的出现状况,还是以上文的搜索词cause为例,我们试图对比其在人文类学术文章和科技类学术文章的分布差异,下图是其具体的检索结果,小编先解释一下,几个数据分别的含义,tokens1指检索词在第一部分语体中的出现频次(即图例中的人文类学术文章),tokens2指检索词在第二部分语体中的出现频次(即图例中的科技类学术文章),PM1和PM2则分别指两个语体中的百万词词频,RATIO则是二者的比值;下图中检索词在两种语体中差异还是相对明显的,科技类学术文章中的使用明显多于人文类学术文章。

就这点内容似乎还不够精彩,COCA还支持检索词的搭配关系搜索,看到图中的POST LIST选项了嘛,从中可以选出想要的搭配词类,比如说小编搜索与reflect后面出现的名词,并按相关度排序(见下图),便得到了reflect后面关联度最高的名词成分。

COCA同样可以让检索者方便的进行文本细读,比如说想知道检索词有哪些左邻词和右邻词,选择KWIC检索,便可以得到下图的索引行检索结果,索引行信息中完整的包含了语体、出处和年份信息,还对节点词附近的邻词按照不同的词类用不同颜色进行高亮表示。

除了列表显示(list),COCA还支持图标显示检索词在各语体中的分布情况,下图便是cause在语料库各语体中的分布情况。

更令人感到欣喜的是,COCA还支持不同语料库检索词语体分布信息的比较,如下图所示,可以与BNC、COHA、TIME等众多语料库的词语语体分布或历时变化特征比较(视对比语料库而定)

不仅如此,COCA还可以进行同义词辨析,比如说smart和clever,中国学生可能会分不清二者的区别,而借助语料库,可以轻松发现两者的常用搭配完全不同。


相关内容

  • 大学公共英语多模态语料库的构建与应用
  • 山东外语教学 ShandongForeignLanguageTeaching Journal2014年第3期(总第160期) 大学公共英语多模态语料库的构建与应用 张振虹1,何美1,韩智2 (1.天津大学文法学院,天津300074:2.南开大学软件学院,天津300072) 多模态语料库是一种计算机辅 ...

  • 英语词典哪个好?怎样选择适合你的英语词典?
  • 英语词典哪个好?怎样选择适合你的英语词典? 语言学习,首先要从字词开始,相信很多同学在学习英语的过程中,都会面临单词不认识,意思不理解的情况,因此查词典的工作必不可少.选择一本有针对性并且适合自己的词典对于我们的英语学习来说至关重要.那么我们应该怎样选择适合自己的词典呢?本文就简单分享一下关于英语词 ...

  • 英语广告口号中头韵修辞的汉译
  • 第26卷第2期2009年6月 ● 青 岛 大 学 师 范 学 院 学 报 JOURNAL OF TE ACHERS COLLEGE Q I N G DAO UN I V ERSI TY Vol . 26No . 2 Jun . 2009 语言学研究 英语广告口号中头韵修辞的汉译 布占廷 (青岛大学师 ...

  • 免费的英语语料库汇总
  • 免费的英语语料库汇总 Some are not corpora, but (I think) they are corpus-related. The list is incomplete and just let me know if I omit any corpora. 1. The best ...

  • [转载]语言学参考书籍
  • 语言学.语用学.翻译.跨文化交际.二语习得.测试.教学法等方向的参考书籍 社会心理语言学 上海外教 王德春 2000 对比语言学概论 上海外教 许余龙 2000 语义学 上海外教 李瑞华 2000 语义理论与语言教学 上海外教 王 寅 2001 国俗语义研究 上海外教 吴友富 1999 当代西方语法 ...

  • [单向度的人]的单向度思考
  • 科技信息人文社科 <单向度昀人>昀霞向度思考 哈尔滨工程大学人文学院邓亮 [摘要]马尔库塞在'单向度的人'中对发达资本主义社会中的人.思想.政治及社会本身进行了深刻的批判,并将这一切归结于技术进步带来的科技理性和实证主义的盛行I虽然马尔库塞也看到了技术进步对社会带来的好处,但是他对技术理 ...

  • 新目标七年级英语上册Unit5重点词汇讲解
  • 1. be made of&be made from be made of和be made from都表示"由--制成",但二者用法有所区别. ◆当原材料制成成品后,仍保持原有性质时,常用be made of.如: Sara's schoolbag is made of ...

  • 国内英汉双语平行语料库建构与研究现状及展望_黄立波
  • 第1期 2013年1月 当代外语研究 No.1 Jan.2013·45· 主持人语: ().印象式"imressionistic 传统翻译研究因其"p "()随感式"的研究方式而被认为有失严essaisticy谨.二战后,语言学派翻译研究横空出世,从语音到语篇 ...

  • 国内学科专业语料库研究现状及发展趋势
  • 2013年3月西安外国语大学学报 Mar.2013国内学科专业语料库研究现状及发展趋势 崔维霞,王均松 (西安外国语大学高职部陕西西安710061:西北工业大学人文与经法学院陕西西安710129) 摘 要:学科专业语料库是依据某一学科或专业而建立的独具特色的专门用途语料库,其在专业词表制定.专科词典 ...