新闻资讯News
        在翻译实践中,我们经常会因为某个术语的翻译而犯愁,很多词汇和表达在字典中都是查不到的,这个时候我们就要学会运用术语库来解决翻译中的术语问题了。下面小编给大家盘点了国内外多个比较权威的术语库、语库语料库,大家可以自行选用。大家发现其他术语库、语料库,欢迎评论留言补充。

 


中国特色话语对外翻译标准化术语库

http://210.72.20.108/index/index.jsp

        中国特色话语对外翻译标准化术语库是中国外文局、中国翻译研究院主持建设的首个国家级多语种权威专业术语库。目前,平台发布了中国最新政治话语、马克思主义中国化成果、改革开放以来党政文献、敦煌文化等多语种专业术语库的5万余条专业术语,并已陆续开展少数民族文化、佛教文化、中医、非物质文化遗产等领域的术语编译工作。研究过CATTI和MTI真题的小伙伴对中国特色词汇一定不陌生,命运共同体、互利互惠、科学发展观、简政放权、供给侧改革,这些词汇都是这两个考试中经常出现的明星词汇。

 


中国关键词

http://www.china.org.cn/chinese/china_key_words/

        “中国关键词”项目是多语种、多媒体方式向国际社会解释、阐释当代中国发展理念、发展道路、内外政策、思想文化核心话语的窗口和平台,是构建融通中外的政治话语体系的有益举措和创新性实践。项目组建了由中央相关部门专家组成的中文编写和多语种外文翻译的专家委员会,邀请了外籍专家参与译文的审稿工作。

 


中国核心词汇

https://www.cnkeywords.net/

        “中国核心语汇”涵盖政治、经济、科技、文化等12个热门分类,17种语言,100万词条,由中国出版集团公司、中国翻译研究中心汇聚了全球资深翻译家与汉学家的权威智慧,利用最先进的大数据技术与语义分析搜索技术,更加系统的展现出中国关键语汇形成的时间脉络与语境全貌。

 


术语在线

http://www.termonline.cn/

        术语在线是全国科学技术名词审定委员会着力打造的术语知识公共服务平台,于2016年5月正式上线提供服务。术语在线以建立规范术语的“数据中心”“应用中心”和“服务中心”为目标,为推广普及规范术语,支撑科技发展和文化传承,推进我国学术话语体系建设注入了新动能。术语在线涵盖了全国科学技术名词审定委员会历年来公布的规范名词、发布的科技新词、出版的海峡两岸对照名词和工具书等全部审定成果,又融入了中央编译局、中国外文局、国务院新闻办、外语中文译写规范部际联席会议等机构发布的规范成果。总数据量近百万条,术语在线已成为全球中文术语资源最全、数据质量最高、功能系统性最强的一站式知识服务平台。

 


中华思想文化术语库

http://shuyuku.chinesethought.cn/

        包含中华思想文化术语库、中医文化关键词库、术语当代应用库、典籍译本库。中华思想文化术语库主要收录“中华思想文化术语传播工程”近几年的最重要成果--中华思想文化术语,目前已收录900条。这些词条包含中文释义、外文释义、中文引例、中文引例释义和外文引例释义等字段,全部词条都提供中文和英文两个语言版本,并提供对应的专业录音,部分词条还提供西班牙语、尼泊尔语、马来语、波兰语、阿尔巴尼亚语、马其顿语、罗马尼亚语、白俄罗斯语、塞尔维亚语和保加利亚语十个语种,未来还会不断更新。

 


BCC汉语语料库

http://bcc.blcu.edu.cn/

        BCC汉语语料库,总字数约 150 亿字,包括:报刊(20 亿)、文学(30 亿)、微博(30 亿)、科技(30 亿)、综合(10 亿)和古汉语(20 亿)等多领域语料,是可以全面反映当今社会语言生活的大规模语料库。

 


国家语委现代汉语通用平衡语料库

http://corpus.zhonghuayuwen.org/

        由国家语言文字工作委员会主持,面向语言文字信息处理、语言文字规范和标准的制定、语言文字的学术研究、语文教育以及语言文字的社会应用,总体规模达1 亿字,语料时间跨度为1919-2002年,收录了人文与社会科学、自然科学及综合三个大类约40个小类的语料。其中标注语料库为国家语委现代汉语通用平衡语料库全库的子集,该子集是按照预先设计的选材原则进行平衡抽样,对语料进行分词和词类标注,并经过三次人工校对,最后得到约5000万字符的标注语料库。

 


北外语料库语言学

http://corpus.bfsu.edu.cn

        北外语料库团队成员陆续开发了数十款索引分析工具、语料库标注工具和其他语料库专用工具,并通过网络与国内外同行共享。

BFSU CQPweb corpus portal(北外CQPweb语料库开放平台)

http://114.251.154.212/cqp/(用户名和密码都为test)

 


泛华语地区汉语共时语料库

http://www.livac.org/

        搜索和处理了超常的大量汉语具代表性报章语料,并通过精密的技术,累积了泛华语地区众多精确的统计数据。

 


中国规范术语

http://shuyu.cnki.net/

        本数据库是中国知网和全国科学技术名词审定委员会的合作项目,根据名词委历年审定公布并出版的数据制作,供读者免费查询。本库旨在帮助专业工作者规范、正确使用本领域的专业术语,提高专业水平。

 


SCIdict 学术词典

http://www.scidict.org/

        SCIdict词典可谓是全能王,金融、生物医药、机械、信息技术等专业的术语应有尽有,中英词条均可查询。网站提供词条来源和双语翻译,用起来很方便。唯一的缺点是,网页排版稍差,看多了可能会老花眼。

 


地质类术语词典

http://www.china-shj.org.cn/books

        很专业的地质类术语词典,内容多来自官方地质机构,术语翻译的权威性毋庸置疑。

 


元照英美法詞典 (法律字典)

http://lawyer.get.com.tw/Dic/

        《元照英美法词典》是法律翻译必不可少的专业权威词典,在翻译法律文件过程中除了查阅实体词典外,还可以访问元照網路書店,查询其在线知识库。该知识库囊括了几本最为重要的法律词典,包括《元照英美法词典》和《英汉法律用语大词典》。

 


生物医药大词典

http://dict.bioon.com/

        生物医药大词典,提供生物医药领域专业人员的写作、阅读和翻译的方便,最终实现自我编辑,自我完善的公共词典。生物医药大词典追求界面简单,解释意思一目了然。用户可以进行简体中文、英文、繁体中文、缩略语任意组合模糊查询。智能提醒与错误提示能够帮助大家迅速找到自己所需要的单词或词组。划词搜索更为方便快捷。

 


BiCovid

http://bicovid.org/

        BiCovid是一个单纯的新冠肺炎疫情双语文本检索和分享工具,目的是帮助国内外正在做相关内容翻译的志愿者、译者、译员查询双语数据。

 


清华TH语料库

http://www.openslr.org/

        清华TH语料库于1994年6月建成,其总库根据对语料加工深度的不同采用分级管理的原则,分成了生语料和熟语料两大类,其中0级生语料分库涵盖了一般书、报纸、论文、杂志、工具书等五类子库语料素材。经过近年来不断的升级和更新,已更名为THCHS-30语料库。

 


清华大学中英平行语料库

http://thumt.thunlp.org

        清华大学中英平行语料库,由清华大学自然语言处理与社会人文计算实验室在国家“863 计划” 项目“ 互联网语言翻译系统研制” 的支持下,利用自身研发的互联网平行网页获取软件和双语句子自动对齐软件获取并处理得到的,共包含285万中英平行句对。

 


北京大学CCL语料库

http://ccl.pku.edu.cn:8080/ccl_corpus/index/jsp?=xiandai

        CCL语料库中包含现代汉语语料、古代汉语语料两类单语语料,涉及的文献时间从公元前11 世纪到当代。其中现代汉语语料约6 亿字符,涵盖了文学、戏剧、报刊、翻译作品、网络语料、应用文、电视电影、学术文献、史传、相声小品、口语等多个类型。CCL语料库中古代汉语语料约2亿字符,收录了从周代到民国的语料及大藏经、二十五史、历代笔记、十三经注疏、全唐诗、诸子百家、全元曲、全宋词、道藏、辞书、蒙学读物等的杂类语料。除了两大单语语料库的扩容外,近年来CCL语料库还融入了一些专题语料库,例如:早期北京话材料、留学生汉语作文语料、汉语构式语料库、中文学术文献语料库、海外华文网络语料等等。

 


中国传媒大学有声媒体文本语料库

http://ling.cuc.edu.cn/RawPub/

        中国传媒大学有声媒体文本语料库是一个开放、免费使用的语料库,由中国传媒大学国家语言资源监测与研究有声媒体中心开发。

 


哈工大信息检索研究室对外共享语料库资源

http://ir.hit.edu.cn/demo/ltp/Sharing_Plan.htm

 


人民日报标注语料库

http://corpus.njau.edu.cn

        该语料库是我国第一个大型的现代汉语标注语料库,以《人民日报》1998年的纯文本语料为基础,完成词语切分、词性标注、专有名词标注、语素子类标注、动词和形容词特殊用法标注、短语型标注等加工工作,现已扩充至3500万字的规模。后来北京大学计算语言学研究所在此基础上完成了另外100万字语料的词语切分、词性标注和汉语拼音标注的加工任务,还利用所研制的《现代汉语语义词典》、参照《现代汉语词典》,根据语料实际使用情况对词义描写进行调整,研发了一个大规模、高质量的现代汉语词义标注语料库。为了弥补北京大学人民日报语料库用于处理当前文本时的不足,2019年开始南京农业大学人文与社会计算研究中心以2015年至2018年《人民日报》发表的文章为对象,构建了新时代人民日报语料库,目前该语料库涵盖了《人民日报》2015 年1-5 月、2016年1月、2017年1月、2018 年1月共9个月的分词语料,并且后续将不断补充最新语料 。

 


香港法律中英术语

https://www.elegislation.gov.hk/

 


台湾教育研究院术语库

http://terms.naer.edu.tw/download/

 


区块链术语库

https://www.chainnode.com/post/17286

 


明代职官中英辞典

http://escholarship.org/uc/item/2bz3v185

 


电子工程术语表

https://www.maximintegrated.com/cn/glossary/definitions.mvp/terms/all

 


医学英语在线翻译词典

http://www.letpub.com.cn/index.php?page=med_english

        LetPub 是ACCDON(美国)旗下为非英语国家科研学者提供优质SCI论文编辑和各类相关服务的专业品牌。LetPub推出的在线翻译词典汇集了最全面的专业医学英语词汇翻译,SCI论文对照,包括中医常用医学名词、传染病学名词、儿科医学名词、内科学专业名词等。

 


BASE——英国学术口语语料库(British Academic Spoken English Corpus)

http://www2.warwick.ac.uk/fac/soc/celte/research/base/

 


联合国术语库

https://unterm.un.org/unterm/portal/welcome

        联合国多语言术语库(UNTERM)是联合国内部官方多语种术语库,收集的词汇主要源于联合国大会、安全理事会、经济及社会理事会、托管理事会等主要机构日常文件。因此它收集的术语主要和各种全球性议题相关,比如气候变化、民主、难民、反恐、可持续发展目标、非殖民化等主题。该术语库最大亮点是内容独一性和权威性,提供联合国6种工作语言(英、法、俄、汉、阿、西)的术语对应查询服务。用户不仅能查看某个词汇的词义,还能看到这个术语在联合国内部不同机构出现的频率、在不同主题内容中出现的频率等等。想在外交、公共政策、国际关系等这些领域工作的朋友,这个术语库一定会很用帮助。此外备考CATTI考试的同学也可以经常去看看,因为全球性议题的文章经常出现在CATTI考试里。

 


国际标准化组织在线浏览平台

https://www.iso.org/standards.html

        国际标准化组织在线浏览平台(Online Browsing Platform: OBP)提供ISO标准、图形标志、规范、术语和定义等。术语和定义搜索界面提供多种搜索方式,可分别进行词汇、项目和空格敏感的搜索。内容搜索包括精确和模糊搜索、定义搜索、标准索引和全入口搜索。可使用英语、法语、俄语、西班牙语和德语进行搜索。

 


世界在线电工词汇

https://www.electropedia.org/

        世界在线电工词汇是世界上关于“电子技术”的最全面的在线术语数据库,包含按主题领域组织的22,000多个英语和法语术语条目,以及其他各种语言的等效术语:包括阿拉伯语、汉语、捷克语、芬兰语、德语、意大利语、日语、韩语、挪威语(博克马尔和尼诺斯克)、波兰语、葡萄牙语、俄语、塞尔维亚语、斯洛文尼亚语、西班牙语和瑞典语(覆盖率因学科领域而异)。

 


世界知识产权组织数据库

https://www.wipo.int/patentscope/zh/

        世界知识产权组织(World Intellectual Property Organization:WIPO)开发的多语种术语库WIPO PEARL,由世界知识产权组织旗下的语言专家和术语学家开发,包含阿拉伯语、汉语、英语、法语、德语、日语、韩语、葡萄牙语、俄语和西班牙语等十种语言术语。

 


BNC——英国国家语料库

http://www.natcorp.ox.ac.uk/

 


BOE——柯林斯英语语料库

http://www.collinslanguage.com/language-resources/dictionary-datasets/

 


ANC——美国国家语料库

http://www.anc.org/

 


SKETCH ENGINE多语言语料库

https://www.sketchengine.eu/corpora-and-languages/corpus-list/

 


加拿大政府术语数据库

https://www.btb.termiumplus.gc.ca/

        加拿大政府术语库(The Government of Canada’s terminology and linguistic data bank:TERMIUM Plus)是世界上最大的术语和语言数据库之一,使您可以访问数以百万计的英语、法语、西班牙语和葡萄牙语术语。您可以在广泛的专业领域中(in a wide range of specialized fields)找到术语、缩写、定义和用法示例(terms, abbreviations, definitions and usage examples)。数据库是理解首字母缩写词(acronym)、检查正式标题(checking an official title)、查找另一种语言对等词(an equivalent)以及其他功能的必备工具。

 


多向应用主题术语数据库(FAST)

http://fast.oclc.org/

        多向应用主题术语数据库(Faceted Application of Subject Terminology: FAST)源自美国国会图书馆标题表(Library of Congress Subject Headings:LCSH),是在图书馆领域使用最广泛的主题术语架构(subject terminology schemas)之一。数据库的开发是联机计算机图书馆中心(Online Computer Library Center: OCLC)和美国国会图书馆合作的结果。多向应用主题术语数据库的研发始于1998年底。

 


法国文化部术语库(France Terme)

https://www.culture.gouv.fr/

        该网站专门介绍法国法语促进委员会《法兰西共和国官方杂志》上发布的用于丰富法语使用的术语,8,000多个法语术语代表了新的现实和科学技术创新。网页还展示了最新发布的部分术语和精选热词。数据库汇集了来自不同科学和技术领域的各组术语,其中有些术语已得到普遍使用,但仍无法进入通用语言词典中,委员会不得不使用发布官方公报的方式进行术语传播。如果想了解在科学技术中出现的新概念如何通过术语对法语的使用产生影响,可以关注这些信息。

 


Bistro在线德-意-拉丁语法律术语库

http://bistro.eurac.edu/

        Bistro是由意大利博尔扎诺(Bolzano, Italy)Eurac Research应用语言学研究所的研究人员创建的法律术语信息系统。它于2001年首次开发,是法律领域交流、写作和翻译的支持工具(a support tool )。Eurac Research机构成立于1992年,是根据私法(private law)成立的协会。该术语库中意大利语和德语现在已经上线,提供了当前新型冠状病毒肺炎爆发后出现的术语。现可以访问词汇表,其中包含有关公共卫生(public health)和一般突发卫生事件(health emergencies in general)的法规( legislation)中最相关的术语(最新更新到2020年4月27日)。与新型冠状病毒肺炎相关的这些和其他术语均可在Bistro中找到,其名称(designations),定义(definitions),语境(contexts)和注释(comments)随时更新。

 


术语维基(TermWiki)在线平台

https://cn.termwiki.com/

        TermWiki是一家旨在实现知识共享和将全球志趣相投的人们紧密联系的小组式学习网站,能够以多种语言提供术语和类似百科全书的短语,帮助用户学习外语,拓展用户知识。其中包含110多万条术语,涵盖75种语言和1200个主题。

 


Gaois术语数据库

https://www.gaois.ie/

        Gaois是爱尔兰都柏林城市大学(Dublin City University: DCU)人文与社会科学学院(Faculty of Humanities and Social Sciences)爱尔兰校企联合部(Fiontar&Scoil na Gaeilge:Enterprise & School of Irish)的一个研究小组,成员包括讲师、研究人员和研究生。其目标是通过开发创新和值得信赖的资源(development of innovative and trusted resources)来继承发展(sustain and transform)爱尔兰的语言和文化。

 


世界卫生组织术语库

http://www.who.int/substance_abuse/terminology/zh/

 


Grand Dictionnaire Terminologique

http://www.granddictionnaire.com/

 


谷歌机器学习词汇表

https://developers.google.com/machine-learning/glossary/?utm_source=google-ai&utm_medium=card-image&utm_campaign=training-hub&utm_content=ml-glossary

        Google相比国内的搜索引擎来说在世界上都是非常有名的 ,其团队或在技术算法上都远超于国内, Google项目教育团体官方宣布称已经发布了一种多语种的Google机器学习词汇表,它列出了机器学习的一般术语和术语“TensorFlow”的定义。语言版本包括西班牙语、法语、韩语和简体中文。

友情提示:查看该术语列表,需要科学上网。

 


微软术语库

https://www.microsoft.com/zh-cn/language

 


Linguee

https://cn.linguee.com/

        Linguee 是一个在线多语言互译平台,目前提供英语与德、法、西、中、俄、日、葡、意、荷等 24 种语言的对应查询服务,收录了数亿条译文例句搜索。Linguee将查询字典与搜索引擎合二为一,提供更广的搜索空间。搜索结果包含高达一亿多条双语互译的例句。Linguee提供的现成翻译资料数据不仅庞大而且完整。是目前所有的在线词典的上千倍。所有例句都是完整的句子或者段落。因此,用户可以快捷方便地查询所有搜索词条,包含成语或者俗语的完整意思乃至译文例句,甚至包括专业用语词汇的含义及翻译难点。

 


Schlumberger Oilfield Glossary: The Oilfield Glossary

https://www.glossary.oilfield.slb.com/

        相当不错的石油专业词典,词条解释言简意赅,缺点是只有英文解释。可用来查证石油相关术语。

 


欧盟互动术语数据库

https://termcoord.eu/

 


北约官方术语数据库

https://nso.nato.int/nso/

        包含未分类的军事术语以及与北约有关的非军事术语。数据库采用北约两种官方语言(英语和法语),由北约标准化办公室(NATO Standardization Office)下辖的北约术语办公室(NATO Terminology Office)负责维护。数据库会定期更新(updated on a regular basis),并发布新审定术语(promulgate newly approved terminology)。除此之外,数据库还保留了由于历史原因遗留下来的北约专有词库术语(legacy terminology from specialist NATO glossaries)。

 


电子翻译术语库

https://www.eurotermbank.com/

        EuroTermBank是欧盟和冰岛语系中最大的集中式在线术语库(a largest centralized online terminology bank for Languages of the European Union and Icelandic),可与其他术语库和资源库相互关联。通过建立合作关系、统一方法和标准(aligning methodologies and standards)、设计和实施数据交换机制和程序、EuroTermBank可与现有的国家和欧盟术语数据库进行术语数据交换。

 


TAUS 数据联盟

http://www.tausdata.org/

 


欧洲共同体委员会(IATE)术语库

http://iate.europa.eu/

 


欧盟术语银行

http://www.eurotermbank.com/

 


兰开斯特汉语语料库LCMC

https://www.lancaster.ac.uk/fass/projects/corpus/LCMC

        该语料库是由旅英学者肖忠华博士创建的现代汉语平衡语料库,对公众免费开放。它是与 Freiburg-LOB Corpus of British English(即FLOB)平行对应的汉语语料库,从新闻报道、社会、新闻评论、宗教、技术商贸、通俗社会生活、传记杂文、报告公文、学术、小说等文本中,选取了500篇2000词左右的样本(1989-1993年),有助于从事汉语的单语和英汉双语的对比研究。

 


利兹汉语语料库LCMC

http://corpus.leeds.ac.uk/query-zh.html

        该语料库由利兹大学Serge Sharoff博士开发,包括网络汉语语料库、商务汉语语料库等。

 


谢菲尔德汉语语料SCC

http://www.shef.ac.uk/scc

        该语料库由谢菲尔德大学东亚研究学院和数字人文研究所联合开发。以宋朝(960-1279)、明朝(1366-1644)和清朝(1644-1911)的三部中文文献为基础。这些文本共计约18,000个单词,使用在XML(可扩展标记语言)中开发的标记方案对词类进行标记和切分。为了让语料应用更加广泛,并促进英汉翻译比较研究,该语料库增加了英汉平行语料。

 


SketchEngine多语言语料库

http://www.sketchengine.co.uk

        严格来讲,SketchEngine并不是一个语料库,而是用来构建语料库的工具。其本身已经包含500个90多种语言的现成语料库,每个语料库的大小都高达500亿字。同时,使用者可以根据自己的需求,使用内置的网页语料库构建工具构建专用语料库。每个邮箱可以注册一次,免费试用一个月。

 

 

来源:同文译馆