1、中文系教授正准备建一个中文语料库。
2、实验表明,在无需词典和语料库的前提下,该算法能够快速准确地抽取文档中的中、高频词。
3、本文所选取的语料库涵盖了从第一届美国总统华盛顿至现任总统奥巴马的就职演说,历时220多年,共56篇演说稿。
4、利用日汉平行语料库自动获取汉语译词无论是在词典编撰,还是在自然语言处理领域都有着广泛的应用。
5、其次,对体育语域语料库中的体育赛事语料进行词频统计,编制体育赛事基本词表,从中提取体育赛事基本词汇2217个。
6、平行语料库、术语库、翻译记忆库等都是语言资产的管理的内容,互联网上并不缺乏这样的数据,但这些数据通常零散分布而无法得到有效的利用。
7、这部词典编纂参考了美国mRm语料库,香港的Livac词库,《现汉》、《汉语大辞典》,百科条目按照一些专科类词典如中医、传播、冶金、机械类等收录了一些。
8、开发书面语语料库的项目由新加坡华文教研中心研究组组长吴福焕(左)领导,副研究员黄雪霞博士(中)和赵春生是这个小组的另外两名成员。
9、工程分2期进行,计划用20年建成中国首个2亿词级的蒙古语、达斡尔语、鄂温克语、鄂伦春语大型综合性语料库。
10、国家语委语料库里有三例“考察干部”而无“考查干部”。