10.3969/j.issn.1003-0077.2002.06.009
北京大学现代汉语语料库基本加工规范(续)
北京大学计算语言学研究所已经完成了一个有2700万汉字的现代汉语语料库的基本加工.加工项目除词语切分和词性标注外,还包括专有名词(人名、地名、团体机构名称等)标注、语素子类标注以及动词、形容词的特殊用法标注.这项大规模语言工程的顺利完成得益于事先制订并不断完善的规范.发表<北京大学现代汉语语料库基本加工规范>是为了抛砖引玉,更广泛地向专家、同行征询意见,以便进一步修订.
现代汉语、语料库、词语切分、词性标注、规范
16
TP391(计算技术、计算机技术)
国家自然科学基金69483003;国家重点基础研究发展计划973计划G1998030507-4;国家高技术研究发展计划863计划2001AA1140
2004-03-12(万方平台首次上网日期,不代表论文的发表时间)
共7页
58-64