10.3969/j.issn.1674-8425.2011.08.012
基于类型论的汉语分词系统TTCS
针对汉语分词中的未登录词识别和歧义消除这两个瓶颈问题和目前方法的不足,将类型论的思想引入到汉语分词领域中,提出了类型匹配模型,以类型论函数贴合为主要算法,融合了全切分、统计,前后缀识别信息等多种技术手段,将分词、未登录词识别、歧义消除,词典的动态扩充有机的融合到一个统一的理论模型当中.在此理论框架的基础上,最后实现了基于类型论的汉语分词系统TTCS.
类型匹配、汉语分词、歧义消除、未登录词、类型论
25
B81(逻辑学(论理学))
国家社科基金“面向自然语言信息处理的范畴类型逻辑研究”09BZX046
2012-02-21(万方平台首次上网日期,不代表论文的发表时间)
共6页
61-66