10.3969/j.issn.1003-3513.2006.01.014
超大规模分类语料库构建
针对文本分类中训练(测试)集获得较难、分类系统不合理的问题,我们构建了一个超大规模层级网页分类语料库.该语料库字段信息丰富,分类系统科学,存储格式可扩展性强、语义结构化.适合构建文本分类、话题识别和信息检索的大型训练(测试)集.
内容解析、字段信息、分类体系、XML
G25(图书馆学、图书馆事业)
2007-05-21(万方平台首次上网日期,不代表论文的发表时间)
共4页
71-73,70
点击收藏,不怕下次找不到~
10.3969/j.issn.1003-3513.2006.01.014
内容解析、字段信息、分类体系、XML
G25(图书馆学、图书馆事业)
2007-05-21(万方平台首次上网日期,不代表论文的发表时间)
共4页
71-73,70
国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”
国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304
©天津万方数据有限公司 津ICP备20003920号-1
违法和不良信息举报电话:4000115888 举报邮箱:problem@wanfangdata.com.cn