10.3969/j.issn.1000-7024.2007.09.052
基于DOM的评论发现及抽取模型研究
Internet发展至今,除了静态的网页文本,目前出现较多的是基于动态文本的BBS评论、电子商务评论等.如何自动挖掘这些评论信息,变得日益重要.提出了一种新颖的评论算法进行评论信息的发现与抽取.采用了DOM技术对页面进行分块,同时结合信息熵的迭代计算技术实现了评论块的自动发现与抽取.
评论抽取、文档对象模型、信息熵、页面分块、迭代计算
28
TP311.13(计算技术、计算机技术)
国家自然科学基金50376029
2007-06-18(万方平台首次上网日期,不代表论文的发表时间)
共4页
2150-2153