10.11996/JG.j.2095-302X.2021020316
基于IFC标准的BIM自适应分词方法
建筑信息模型(BIM)已经成为建筑行业信息技术应用的有效方案.随着BIM数据不断增长,为了高效使用BIM数据,很多研究将自然语言处理(NLP)引入BIM应用中.在中文环境中,由于缺乏建筑行业的术语特征,导致基础环节的中文分词在建筑领域BIM应用中的适应性较差.通过分析当前流行的BIM数据格式工业基础类(industry foundation class,IFC)文件,从中提取BIM模型特征,配合建筑领域术语特征加入分词模型中,以提高中文分词在建筑领域的性能.实验结果表明,与原始条件随机场(CRF)分词模型相比,在建筑领域测试集上,分词模型的F-measure提高了1.26%,其中,在仅加入BIM模型特征时,F-measure提升了0.10%,说明在分词模型中加入BIM模型特征对于提高中文分词在建筑领域的性能是有效的.同时,在BIM模型测试集上,相较于仅加入建筑领域术语特征,在加入BIM模型特征后,准确率从46.97%提升至87.74%,召回率从67.60%提升至94.77%,F-measure从55.43%提升至91.12%,提升了35.69%,有效提高了中文分词在建筑领域的BIM模型自适应性.
建筑信息模型、工业基础类、中文分词、模型自适应、建筑信息提取
42
TP391(计算技术、计算机技术)
国家自然科学基金项目;北京市自然科学基金项目;北京市青年拔尖人才培育项目;北京建筑大学青年英才项目;北京建筑大学市属高校基本科研业务费专项资金
2021-05-19(万方平台首次上网日期,不代表论文的发表时间)
共9页
316-324