基于语音识别的农产品价格信息采集方法-期刊-万方数据知识服务平台

搜索

DOI: 10.3864/j.issn.0578-1752.2015.03.05

基于语音识别的农产品价格信息采集方法

1.中国农业科学院农业信息研究所/农业部农业信息服务技术重点实验室，北京100081; 青岛农业大学动漫与传媒学院，山东青岛2661092.中国农业科学院农业信息研究所/农业部农业信息服务技术重点实验室,北京,100081

引用

打印

摘要：【目的】将语音识别技术应用到农产品价格信息采集中，面向非特定人和限定词汇量的汉语普通话连续语音识别，提出一种适合于农产品价格采集环境的语音识别鲁棒性方法；以隐马尔科夫模型为基础，训练出适合该环境下的声学模型，以缓解因测试环境和训练环境不匹配而导致的识别率降低，进一步提高识别率。【方法】在数据采集和处理阶段，首先根据要识别的限定词汇按照一定的语法规则构建转换文法，利用该文法生成的脚本指导训练集和测试集录音；然后选择不同的农产品价格采集环境和不同的说话人进行语音采集，并进行准确的人工切分，最后构建出语音语料库；在模型训练阶段，选择自左向右无跳转结构的连续混合密度隐马尔科夫模型，对训练集中的数据提取39维的MFCC特征向量，用于模型训练。首先以单音素为建模单元，并分别训练基于隐马尔科夫模型的男声模型、女声模型及男女混合声学模型；然后，考虑到单音素稳定性差和易受协同发音现象影响等因素，以上下文相关的三音素为识别单元建模，重新训练上述模型；针对三音子建模单元带来的模型数量大量增加，进而造成的训练样本不足问题，采用决策树状态聚类方法来...

关键词：

语音识别农产品价格信息采集倒谱均值方差归一化(CMVN)决策树聚类

机标分类号：

TP274.2(自动化技术及设备)TP391(计算技术、计算机技术)P208(一般性问题)

资助基金：

国家自然科学基金 ( 61271364 )

在线出版日期：

2015-03-25 （万方平台首次上网日期，不代表论文的发表时间）

页数：

11 (449-459)

英文信息

同项目论文