摘要:
陪护机器人作为机器人家族不可或缺的一员,具备较高的智能化程度,可广泛应用于家庭、医院、酒店、养老院等场景,近年来在国内外得到迅猛发展。本校企合作项目包括了一系列陪伴、护理相关的机器人,采用模块化设计可满足不同的市场需求。此外,面向老年人的陪护机器人主要是为了提高老年人生活品质,缓解社会压力。因此,基于智能语音交互的陪护机器人系统设计需确保机器人具备一定的趣味性和安全可靠性。本课题从老人陪护需求出发,设计并集成了基于语音识别的智能助老陪护机器人系统,针对提高语音纯净度,改善系统识别性能这一目标,着重深入研究语音识别中信号增强、特征提取、声学模型构建等关键技术,详细研究内容包含如下几个方面:(1)根据实际项目需求和项目背景,设计机器人的整体系统方案,分析基于语音识别的陪护机器人系统结构,从硬件系统设计、底盘设计、样机整体造型设计以及智能语音交互技术等方面对整体系统作出详细的方案设计与结构分析,构建了基于语音识别的智能陪护机器人系统框架。(2)针对老年人气息较弱,话语能量跟环境噪声能量对比度较低的问题,探讨有关语音增强方面的问题,进行基于联合最大后验概率的语音增强技术研究。针对不同加性噪声,从传统谱减语音增强算法出发,改善算法固有缺陷,提出基于相位和频谱交替迭代的联合相位估计器,并引进多频带谱减法以消除"音乐噪声"的影响,取得良好的降噪效果。(3)为准确获取老年人语音特性,提高特征参数对语音信息的表现力,提取具有良好区分性和鲁棒性的语音特征参数,深入研究语音特征提取技术。以传统MFCC特征参数提取算法为研究主体,对其进行基于F比的加权优化,同时增加不同时域和频域特征参数进行寻优组合仿真对比实验,并对最佳组合进行降维处理,以提高计算效率,为模式识别提供前期研究基础。(4)在特征提取的基础上,为提高系统识别性能,基于Kaldi开源平台完成两种经典模型的系统性能对比实验,研究分别基于GMM-HMM模型和DNN-HMM模型的语音系统识别效果。其中,DNN-HMM模型采用神经网络代替高斯模型在HMM模型中计算状态输出概率,系统性能较优。(5)基于上位机集成开发环境进行人机界面设计,集成机器人智能交互系统与运动控制系统。对各个模块之间的通讯、机器人移动和避障、语音识别数据分析处理以及表情切换等功能进行测试,经多次调试最终达到预期设计要求。