语音情感识别方法、计算机可读存储介质、终端

摘要:一种语音情感识别方法及装置、计算机可读存储介质、终端,所述方法包括:获取待处理的语音信号;对所获取的语音信号进行预处理,得到预处理后的语音信号;提取预处理后的语音信号的特征参数;所述特征参数包括短时能量及其衍生参数、基音频率及其衍生参数、音质特征共振峰及其衍生参数、对MFCC求取的20阶的Mel倒谱系数和MFCC的一阶差分的最大值、MFCC的一阶差分最小值、MFCC的一阶差分的均值和MFCC的一阶差分的方差;采用所提取的特征参数组成对应的特征矢量序列,得到所述语音信号对应的特征矢量序列;采用支持向量机对所述语音信号对应的特征矢量序列进行训练和识别,得到对应的语音情感识别结果。上述的方案,可以提高语音情感识别的准确率。

专利类型:
发明专利
申请号:
CN201810455163.7
申请日期:
2018-05-11
公开/公告号:
CN108305639A
公开/公告日:
2018-07-20
主分类号:
G10L25/03(2013.01)I G G10 G10L G10L25
分类号:
[G10L25/03, G10L25/24, G10L25/63, G10L25/87]
申请/专利人:
南京邮电大学
发明/设计人:
邓立新 王思羽
主申请人地址:
210003 江苏省南京市新模范马路66号
专利代理机构:
南京苏科专利代理有限责任公司 32102
代理人:
姚姣阳
国别省市代码:
江苏;32
法律状态:
在审
主权项:

1.一种语音情感识别方法,其特征在于,包括:获取待处理的语音信号;对所获取的语音信号进行预处理,得到预处理后的语音信号;提取预处理后的语音信号的特征参数;所述特征参数包括短时能量及其衍生参数、基音频率及其衍生参数、音质特征共振峰及其衍生参数、对MFCC求取的20阶的Mel倒谱系数和MFCC的一阶差分的最大值、MFCC的一阶差分最小值、MFCC的一阶差分的均值和MFCC的一阶差分的方差;采用所提取的特征参数组成对应的特征矢量序列,得到所述语音信号对应的特征矢量序列;采用支持向量机对所述语音信号对应的特征矢量序列进行训练和识别,得到对应的语音情感识别结果。


0.151410s