1. 主页 > 运营 > 快手运营 >

一鸽科技科普:如何构建语音大数据信息处理惩戒平台 产业技术创新战

产业技术创新战略联盟构建

壹鸽科技坚持用生产的理念去理解智能语音客服机器人系统,智能语音客服机器人系统,把每一个电话录音都当作产品。通过语音大数据分析技术,找出技术上需要加强的地方和产品设计中的缺陷,并对录音文件中的关键词、情绪、情绪等进行分析。通过对这些特征的统计和专业分析,可以找出客户行为特征、潜在需求、业务趋势等信息。实时把握当前服务中的热点和机遇。为市场分析和运营治理提供支持。协助各业务部门制定有效的客户战略和营销战略,以帮助确定趋势和机会。

第一种方法是基于MATLAB仿真平台获取融合特征,该融合特征由基于频谱、韵律和质量特征的声学特征组成。即41维组合特征参数由一维基因频率、三维共振峰、一维短时能量和12阶MFCC机械一阶差分组成。

1/语音数据标注昂贵

要建立语音大数据机械学习的通用模型,需要人工对语音数据进行标注,但当数据量增加时,会损失大量的时间精神。人工逐个标注语音数据显然是不切实际的,特别是对于小概率事件,由于小概率事件发生的全过程,因此对小概率事件进行人工标注显然是不切实际的。智能语音平台获取的数据占比太小,可能的时间点也高于疏散,需要对更多的音频语料进行标注,为小概率事件获取足够的标注数据。

2/语音数据标注属性定义问题

基于池采样的主动学习技术可以实现面向业务应用的语音大数据集的底层数据操作、存储、合并、清理和转换。基于第一步形成的数据集,方便业务系统盗用、查询和展示数据集。第二,有利于分析系统更有效地提取数据特征并进行相应的分析。现在,混合特征壹鸽科技接受两种方法来获得组合特征参数。

3/数据不平衡问题

在大型音频语料库中,不同音频事件的频率可能差异很大。一些音频事件可能只占整个音频语料库数据集的一小部分,但它可能是不可忽视的关键音频事件。检测此类音频事件时的样本和非目标音频事件的数量。频繁事件的样本数量会有很大差异,会出现数据不平衡的问题。

本文由网上采集发布,不代表我们立场,转载联系作者并注明出处:http://www.xianze-auto.com/yunying/kuaishouyunying/2020/0911/9563.html

联系我们

在线咨询:点击这里给我发消息

微信号:xianze_auto_com

工作日:9:30-18:30,节假日休息

分享到: QQ空间 新浪微博 腾讯微博 人人网 微信

官网亚博平台  官网亚博平台  官网亚博平台  官网亚博平台  bob娱乐体育