声纹识别是一种生物识别技术,与人脸识别相比,它显得低调但同样具有黑科技的魅力。声纹是用电声学仪器显示的携带言语信息的声波频谱,由波长、频率以及强度等百余种特征维度组成,具有稳定性、可测量性、唯一性等特点。 声纹识别的原理是通过比对两段语音的说话人在相同音素上的发声来判断是否为同一个人。影响声纹识别水平的因素包括训练数据和算法、声源采样率、信噪比(SNR)、信道和语音时长等。 声纹识别的应用流程主要分为注册和验证两个步骤,具体应用场景包括公安领域、金融、社保和智能硬件等。例如,在公安领域,声纹识别可以用于重点人员监管、反电信诈骗、反恐、刑事案件侦破和身份查询与核验等;在金融领域,声纹识别可以提高金融机构的风险防范系统安全性,强化风控能力,增加用户的安全性,防范身份欺诈;在社保领域,声纹识别可以方便地进行远程身份验证,为国家节省大量成本;在智能硬件领域,声纹识别可以实现“听声识人”,让系统针对性地为每个人提供不同的内容与服务。
同属于生物识别技术,与火爆的人脸识别相比,声纹识别表现得很低调,然而这并不影响这一黑科技魅力的散发,本文将带你认识一下声音黑科技-声纹识别,让你了解真正的“闻声识人”。
本文将从如下方面为你一一解读:
声纹(Voiceprint),是用电声学仪器显示的携带言语信息的声波频谱,是由波长、频率以及强度等百余种特征维度组成的生物特征,具有稳定性、可测量性、唯一性等特点。
声纹不如图像那样直观展现,在实际分析中,可通过波形图和语谱图进行展现,如下所示:

人在讲话时使用的发声器官在尺寸和形态方面每个人的差异很大,所以任何两个人的声纹图谱都有差异,主要体现在如下方面:
不同人的声音在语谱图中共振峰的分布情况不同,声纹识别正是通过比对两段语音的说话人在相同音素上的发声来判断是否为同一个人,从而实现“闻声识人”的功能。

声纹识别在算法层面可通过如下基本的技术指标来判断其性能,除此之外还有其它的一些指标,如:信道鲁棒性、时变鲁棒性、假冒攻击鲁棒性、群体普适性等指标,这部分后续于详细展开讲解。

训练数据和算法是影响声纹识别水平的两个重要因素,在应用落地过程中,还会受很多因素的影响。
声纹识别(VPR) ,生物识别技术的一种,也称为说话人识别 ,是从说话人发出的语音信号中提取声纹信息,从应用上看,可分为:
声纹识别在应用中分注册和验证两个主流程,根据不同的应用中,部分处理流程会存在差异,一般的声纹识别应用流程如下图所示:

声纹识别作为生物识别技术的一种,有非常多好的应用场景,根据声音的特性,下面从公共安全、金融、社保、智能硬件四个领域介绍声纹识别的应用。
声纹作为一种生物特征,最早在刑侦和鉴识领域成功应用。
近年来,由于互联网的发展,语音案件也呈现出井喷的趋势,在这些语音案件中,声纹识别成了唯一一种有效的技术侦破手段,通过的声纹识别和声纹大数据技术进行重点人员监管、反电信诈骗、反恐、刑事案件侦破、身份查询与核验,助力公安有效遏制与打击犯罪,构建和强化安全的社会公众环境。
针对银行、互联网金融等各类金融及服务机构,通过声纹识别技术,提供了用户注册、远程验证、金融生物识别解决方案,大幅提高金融机构的风险防范系统安全性,强化风控能力,增加用户的安全性,防范身份欺诈。
另外在电话客服系统中,通过声纹识别技术,可实时识别出用户的身份,从而提供个性化的客户服务。
我国针对离退休人员,每年至少需要进行一次生存状态验证,并以此为依据进行养老金的发放,目前可通过到指定社保大厅或自助终端进行生存验证,对于一些行动不便的老人家,这种方式也是非常不便利。声纹识别技术在远程身份验证中有着天然的优势,只需要一个电话(手机或固话都可以),即可完成生存验证,为参保人员提供了便利,同时也为国家节省大量成本,避免养老金流失。
在智能硬件产品中,声纹识别解决了当前智能产品只能识别用户所说的内容,而不能区分说话人身份的问题,让智能产品能够区分不同的角色,实现“听声识人”。
让系统针对性对每个人提供不同的内容与服务,让人机交互更加简单,让用户享受更轻松、更具个性化、更安全的产品体验。
声纹识别作为最前沿的生物识别技术,随着技术的成熟,将会在越来越多的应用场景下落地,我们相信在不久的将来,在第三代身份证上,声纹将成为继指纹、人像后又一个新增的公民身份ID。声音将在我们未来的科技生活中扮演眼越来越重要的角色。
声纹识别作为最前沿的生物识别技术,随着技术的成熟,将会在越来越多的应用场景下落地,我们相信在不久的将来,在第三代身份证上,声纹将成为继指纹、人像后又一个新增的公民身份ID。声音将在我们未来的科技生活中扮演眼越来越重要的角色。

小路