成都索客科技有限公司 >> 时尚>>

智能音箱如何识别方言?

智能音箱如何识别方言? 本章共3888字, 更新于: 2024-12-16 05:22:19
  导读:尽管机器学习使语音识别技术的音箱发展突飞猛进,如今这些语音识别系统还是何识不够完美,最严重的别方问题就是有地域歧视性。

  自从IBM的音箱Shoebox和Worlds of Wonder的玩具娃娃Julie doll发布以来,语音识别技术一直在不断地发展。何识到2018年底,别方Google Assistant支持超过30种不同的音箱语言。

  高通也开发了一款可以识别单词和短语的何识语音识别系统,其准确率高达95%。别方此外,音箱微软的何识智能语音客服比人工呼叫服务更加准确高效。

  然而,别方尽管机器学习使语音识别技术的音箱发展突飞猛进,如今这些语音识别系统还是何识不够完美,最严重的别方问题就是有地域歧视性。

  华盛顿邮报最近进行的一项研究结果显示,谷歌和亚马逊研发的流行智能语音助手识别非美国本地口音的准确率要比美国本地口音低30%。

  像IBM和微软这样的公司都会通过Switchboard语料库来降低语音助手的出错率。但是事实证明,语料库也无法彻底解决语音助手的口音识别问题。

  “数据是混乱的,因为数据反映了人性,”埃森哲的全球责任AI监理Rumman Chowdhury说,“这就是算法最擅长之处:寻求人类行为模式。”

  算法偏差表示机器学习模型对数据或者设计产生偏见的程度。很多新闻报道都对面部识别系统(尤其是亚马逊网络服务的图像识别Rekognition)产生了不小的偏见。



  而且,算法偏差还会出现在其他方面,比如预测被告是否会在未来犯罪的自动化系统以及谷歌新闻等app背后的内容推荐算法。

  微软以及包括IBM、高通和Facebook在内的AI行业领导者已经开发出自动化工具,用于检测并减少AI算法中产生的偏差,但很少有人能够提出口音识别问题的具体解决方案。

  真正提出解决方案的只有两家公司。一个是Speechmatics,另一个便是Nuance。

  解决口音差距问题

  Speechmetrics是一家专门研究企业语音识别软件的剑桥科技公司,它于12年前就开始实施了一项雄心勃勃的计划,旨在开发比市场上任何产品更准确全面的语言识别系统。

  该公司最初是研究统计语言建模和循环神经网络。它开发了一种可以处理内存输出序列的机器学习模型。2014年,它利用一个十亿字节的语料库加速其统计语言建模的发展,从此迈出了第一步。

  到了2017年,它又迈向了另一个里程碑:与卡塔尔计算研究所(QCRI)合作开发了阿拉伯语言文字转换服务。

  “我们已经发现我们需要开发一款语音识别系统,只需一种模式便能适用于所有语言,不再有口音问题,并且它识别澳大利亚口音的准确度和转录苏格兰口音一样高。”Speechmatics首席执行官Benedikt vonThüngen说。

  他们在今年七月成功研发了一款这样的语音识别系统Global English。它拥有40多个国家的数千小时的语音数据和数百亿单词,支持所有英语口音的语音文本转换功能。

  此外,Global English的建立还离不开Speechmatic的Automatic Linguist,这是一种人工智能框架,通过利用已知语言中识别的模式来学习新语言的语言基础。

  “假设你一边要和美国人交谈,另一边还要和澳大利亚人交流,而且这个美国人曾经住在加拿大,所以有加拿大口音,这时大多数的语音识别系统都会很难识别这种带有不同口音的语言,但是我们的语音识别系统就完全不用担心这个问题。”Speechmatics公司产品副总裁Ian Firth在一次采访中说。

  在测试中,Global English在识别特定的口音方面表现的比谷歌的Cloud Speech API和IBM的Cloud还要出色。Thüngen表示,在高端领域中,它的准确率比其他产品还要高23%到55%。

  Speechmatics并不是唯一一家想要解决口音识别问题的公司。

  总部位于马萨诸塞州柏林顿的Nuance表示,它将采用多种方法,确保其语音识别系统能够识别将近80种语言,并且准确率都一样高。

  在其英国语言模型中,它收集了20个特定方言区域的语音和文本数据,包括每种方言独有的单词(比如使用单词“cob”特指面包卷)及其发音。因此,这款Nuance的语音识别系统便能识别出“Heathrow”的52种不同表达方式。

  如今,Nuance语音识别系统又有了新的发展。更新版本的Dragon是Nuance研发的定制语音文本转换软件组合,其机器学习模型可根据用户的口音在几种不同的方言中自动切换。

  与没有方言自动切换功能的旧版本相比,新版本的语音识别系统识别带有西班牙口音的英语的准确率要高22.5%,识别美国南部方言的准确率要高16.5%,识别东南亚英语的准确率要高17.4%。

  数据越多越好

  归根结底,语音识别的口音问题是由于数据不足产生的。语料库的质量越高,语言模型越多种多样,那么至少从理论上来说语音识别系统的准确率越高。

  在华盛顿邮报的研究中,Google Home智能语音助手识别美国南部语言的准确率要比识别美国西部语言的准确率低3%。而亚马逊的Echo识别美国中西部语言的准确率要低2%.

  亚马逊的一位发言人告诉华盛顿邮报,随着更多的用户用不同的口音说话,Alexa的语音识别能力会不断提高。并且,谷歌在一份声明中表示,他们将通过扩大自己的数据库,不断改进Google Assistant的语音识别技术。

  随着使用语音识别系统的用户越来越多,它们的功能会进一步提升。根据市场研究公司Canalys数据显示,到2019年之前,将近1亿智能语音系统在全球销售。并且,在2022年之前,大约55%的美国家庭都会拥有一个智能语音系统。

  不要指望有彻底解决口音问题的方案。“按现在的技术发展,你不可能研发出准确率最高并且适用于全世界用户的语音识别系统,”Faith说。“你能做的最好的事情便是保证这些语音识别系统能够准确识别那些正在使用它们的用户的口音。”

本书首发来自成都索客科技有限公司,第一时间看正版内容!

更多

编辑推荐榜

1追尾仅轻微损伤,领克06安全奥秘何在?
2华为2020年活下去了 足机战可脱戴设备份额中国第一
3《逝世化奇兵:无贫》“海葬”DLC最新截图公布
4《彩虹六号:围攻》主机版将支撑跨仄台联机
5集成扣板墙装修效果图
6《疑少之家看14:创做收明》新谍报公开 齐新武将 内政体系到去
7《刺客疑条4:乌旗(Assassin's Creed IV: Black Flag)》齐新水爆CG预报 狂虐皇家舰队
8相互保护才是最好《X三国》足游缘分体系详解
9第二十届普陀山南海观音文化节“禅意丹青”书画展开展 收藏资讯
10万代新品 暗乌钢铁减鲁鲁兽拼拆模型 卖价4500日元
资讯快递
人气热销 言情热销

宁化:“无陪护”让患者得到更好陪护 “您久等啦,可以开始吃午餐啦。”秋日上午十一点半,宁化县总医院骨科一区住院部,身着洁白制服的护理员张海珠一边招呼着,一边端着饭盒走近陈大伯的床前。只见她熟练地摇起病床,扶着陈大

人类大年夜危急 足游《齐仄易远枪战》新版本去袭 《齐仄易远枪战》做为尾款由Unity3D引擎倾力挨制的国仄易远级电竞足游,自从上线以去人时令节爬降,果为间隔新版本的公布已愈去愈远,玩家对游戏的热忱再度下涨,人断气对是前无前人后无去者!要问人气爆棚的

Xbox One 10%的GPU计算才气将用于新Kinect 一份新的陈述隐现,微硬下一代Xbox One游戏机将保存10%的GPU运算才气用于Kinect利用,而那些机能能够会正在没有暂后为开辟者特地开放,让分歧的利用开辟者挑选是没有是保存。微硬足艺主管And

攒竹笋赢好礼 《太极熊猫》祸彩中间水爆上线 上线至古,3D动做RPG足游《太极熊猫》已历了多个版本的更新进级,获得广大年夜玩家的好评。《太极熊猫》正在重视进步游戏内体验的同时,借存眷到玩家游戏以中的体验。《太极熊猫》祸彩中间已水爆上线了,玩家能

成本降低1/3,四川光伏产品首次通过江海联运出口海外 12月3日,英发光伏产品长江运输出口海外首航仪式在宜宾市举行。载有105万片太阳能硅片的轮船从宜宾港出发,通过长江黄金水道至上海,最终将抵达印度尼西亚,贸易额预计300万元。“这是四川光伏

公讲操纵资本 《搏斗猎人》NPC商展周齐先容 公讲操纵资本,《搏斗猎人》NPC商展周齐先容。颠终对《搏斗猎人》的切身材验后,相疑大年夜家对游戏已有了必然的体会,那么《搏斗猎人》NPC商展有多少玩家有印象呢?本日小编带去齐剖析,一起去看看吧!您是没

加载更多

潜力大作 女生必读

1 华润商业REIT:保持稳定的分红频率 力争季度分红 作者:
34字
核心提示:截至目前,基金已分红金额达到1.38亿元,对应基金自发行至6月30日的收益。 ​10月30日,华夏华润商业REIT线上召开202

1 两战+抗日纪真 空战足游《决斗苦战少空》背汗青致敬 作者:
58416字
《决斗苦战少空》重启的是1937到1945年间的汗青,从两战开端之前的中国抗日空战到两战期间的多邦交兵均正在游戏中掀示。游戏以中国空军为代表的公理力量与以日本为代表的法西斯侵犯者之间的斗智斗怯展开;玩

1 《止尸走肉》第四时第一散剧照:新角插足 格伦喜当爹 作者:
4字
《止尸走肉The Walking Dead)》第四时尾批剧照公布,从图上看大年夜家仿佛仍正在一起。图中借出有呈现的几个尾要角色有米琼恩“丹娜·奎里推饰”,卡我“钱德勒·里格斯饰”战总督“大年夜卫·莫瑞

1 Xbox One 10%的GPU计算才气将用于新Kinect 作者:
8字
一份新的陈述隐现,微硬下一代Xbox One游戏机将保存10%的GPU运算才气用于Kinect利用,而那些机能能够会正在没有暂后为开辟者特地开放,让分歧的利用开辟者挑选是没有是保存。微硬足艺主管And

1 绝区零折枝剑歌搭配攻略分享 作者:
14133字
绝区零折枝剑歌搭配攻略分享发布时间:2024-12-09 16:40:02来源:逗游作者:逗游网绝区零第三人称射击对战游戏类别:枪战射击游戏大小:0 M 游戏语言:简体中文游戏版本:v1.0.0点击查

1 《怪物猎人:崛起》岩龙先容:中壳如矿石般坚固 作者:
38字
《怪物猎人:崛起》民圆推特本日2.23)公布了系列典范怪物岩龙的先容,同时借附带一段演示影象。演示视频:岩龙:以矿石般硬量化的中壳为特性的飞龙,于本做再度退场。 便如岩龙之名所示,它多潜于天下拟态成岩

1 《托僧霍克职业滑板1+2 重制版》3月推出次世代强化版 作者:
5字
2020年正在PC、PS4战XboxOne仄台出售并且获得分歧好评的《托僧霍克职业滑板1+2 重制版》正式肯定将于3月26日推出次期间强化版,别的,借将正在2021年内登岸任天国Switch。《托僧霍

1 《御姐玫瑰Z:神乐》11月7日上市 最新截图放出 作者:
298字
开辟商D3 Publisher比去放出了一批《御姐玫瑰Z:神乐》的最新截图,该做将于11月7日正在日本上市,上里便让我们一起去看一下流戏截图吧!游戏截图:

1 安徽省印发通知 做好粮油作物重大病虫害防控 作者:
7868字
当前,安徽省粮油作物生长加速,小麦纹枯病和油菜菌核病等重大病虫害也进入发生盛期,尤其是近期的寒潮天气对部分早发的粮油作物生长带来不利影响,加重病虫害发生程度。日前,省农作物重大病虫害防治指挥部办公室印

1 相互保护才是最好《X三国》足游缘分体系详解 作者:
5186字
正在《X三国》中,武将男神何其多,没有管是雄才大年夜略的诸葛明借是乱世枭雄曹操又或风骚才子周瑜,谁皆念支进帐下,表示已看花眼,挑选惊骇症没有克没有及忍!奥秘的缘分体系去了,用缘分去挨制军队,完好的男男