当身边有人在狂欢时,聊天降噪功能必不可少

无论是在交谈的人们、在玩耍的孩子、隔壁的建筑工人,还是想把想象中的怪物从前廊吓跑的宠物狗,当尝试在Skype上进行通话时,背景噪声确实会让人听不清。

但是,这种情况在Skype中会得到大大改善!

今天为大家介绍的是

Skype桌面应用的最新背景降噪功能

在当你使用Skype与对方对话时,分级别的消除除你的声音外的几乎所有声音。

59BC07E4-830C-47A9-99ED-4108EC907D5A.png

在"设置"中,点击"音频和视频",找到“噪音取消”选项,调节周边声音大小。

噪声取消-调整呼叫的Skype选项。

有以下选项可供选择:

自动(默认)-Skype应用将根据您的环境调整噪声抑制级别。

低-将抑制低级别的持久背景噪音,例如计算机风扇或空调。但是,如果你想要共享正在播放的音乐,可以使用此设置。

高-将取消所有背景声音,语音除外。

关-已禁用噪音消除。

注意:启用此选项会使用更多计算机资源,因为降噪发生在使用的设备上,而不是在Skype上。

真的如此神奇吗?

如果你想了解它的工作原理,请继续往下看。

其工作原理是分析音频源,然后使用经过专门训练的深度神经网络来过滤掉噪声,而不影响说话者的声音。尽管传统的降噪算法可以解决简单、一致的噪声(如风扇发出的噪声),但是这些神经网络可以学习语音和更复杂、不一致的噪声(比如键盘上的打字声、食物包装纸的嘎吱声,是的,还有那只狗的嚎叫声)之间的区别。

此技术依靠机器学习(ML)来学习纯净语音和噪声之间的区别,通常被称为人工智能(AI)。使用一个具有代表性的数据集来训练ML模型,使其在我们的Skype用户遇到的大多数情况下都能工作。就纯净语音、噪声类型以及用户加入在线电话的环境而言,该数据集中需要有足够的多样性。

为了实现这种多样性,我们使用的数据集包含约760小时的纯净语音数据和180小时的噪声数据。为了符合Microsoft严格的隐私标准,未针对此数据集收集任何客户数据。相反,我们使用公开提供的数据或众包来收集特定场景。对于纯净语音,我们均衡使用了男女语音。我们还收集了10多种语言(包括声调语言)的数据,以帮助确保该模型不会曲解词语的声调,从而改变句子的含义。对于噪声数据,我们包括了150种噪声类型,以涵盖用户可能遇到的从键盘输入、流水到打鼾等各种场景。我们还在纯净语音中包含了情感,以免诸如笑声或哭泣声之类的表达受到抑制。用户加入Skype会议时所处环境的特征对语音信号也有很大的影响。为了捕获这种多样性,我们使用来自3,000多个真实房间环境和115,000多个合成房间的数据来训练我们的模型。

由于我们采用深度学习,因此拥有功能强大的模型训练基础结构很重要。我们使用Microsoft Azure,使团队能够开发ML模型的改进版本。从噪声中提取原始纯净语音的另一个挑战需要以一种人耳认为是自然和愉悦的方式。由于没有与人类感知高度相关的客观指标,因此我们开发了一个框架,该框架使我们能够将处理后的音频样本发送给众包供应商,由人类听众按照一到五星的等级对其音频质量进行评分,以得出平均意见分数(MOS)。借助这些人类评分,我们能够开发出一种新的感知指标,再加上人类的主观评分,让我们在改善深度学习模型的质量方面取得了快速的进步。为了推进这一领域的研究,我们开源了我们的数据集和感知质量众包框架。

最后,我们创建了深度学习模型,以在Skype桌面应用上实时高效运行。通过针对人类感知进行优化,我们能够在质量和复杂性之间实现良好的折衷,这意味着用户使用的大多数Windows设备都可以利用基于AI的降噪功能。

我们是设计师、工程师、梦想者,是您扬帆出海的私人顾问专家


相关内容:
[亚马逊开店深圳办事处地址在哪里]
[亚马逊开店深圳办事处地址在哪里]
亚马逊开店深圳办事处地址揭秘:一站式开店服务,轻松拥抱财富!各位亲爱的创业者们,你们好!今天要给大家带来一个好消息——亚马逊开店深圳办事处地址终于揭开了神秘面纱!在这里,
亚马逊开店卖翡翠怎么样?
亚马逊开店卖翡翠怎么样?
亚马逊开店卖翡翠:珠宝行业的巨大商机等你来挖掘!在炎热的夏季,一杯清凉的饮料、一本好书和一个精美的翡翠饰品,想必是很多人的首选。翡翠作为中国传统文化中的瑰宝之一,以其晶莹

TG客服:@SSjiejie — 官方频道:@SSwangluo

三生网络 © 2009-2023 超15年出海经验,跨境项目专家