大多数使用降噪耳机的人都知道,在正确的时间听到正确的噪音至关重要。 有人可能想在室内工作时清除汽车喇叭,但在繁忙的街道上行走时则不想。 然而,人们无法选择耳机消除哪些声音。
现在,由华盛顿大学研究人员领导的团队开发了深度学习算法,允许用户实时选择通过耳机过滤哪些声音。 该团队将该系统称为“语义听觉”。 耳机将捕获的音频传输到连接的智能手机,消除所有环境声音。 通过语音命令或智能手机应用程序,耳机佩戴者可以从 20 个类别中选择他们想要包含的声音,例如警报器、哭闹的婴儿、语音、吸尘器和鸟鸣。 只有选定的声音才会通过耳机播放。
团队介绍了 我的发现 11 月 1 日 东’23 在旧金山。 未来,研究人员计划发布该系统的商业版本。
“理解鸟的声音并将其从环境中的所有其他声音中提取出来需要实时智能,而当今的降噪耳机无法实现,”首席研究员说。 希亚姆·戈拉科塔,威斯康星大学 Paul G. Allen 计算机科学与工程学院教授。 “挑战在于,耳机佩戴者听到的声音需要与他们的视觉同步。某人与你交谈两秒后,你就听不到他们的声音。这意味着神经算法必须在不到百分之一的时间内处理声音。一秒。”
由于时间紧迫,语义听力系统必须在连接的智能手机等设备上处理声音,而不是在更强大的云服务器上处理声音。 此外,由于来自不同方向的声音在不同时间到达人们的耳朵,系统必须保留这些延迟和其他空间线索,以便人们能够有意义地感知环境中的声音。
该系统在办公室、街道和公园等环境中进行了测试,能够提取警报声、鸟鸣声、警报声和其他目标声音,同时消除所有其他现实世界的噪音。 当 22 名参与者评估系统的目标音频音频输出时,他们表示与原始录音相比,平均质量有所提高。
在某些情况下,系统很难区分具有许多共同特征的声音,例如声乐和人类语音。 研究人员指出,基于更多真实数据的训练模型可能会改善这些结果。
论文中有其他共同作者 班达夫韦洛尔 和 马利克·伊塔尼两人都是威斯康星大学艾伦学院的博士生; 贾斯汀·陈他作为艾伦学院的博士生完成了这项研究,现在卡内基梅隆大学; 和 吉冈卓也,AssemblyAI 研究总监。
/一般发布。 来自原始组织/作者的这些材料本质上可能是按时间顺序排列的,并且为了清晰度、风格和长度而进行了编辑。 Mirage.News 不采取公司立场或政党立场,本文表达的所有观点、立场和结论仅代表作者的观点。在此查看全文。
More Stories
《东京恶习》制片人详述日本走向全球制作中心之路
康拉德·科尔曼仅使用可再生能源再次改变了世界
新款 MacBook Pro 为苹果一周的重大新闻画上了句号