OG视讯官方网站
全部
All
当前位置: 首页 > 新闻资讯 > 谷歌用AI从嘈杂环境中提取独立音轨:或存隐私担忧
相关新闻
  • OG视讯官方网站正式签约中国互联网金融协会——缔造不同的“时代网站”

    2026-05-22 17:20

    中国互联网金融协会(以下简称:中互金)英文缩写NIFA,是由中国人民银行会同银监会、证监会、保监会等国家有关部委组织建立的互联网金融行业自律组织。2015年12月31日,经国务院批准,民政

  • 在网站设计中检索的重要性究竟多重?

    2026-05-15 19:18

    网站设计中的检索框就显得非常重要。既然检索框很重要,那么大家知道在做网站建设设计以后,该如何去进行设计呢?如何设计检索框才能让我们的网站设计拥有更好的用户体验呢?今天北京网站建设OG视讯官方网站就

  • 如何制作自己的网站 营销型网站制作流程

    2026-05-08 08:30

    如果企业选择自己开发制作网站,头疼的各种技术参数搞不定,代码也许搞不定,技术也有搞不定的地方,搞不好还会更浪费钱,那么其实就可以专业的事情找专业的人去做,找相关的网络公司去做,这样最划算,成

  • 大型网建方案的三点要素

    2026-05-01 21:52

    北京网站开发小编今天跟大家探讨一下大型网站的建设方案,对于大型的网站开发,我们要从每一步都细致对待,每一步都进行细致的研究,下面我们从大型网站的立项开始一步步地为大家介绍一下大型网站开发的建

  • 在家办公、线上买菜等宅经济在疫情中迎来爆发!

    2026-04-26 13:35

    2020年这个春节,新冠肺炎疫情让很多人都感受到了前所未有的危机。不过,在中国人的辞典里,“危机”包含着“危”和“机”两个部分。疫情冲击了很多传统的经济领域,但也催长了“宅经济”。比如“宅购

谷歌用AI从嘈杂环境中提取独立音轨:或存隐私担忧

返回列表
发布时间:2026-05-14 15:37
北京时间4月16日早间消息,谷歌研究人员开发了一种深度学习系统,可以帮助电脑在嘈杂环境中更好地识别和区分一个人的声音。
集团网站建设案例

本周在谷歌研究博客中发布的文章显示,该公司的一个内部团队试图让人工智能(AI)像人类的大脑一样,可以主动关注一个声源,同时过滤其他声源——像你在聚会上跟朋友对话时的做法。
谷歌的方法使用了一个视听模型,使之可以集中精力区分一段视频中的声音。该公司还发布了多段YouTube视频,演示这项技术的实际效果。
谷歌表示,这项技术可以适用于单音轨视频,而且可以通过算法分离出视频中不同人的音频内容,也可以让用户手动选取视频中的人脸,专门收听此人的声音。
谷歌表示,视觉元素是关键,因为这项技术会关注一个人的嘴唇运动,从而更好地判断某个时点应该关注哪段声音,并为一段较长的视频创造更精确的独立音轨。
谷歌研究人员通过收集10万段YouTube“演讲视频”开发了这个模型,总共提取了大约2000小时的内容,然后将这些音轨混合后,添加上人工背景噪音。
谷歌之后训练该技术通过观察每一格视频中的人脸和视频音轨的频谱图,把混合后的音频进行分割。这套系统可以区分哪个声源在特定时间内属于哪张脸,并为每个人制作一段独立的音轨。
谷歌认为,隐藏式字幕系统会成为该系统的一大应用领域,他们还在设想更广泛的应用方向,而且还在探索更多的机会,希望将其整合到各种谷歌产品中。例如,如果把它加入到Google Home智能音箱中,便可区分出不同用户发出的指令。
不过,这个模型需要配合视频才能更好地发挥作用,所以可能更适合亚马逊Echo Show。谷歌今年早些时候面向Echo Show这样的智能显示器开放了谷歌助手,但该公司本身尚未推出这样的产品。
但这项技术可能也会引发隐私担忧。虽然该技术的实际效果远没有视频演示得那么好,但经过一些细微调整,的确有可能成为强大的监听和监视工具。