聋哑人的春天来了谷歌重磅开源最强手语翻译模型SignGemma

Google DeepMind 终于攻下了手语AI!

聋哑人的春天来了谷歌重磅开源最强手语翻译模型SignGemma-2

Google DeepMind刚刚宣布了一个让人激动的消息—— SignGemma!

他们号称是「 最具能力的手语转文本模型 」正式登场:

值得注意的是,这将是一个 开源模型 ,将在今年晚些时候加入Gemma模型家族。

聋哑人的春天来了谷歌重磅开源最强手语翻译模型SignGemma-3

从演示视频可以看到,SignGemma能够实时识别手语动作,并将其转换为屏幕上的英文文字「Google works」。

聋哑人的春天来了谷歌重磅开源最强手语翻译模型SignGemma-4

这背后的技术并不简单——

需要精确捕捉手部的每一个微妙动作,理解手语的语法结构,再转换成自然语言文本 。

聋哑人的春天来了谷歌重磅开源最强手语翻译模型SignGemma-5

Google在官方说明中借助手语强调:「Google works hard to build and make technology more  accessible for everyone」——

这不仅仅是在展示技术能力,更是在传达他们的使命感。

聋哑人的春天来了谷歌重磅开源最强手语翻译模型SignGemma-6

SignGemma的目标很明确: 让技术变得更加无障碍,为所有人服务 。

虽然这个模型被训练为大规模多语言支持,但目前 主要专注于美国手语(ASL)和英语的翻译 。

这有多厉害?

从技术角度来看,手语识别一直是AI领域的「 硬骨头 」。

为什么?

手语不仅仅是手势的简单组合,它有着 复杂的语法结构、空间关系和表情辅助 。

每个手语使用者的动作习惯也不完全相同,这让模型训练变得极其困难。

聋哑人的春天来了谷歌重磅开源最强手语翻译模型SignGemma-7

但SignGemma能够做到 实时识别和转换 ,这意味着Google在数据训练、模型优化和推理速度上都有了重大突破。

开源策略的深意

值得注意的是,Google选择将SignGemma作为 开源模型 发布。

这个决定背后有什么考量呢?

——开源意味着全球的开发者、研究人员,特别是 聋哑人社区 都能参与到这个项目中来。

聋哑人的春天来了谷歌重磅开源最强手语翻译模型SignGemma-8

不同国家的手语体系不同,仅靠Google一家公司很难覆盖所有语种和方言。

通过开源,SignGemma可以被适配到更多手语体系,真正实现「 为所有人服务 」的目标。

社区反响热烈

这个消息一出,立刻引起了广泛关注。

聋哑人的春天来了谷歌重磅开源最强手语翻译模型SignGemma-9

Sam 称:

干得好,不过你刚刚杀死了3 家我认识的公司。

vittorio(@IterIntellectus) 直接表示:

这太令人难以置信了!

聋哑人的春天来了谷歌重磅开源最强手语翻译模型SignGemma-10

Carolina(@CarolinAramburo) 则从投资角度点评:

这是Google「dying」的完美例子😂,对$GOOG如此看涨🚀,我听到很多人说他们不再使用Google,这就是他们看跌的全部理由😂

Riyan Mendonsa(@RiyanMendonsa) 更是展望了应用前景:

恭喜!这太酷了!迫不及待地想在新眼镜中使用这些功能!有了其他翻译功能,语言不再是障碍…唯一的障碍就是文化了。我们正朝着真正的地球村前进!

will depue(@willdepue) 评价:

太棒了!

Kol Tregaskes(@koltregaskes) 则认为:

令人惊叹的Google,这应该得到更多报道。

Sam Woods(@samuelwoods_) 从包容性角度评价:

这对于促进AI真正包容性沟通来说是极具影响力的工作

yung(@iamyungswag) 更是直接点出了核心:

Google在AGI竞赛中正在腾飞

mourad(@Mourad2322) 还询问了技术细节:

有没有反向的文本转手语功能?

聋哑人的春天来了谷歌重磅开源最强手语翻译模型SignGemma-11

Abhijeet singh(@Abhijeetxo) 表达了感谢:

感谢你们做的这项崇高工作

Masood(@MasoodMohamed90) 回应称:

令人难以置信!

参与测试

Google已经开放了 SignGemma反馈问卷 ,邀请开发者、研究人员和聋哑人社区参与早期测试。

聋哑人的春天来了谷歌重磅开源最强手语翻译模型SignGemma-12

问卷涵盖了多个维度的需求调研:

早期测试参与 :想要帮助测试SignGemma的用户

应用开发 :计划使用SignGemma构建用户应用

数据扩展 :希望为新任务或手语语种扩展数据

学术研究 :使用SignGemma进行研究

最终用户 :可能使用基于SignGemma开发的手语应用

意见反馈 :仅想为SignGemma提供建议

从问卷中细致的需求分类,也可以看出Google对这个项目的重视程度——他们希望真正了解不同用户群体的具体需求。

链接在此:

goo.gle/SignGemma

真正的「为全人类服务」

SignGemma的推出,标志着 AI辅助技术进入了一个新阶段 。

这不仅仅是技术的进步,更是科技公司社会责任感的体现。

聋哑人的春天来了谷歌重磅开源最强手语翻译模型SignGemma-13

而有趣的是,当某些公司高喊着「为全人类开发AGI」却把模型藏得严严实实,甚至连API 都要超高价收费/各种区域限制时,Google却悄悄地把 真正服务弱势群体的AI 模型开源了 。

聋哑人的春天来了谷歌重磅开源最强手语翻译模型SignGemma-14

这值得我们思考:

什么才是真正的「 为全人类服务 」?

版权声明:
作者:shadowrocket
链接:https://www.shadowrocket9.top/187.html
来源:Shadowrocket官网
文章版权归作者所有,未经允许请勿转载。

THE END
分享
二维码
< <上一篇
下一篇>>