互联网资讯 / 人工智能 · 2024年1月10日

抖音集团举办“AI助视障群体”技术公益比赛 成果将孵化落地

1月16日消息,1月13日下午,北京大钟寺的一个报告厅里,由抖音集团产品经理、研发工程师以及清华大学、浙江大学等高校学生组成的12支队伍正在进行决赛。5个多月前,64支队伍,501名参赛选手开启了这场“AI助力视障群体”为主题的技术公益大赛。

抖音集团举办“AI助力视障群体”技术公益比赛 相关成果将孵化落地

灵瞳产品演示图

经过三个多小时的角逐,3号参赛队伍“灵瞳”团队以最高分获得一等奖,他们设计了一款“对话式视觉助手”。这是一款应用于手机和智能眼镜的app,初始界面类似相机。它可以听取和理解用户发起的提问,同时点击按钮录制物品信息,它会根据问题提取有效信息并语音回答。

“灵瞳”在交互和视觉技术上的表现得到了评委和观众的一致青睐。交互上,除了连续探索模式,它还可以实现指尖探索,即用手触摸屏幕来告诉用户物品的相对应位置。还有一种功能是对话定位,用户可以先告诉“灵瞳”想要什么样的物品,比如想要寻找一个红色的东西,用户可以拿着摄像头去寻找,一旦你想要的目标出现在屏幕中,“灵瞳”就会提示用户的位置,在屏幕的左侧还是右侧。“灵瞳”还有一些辅助能力,比如找对袜子,线下买衣服,“灵瞳”都可以帮助你做一些辅助信息和判断。

“灵瞳”团队的成员,一名抖音集团的研发工程师在赛后接受媒体采访时表示,他最早的触动来自于身边人——一位好友去年患上视网膜相关的疾病,接下来,他的眼睛会慢慢受影响甚至失明。从那之后,他就开始关注相关领域的技术和研发,直至这次参加比赛。

其他11支进入决赛的团队根据自身的技术特点,还提供了关于视障人群的出行、办公、购物、美妆、游戏等需求的智能解决方案。抖音公益的相关负责人表示,赛后会支持和协助有价值的项目进行孵化和落地,期待它们成为视障群体切实可用的产品。

比如“BANG”团队,他们为视障群体提供了一款无障碍的创作工具:用AI技术实现文本转图、图像编辑、色块成图等功能,支持语音交互方式,帮助视力障碍人群进行便捷创作和表达。

而“世界和平”团队则从工作场景出发,希望提供一种面向B端的“工区无障碍改造”的智能工具,为有视力障碍人群就职的机构提供无障碍化改造方案,以给视障群体提供更加舒服的办公环境。

相关数据显示,中国目前有1700多万视力障碍人士,越来越多的社会力量关注到了他们,并试图用技术和公益的方式来助力他们解决现实的困境。

OpenMagic API

Need more than content? Move into the product flow.

If you are here for model access, pricing, developer docs, or the future API console, the dedicated product path now lives on api.openmagic.ai.

登录免费注册