互联网技术 · 2024年2月6日

码隆科技论文入选ICCV 2019,助力零售业前沿研究

2019 年 10 月 27 日-11 月 2 日,全球计算机视觉顶级会议之一 ICCV(IEEE International Conference on Computer Vision,国际计算机视觉大会)在韩国首尔顺利举行,7500 余位来自 59 个国家的计算机视觉学者齐聚现场,共享盛会。今年的会议不论是在参会人数还是论文提交数量,相较去年都足足增加了一倍。此外,根据官方数据显示,在大会接收论文中,此次中国学者的研究成果数量排名第一,遥遥领先。

专注于计算机视觉技术研发与落地的码隆科技今年共有 4 篇第一单位论文入选,研究方向涵盖弱监督学习算法、文字检测与识别模型及服装图像生成框架的搭建等细分领域,包括:

Label-PEnet: Sequential Label Propagation and Enhancement Networks for Weakly Supervised Instance Segmentation

Convolutional Character Networks

FiNet: Compatible and Diverse Fashion Image Inpainting (Oral)

ClothFlow: A Flow-Based Model for Clothed Person Generation

并凭借“The iMaterialist Fashion Attribute Dataset”研究成果获得了“Computer Vision for Fashion, Art and Design”主题分会(workshop)颁发的最佳论文。

ICCV 2019 共有 1075 篇论文被接收,一向以接收率低而著称的它,此次接收率也仅为25%,其中口头报告论文更是仅有4.6%。码隆科技此行收获颇丰,其作为第一单位共有4篇论文被接收,其中包含一篇口头报告论文。

10 月 31 日,码隆科技在备受关注的主会场(Main Conference)分享了 ICCV 2019 口头报告论文“FiNet: Compatible and Diverse Fashion Image Inpainting”的研究内容。

近年来,专注于时尚分析的计算机视觉研究发展快速,其中视觉上的兼容与协调对其尤为重要,然而现有的时尚图像生成系统在此方面却仍然有所欠缺。码隆科技在 ICCV 2019 口头报告论文中指出可通过时尚图像修复来对视觉上的搭配兼容性进行显式的建模,并提出了 Fashion Inpainting Networks(FiNet,时尚图像补全网络)。这是一个两阶段的图像到图像生成框架,能够实现视觉上兼容协调但不失多样化的图像修复技术,这一研究可为服装重建和时尚风格迁移等相关任务提供有力的工具。

11 月 1 日,码隆科技专注于服饰生成算法的研究“ClothFlow: A Flow-Based Model for Clothed Person Generation”在 Poster 环节进行了展示。

在该学术工作中,码隆科技提出了一种基于外观流的生成模型 ­—— ClothFlow,这一模型能够合成特定姿态的人物服装图像,以用于基于姿态引导的人物图像生成和虚拟试衣。通过估计源服装区域和目标服装区域之间的稠密流场,ClothFlow 模型能够有效地针对几何形变进行建模,并自然地进行外观迁移以合成与众不同的服装图像。

10 月 30 日,码隆科技专注于弱监督学习算法的论文“Label-PEnet: Sequential Label Propagation and Enhancement Networks for Weakly Supervised Instance Segmentation” 向参会者展示了与其日常工作紧密相关的算法研究。

这一研究致力于在仅仅给定图像级别标签的情况下精确地检测与分割物体实例。因为手工标注大量训练数据代价高昂,与监督学习、半监督学习等方式相比,它是更适用于现实应用的技术。与以前那些包含多个离线模块的方法不同的是,本篇论文提出了序列化标签传播与增强网络(缩写为 Label-PEnet)。Label-PEnet 基于一种由粗到细的方式,可以递进地将图像级别的标签转化成像素级标签,极大程度地提升了图像数据在工业场景中的应用效率。

自然场景下的文字检测与识别是近年来的热点研究方向之一,但相较于技术已经相对成熟的打印文档文字识别,自然场景中的文本识别仍具困难,比如文字的呈现可以有多种方向、多样的颜色和字体等,这些情况都为文字检测与识别技术在现实生活中的应用带来了挑战。

11 月 1 日,主题为“Convolutional Character Networks”的论文在 Poster 展示环节中详尽地呈现了码隆科技在 ICCV 2019 上提出的一种单阶段模型——卷积字符网络 – CharNet (Convolutional Character Networks)。CharNet 第一次实现 one-stage 模型的文字检测和识别。

此外,11 月 2 日,码隆科技还受邀参加了“Computer Vision for Fashion, Art and Design ”主题分会(workshop)。此前,码隆科技与 GoogleAI 联合发布了 iFashion 数据库,其相关研究“The iMaterialist Fashion Attribute Dataset”本次也斩获了该场 workshop 最佳论文的荣誉。

作为 ICCV 2019 的黄金赞助商,码隆科技在展会期间展示了 RetailAI 系列智能零售解决方案,如智能货柜解决方案、资产保护解决方案、智能称重解决方案等,进一步与参会者分享了前沿技术在工业界的扎实应用,获得了大家的广泛关注。

展会现场,码隆科技成员们与众多计算机视觉学者就其研究方向与落地进展进行了深入交流。同时,在会议期间,众学者前往码隆展台就其关于弱监督学习算法、文字检测与识别模型、服装图像生成框架的研究工作进行探讨。

自2014年创立以来,码隆科技持续专注于计算机视觉技术在商品识别领域的研发与落地应用。至今,码隆科技在计算机视觉领域的顶级会议 ICCV、CVPR、ECCV上发表了十余篇学术论文,引起了众多知名学者的关注。未来,码隆科技将继续携手学术界,努力拓展技术边界,并与工业界一同致力于推进前沿技术在真实世界的应用与落地,全方位实现 AI 前沿技术的创新价值。

OpenMagic API

Need more than content? Move into the product flow.

If you are here for model access, pricing, developer docs, or the future API console, the dedicated product path now lives on api.openmagic.ai.

登录免费注册