互联网资讯 / 人工智能 · 2023年12月14日

AI识别盗版能力提升,脸书发布数据增强库:提供100多种增强方式

只要稍微动点手脚,就会给AI模型的鲁棒性带来挑战。

在AI眼里,下面这两张图片可能毫无关联。

现在,FACEbook AI开源了用于数据增强的新Python库&Mdash;&Mdash;AugLy。

它支持音频、图像、视频和文本4种模态,提供了超过100种数据增强功能,可以对输入内容进行多种处理。

比如,改变文字的大小写、字体、编码方式,给文本添加标点、调整字母位置、模拟错别字。

这一项目已经获得1.8k颗星,并且登上了GITHub热榜。

AugLy的目的是涵盖现实网络中具体的数据增强,用来创建样本,从而训练和测试模型。

根据FACEbook和InstagRaM等平台上的生活图像和视频,AugLy在统一的库和API下转换项目的所有数据,提供了超过100种数据增强方式。

其中包括4个子库,分别对应音频、图像、视频和文本4种模态。

这些子库包括基于函数和类的变换、组合,并且可以选择所应用的元数据及其强度。

以ͼƬ处理为例,AugLy可以对图片进行裁剪、旋转、添加噪声、模糊处理、灰度处理等。

有网友提出疑问:文本模块只支持英语吗?

除了包含许多通用的增强功能,AugLy更大的特点在于&Mdash;&Mdash;提供“互联网用户&Rdquo;类型的数据增强方式。

比如,把图片转换成屏幕截图的样式,更加符合生活中常见的样子。

使用AugLy数据增强训练AI模型,这些内容相同而形式不同的信息,能帮助模型提高鲁棒性。

在复制检测、言论检测或版权侵权等工作中,训练后AI可以对用户上传的内容,进行更精确的识别。

此外,AugLy已经被用于DeepFAke检测挑战赛,用来评估模型的鲁棒性。

网友热议

这个新的Python库也受到了网友们的关注,在ReddIT上获得了350+赞。

有网友提出疑问:文本模块只支持英语吗?

一位热心网友表示:

看起来文本模块在很大程度上是对nlpaug的一种包装,因此AugLy支持其他语言,只需修改几个参数。

也有网友提出,为什么不直接把它加到pyTorch里?

对此,有人回复道:

这样在安装的时候会很慢,有需要的的人单独安装就可以了,没必要让pyTorch那么臃肿。

AugLy要求Python 3.6以上版本,通过pIP安装,但是在虚拟环境和系统环境中,还需要用conda和sudo apt-get命令单独安装Python-Magic。

比较遗憾的是,AugLy目前不支持输入批量图像,不过开发人员表示,以后将会完善这一功能。

OpenMagic API

Need more than content? Move into the product flow.

If you are here for model access, pricing, developer docs, or the future API console, the dedicated product path now lives on api.openmagic.ai.

登录免费注册