互联网资讯 / 人工智能 · 2023年11月3日

宅男大叔自学人工智能,成为大师级水准,在推特引起轰动

最近,一位日本宅男大叔佐藤做了一个AI生成肖像画的网站AI Gahaku,10天内用户访问量从0暴增到100万,引爆推特。

简单易操作,上传一张人脸照片,就能生成一张大师级肖像画。

宅男大叔自学AI打造大师级水准,火爆推特

而比技术更神奇的是佐藤自己,因为他是自学AI做出来的,不得不佩服的宅男创造力。

佐藤患有阿斯伯格症,名副其实的天才病,一般来说,此类患者会在某个领域具有特殊潜能,但不适应普通人的生活。

当然,佐藤的技能点就点在了AI上。

宅男大叔自学AI打造大师级水准,火爆推特pix2pix,TensoRFlow内置的cGAN模型

让大叔此次闻名的AI技术,就是是大名鼎鼎的GAN的变种。

此次的人脸肖像画生成技术,就是大叔在TensoRFlow内置的cGAN中的pix2pix模型上改造而来。

不同于GAN的技术通用性,cGAN更强调特定场景下的发挥,比如AI Gahaku,就只能针对人脸,如果用户上传的是猫脸,则是无法生成结果的。

GAN的特点在于损失函数的自行计算和自动更新,这使得GAN本身具有和迁移学习结合的潜质,在近年来的发展路径上看,更多是把GAN当做手段,去实现迁移学习提出的目标,迁移学习为应用GAN提供具体指向。

TensoRFlow的内置pix2pix的是基于cGAN的图像对图像翻译的模型,模型本身已经成熟,直接调用便可运用到对黑白图像着色、图像风格变化等场景的使用上来。

具体到大叔的使用上,利用pix2pix模型,大叔其实是将模型限定在大师肖像画的生成上,这也体现了模型本身强大的扩展性。

如何使用,都取决于你自身。

在佐藤的另一款作品PixelMe中,同样使用pix2pix技术,但是生成的是8bIT的像素风格头像,一个模型,多种用途。

宅男大叔自学AI打造大师级水准,火爆推特

当然,实际效果因人而异,毕竟严格来说,大叔是在对既有模型进行二次开发,原有的算法和数据结构并未改变,因此性能和效果受到原有模型的限制。

宅男的AI进阶之路

大叔人生经历可以说复杂,从大学退学后,先后干过面包师,参加过护士学校培训课程,但觉得都都不太适合自己,直到他决定运用自己的才智,投身到AI的事业当中去。

 

那说干就干,就从TensoRFlow学起吧。

借助Google Colab的算力资源,大叔从头按着TensoRFlow教程学起,不过大叔也确实适合干AI,而不是去蒸糕点。

在学习过程中,佐藤找到了适合自己的方向,迁移学习和GAN,可以较好的实现图像的再生成,使用不同的图像训练数据集,可以针对具体场景进行学习和生成。

GAN属于典型的非监督学习方法,核心原理是让两个神经网络进行“对抗&Rdquo;,通过不断优化参数来得到最优结果,自我博弈。

这种技术主要用在计算机视觉领域,这也是佐藤选择GAN的主要原因。

得益于Google的慷慨,大叔使用的网站服务器和算力资源都较为便宜,大约为一天20美刀,大叔表示,在可接受的能力范围之内,短期不会寻求商业化。

AI foR EveRyone!

在红了之后,大叔也没飘。

他认为这是在做自己感兴趣的东西,而不是为了经济利益。

出于对技术的热爱,佐藤开始了自己的AI之路,并在两年之后便能上线应用。

这份为梦想而不懈努力的奋斗精神,才是真正值得我们学习的。

毕竟,不是每个人有勇气去自学AI。

OpenMagic API

Need more than content? Move into the product flow.

If you are here for model access, pricing, developer docs, or the future API console, the dedicated product path now lives on api.openmagic.ai.