互联网资讯 · 2024年5月12日 0

腾讯揭示AI在设计领域的最新进展:混元大模型

数字时代,人工智能技术的快速发展正在为各行各业带来翻天覆地的变革。在设计领域,AI的应用日益广泛,不仅赋予了专业人士更多创造力,更为普通人提供了表达创意的机会。

腾讯揭示AI在设计领域的最新进展:混元大模型

据陈妍介绍,在AI设计领域,除了文生文这一最基础的能力,腾讯还在进行文生图、文生视频、文生3D的多模态探索。

文生图方面,腾讯混元大模型和国外不一样的地方在于本土化,特别是在很多应用场景上面,用SDI、MDI等。欧美对中国很深度的历史文化的元素理解上是欠缺的,不管是广告还是游戏,让他们做一个古代元素是没有办法很好表现的,相较之下,混元大模型有比较突出的能力。

去年10月,腾讯混元大模型全新升级,正式对外开放 “文生图” 功能。官方公告称,升级后的腾讯混元中文效果整体超过 GPT-3.5,代码能力大幅提升 20%,达到业界领先水平。

陈妍指出,目前文生图已经深度应用在B端和C端,比如创意广告、人像风格化等。陈妍透露,下周腾讯将在北京举办发布会,宣布文生图能力开源。

文生视频方面,2月SoRa的发布,给了业内很大震撼。陈妍表示,根据算法路径重新看我们文生视频的能力,时空扩散和解码不一样,可以把视频拉的很长,之前能够做到4秒,这个月我们可以做多16秒,整个过程非常不容易。

除了文生视频,腾讯混元大模型现在还可以做图生视频、视频生视频,具体落地上,可以把实拍图片变成卡通、脸土风或者其他风格,可以局部做替换,还有骨骼驱动视频等。

文生3D方面,现在还没有很广泛的应用,但腾讯已经提前做了一些研究。陈妍认为,文生3D跟生视频、生图比较不一样的点是它生成出来的模型可以再编辑,就是导到3D的编辑工具里面重新做调整。“现在我们也想尝试3D人物的应用,手伴这些东西还是蛮火的。”

最新数据显示,腾讯混元大模型目前已扩展至万亿级参数规模,自上线起即突出其实用性标签,腾讯内部已经有超过400个业务和场景接入混元大模型进行测试,部分已经发布。

腾讯揭示AI在设计领域的最新进展:混元大模型

此次大赛征集活动以腾讯深圳前海总部园区科创街区为主题,大赛面向对建筑设计、城市规划、艺术创作、科幻、人工智能感兴趣的公众,征集具有丰富想象力与创新性的城市建成环境场景设计、装置与小品设计、平面视觉设计。

作为新一轮科技革命和产业变革的重要驱动力量,人工智能技术发展正在按下“快进键”,给人们带来了无限想象的空间。国际建筑师协会副主席、清华大学建筑学院院长、教授张利表示,AI带给所有的学科和行业的挑战是众所周知的,在我国高质量城市更新的今天,数据与计算技术以及潜在的规划新范式涌现,建筑行业正站在新的历史起点上。虽然我们还远不能肯定AI带来怎样的具体改变,但我们拥抱AI带来的全新可能性,更期待这次竞赛,通过AI能够连接不同的人群,共同为高质量的城市更新贡献智慧。