互联网技术 / 互联网资讯 / 营销 · 2022年9月19日

开源世界的现实与未来

1997年,著名黑客埃里克·斯蒂芬·雷蒙在《大教堂与市集》一书中预测了两种不同的自由软件开发模式:

一种是大教堂模式,原始代码是公开的,但每个版本的开发过程由一个专属的团队管控;一种是市集模式,原始代码同样是公开的,不过是放在互联网上供人检视及开发,最直接的例子就是Linux。

最终“市集模式”证明了开源比闭源更加高效,全球99%的组织在IT系统中使用了大量的开源代码,开源的价值也被越来越多的企业重视。比如微软在2018年以75亿美元的代价将代码托管平台 GitHub 收入囊中,IBM则在2019年斥资340亿美元收购了著名开源解决方案供应商红帽。

即便是开源文化一度贫瘠的中国市场,近几年围绕开源项目的讨论也逐渐热闹了起来,BAT代表的科技巨头们扛起了国内开源的大旗,陆续加入到开源项目的建立和维护中,一次次释放了涌动的激情。

对于中国的开源文化从哪里来,又将要走向何处,百度这样的开源力量可以说是不可错失的研究样本。

01 聚焦AI的技术派

早在上世纪90年代末,开源力量就在太平洋的彼岸澎湃。但彼时的中国几乎绝缘于互联网之外,就连计算机都还是少数派的玩物。

时间上的迟到削弱了中国在开源世界中的存在感,缺少在硬件和底层技术上的话语权,缺少自主的操作系统和软件生态,缺少通过开源实现商业化的成功案例,导致中国开发者在很长一段时间内扮演着学习者的角色。

人工智能浪潮的兴起,为中国开发者创造了追平前辈们的机会,何况人工智能和开源几乎有着天然的关联。

正如人工智能领域家喻户晓的一个比喻:如果说AI是一场饕餮盛宴,数据是原材料,算力是天然气,算法是菜谱,开源就如同无数厨师用经验与智慧合著而成的烹饪百科全书。其他厨师可以从书中学习经验制作菜肴,也可以指出书中存在的问题,并源源不断地为百科全书贡献新的菜谱。

百度则进一步证明了这样一个道理:开源不是论资排辈的武林江湖,而是属于技术派的自由世界。

2013年百度率先开源了可视化库ECharts,提供了直观、生动、可交互、可个性化定制的数据可视化图表,并由此开始了百度的开源之路。

2016年是百度开源的破局之年,深度学习框架百度飞桨正式开源,填补了国产深度学习框架的市场空白。

2017年百度开源继续凶猛发力,当年发布了全球首个自动驾驶开源项目——Apollo 自动驾驶开放平台,加速了智能驾驶的行业进程。

2018年百度内部应用了十年的 Doris正式拥抱开源世界,孵化于百度凤巢的交互式 SQL数据仓库,至今仍是国内唯一的分析型数据库。

2019年百度开源项目持续刷新,扛住了数次春晚红包流量波峰的七层流量转发平台BFE对外开源,并在2020年6月份被 CNCF接纳为Sandbox Project。

截止到目前,百度已经主导了上千个开源项目,在GitHub上收获了超过30万Star,社区贡献者数量也已上万。不过作为AI领域的技术派,百度的存在感俨然不只是建立在开源项目的数量上,同时还刷新了中国开源项目的高度。

开源世界不是乌托邦,百度们正在创造新未来注:2020/2019年度全球开源深度学习框架活跃度排名榜单

按照衡量深度学习框架活跃趋势的权威性指标pull request的数据显示,百度飞桨PaddlePaddle均力压谷歌TensorFlow,紧随Facebook PyTorch之后,已经成为了国内第一、世界第二的深度学习开源框架;Apache ECharts (incubating) 在 Github 中的 star 数已经超过 41.4k,每周 npm 下载量超过 22 万;Doris被广泛应用于美团、小米、京东、华为、快手等头部企业的项目中……

开源创造了技术最大的公约数,百度正成为这个时代的弄潮人。

02 社区中的建筑师

开源的世界里流传着这样一句格言:社区重于代码。

这句话的题中之意,恰恰道出了开源世界的铁律,开源社区的聚合和放大效应比开源代码更有价值。

正如开源社联合创始人刘天栋给出的观点:“开源市场就像魔方,表面上看每个成员都是独立的一面,但经过排列、融合,会呈现出很多种组合可能。”这也是不少人为开源唱赞歌,并努力推动中国开源进程的直接原因。

开源的精神是自由的,可细究到开源世界里的话语权,起决定性作用的往往不是精神,而是精神背后的市场规律,以至于常常出现开源社区被强权左右的现象。就连一向以“开源”自居的GitHub,也屡屡传出封禁伊朗、俄罗斯等国籍开发者的消息,已然违背了开源社区存在的初衷。

开源世界不是乌托邦,百度们正在创造新未来注:全球范围内开源社区百花齐放

留给BAT们的挑战在于,所要扮演的角色不只是“两耳不闻身外事”的技术派,还要着实捍卫中国开发者的权益。

在开源社区的运作中,百度找到了两个着力点:

一是深度参与了国内外顶级开源基金会和组织,成为了 Apache 基金会、Linux 基金会以及云原生计算基金会的金牌会员,以及开放原子基金会的理事单位。由于基金会拥有对开源软件的管理和所有权,积极参与到基金会的运作有利于维护社区的中立,比如避免中国的开源项目被恶意孤立。

二是战略投资中文开源技术社区开源中国,后者运营的Gitee代码托管平台已经是全球仅次于GitHub的代码托管平台,每日约增加5000名开发者、200家企业客户、1.7万代码仓库,已经具备了在国际市场上与GitHub全面抗衡的基础,也是中国开源力量不可或缺的底牌所在。

开源世界不是乌托邦,百度们正在创造新未来注:Gitee代码托管平台

打一个比方的话,百度对开源

OpenMagic API

Need more than content? Move into the product flow.

If you are here for model access, pricing, developer docs, or the future API console, the dedicated product path now lives on api.openmagic.ai.