互联网资讯 / 人工智能 · 2023年12月14日 0

卷积神经网络之父Yann LeCun的专利卡过脖子

 

学术研究的专利归属对于学者而言很重要,是对自己所做工作的保护和肯定。但如果因公司变故而将自己参与研究的专利分了出去,后续研究还怎么搞?深度学习三巨头之一、卷积神经网络之父 Yann LeCun 就曾遇到过这种「烦心事」。

提起美国贝尔实验室,喜欢研究科技史的同学想必都不陌生。它是晶体管、激光器、太阳能电池、发光二极管、数字交换机、通信卫星、电子数字计算机、C 语言、UNIX操作系统、蜂窝移动通信设备、长途电视传送、仿真语言、有声电影、立体声录音以及通信网等许多重大发明的诞生地,拥有数万项专利。但很多人不知道的是,卷积神经网络也曾是这数万分之一。

最近,约克大学 EECS 副教授 Kosta DeRpanis 就挖出了这么一个冷知识。

他发现,早在 1989 和 1990 年,AT&T 贝尔实验室就提交了两份关于卷积神经网络的专利申请。专利的名称是「HiERARCHiCAL CONSTRAINED AUTOMATIC learning NEURAL NETWORK FOR CHARACTER RECOGNITION 」,即用于字符识别的分层约束自动学习神经网络。

为什么 AT&T 贝尔实验室那么早就申请了卷积神经网络的专利呢?这还要从卷积神经网络之父Yann LeCun的早期职业生涯说起。

20 世纪 80 年代后期,LeCun 就职于贝尔实验室。1989 年,他发表了「将反向传播用于手写邮政编码识别」的相关研究,而且已经在美国的邮政系统中成功应用。随后,这一系统的应用范围扩展至银行支票。90 年代末期,该系统已经处理了美国 10%~20% 的支票识别。

关于卷积神经网络的专利,LeCun 是这么回复的:

卷积神经网络(ConvNet/CNN)有两项专利:一个是具有 stRided convolution 的 ConvNet,另一是具有独立池化层的 ConvNet。它们分别于 1989 和 1990 年提交,并于 1990 和 1991 年获准。

官方认证:卷积神经网络的专利确实是贝尔实验室90年前后申请的。但 LeCun 之前还提到过一个细节,在 1996 年之后,该专利就跑到了 NCR 的手里。

这又是怎么回事呢?我们接着看 LeCun 的回忆:

我们最开始与一个构建基于 ConvNet 的 OCR 系统的开发团队合作。此后不久,AT&T 收购了 NCR 公司,后者正为银行构建支票成像器和分类机,然后支票图像被发送给人类操作员进行转录。显然,NCR 想要实现这些业务的自动化。

我们最终构建了一个完整的支票读取系统,该系统足够可靠,可以进行部署。银行从 1995 年起开始商业部署。该系统可以读取大约一半的支票(机器打印或手写),并将另一半发送给人类操作员。

实际上,首次部署是在 ATM 机上实现金额验证(由法国 CMB 银行率先部署)之前一年进行的。接着 1996 年出现了重大变故:AT&T 拆分成了 AT&T(服务)、LUCent(朗讯,电信设备公司)和 NCR。

我们的研究团队留在了 AT&T(包括 AT&T Labs-ReSeaRch),工程团队则去了 LUCent,产品团队去了 NCR。在律师们的努力下,ConvNet 的专利最终分配给了 NCR,因为他们销售的正是基于 ConvNet 的产品。

所以,我停止了 ML 的研究工作。当时,神经网络正变得不再受欢迎,我开始与 Léon BOTTou致力于一个名为 DjVu 的互联网图像压缩项目。我们在 20 世纪 90 年代早期写了一系列关于这方面工作的论文。

直到 2002 年离开 AT&T,我才重新开始 ConvNet 的研究工作。我希望 NCR 没人意识到他们拥有我所做研究的专利。事实上确实没有。2007 年该专利到期时,我开了香槟庆祝。

所以我们从这个故事中得到的启发是:当专利与最适合构建他们的人分开时,专利系统可能会起到反作用。对于实体的东西来说,专利是合理的,但对于软件这种东西来说,它几乎从来都不适用。

明明是自己参与发明的东西,但却因为公司的变故被迫与专利分离,甚至在后续的研究中被卡脖子,LeCun 的遭遇恐怕不是个例。

最近两年,谷歌为 DRopout 等算法申请专利的新闻也在社区引发了激烈讨论。尽管 JeFF Dean 后来亲自解释说:「这些有关算法的专利是防御性质的,主要是为了防止谷歌研究人员的成果被其他机构申请专利后进行讹诈,进而引发经济损失。」但很多人依然非常反感这种做法,认为「这是一种野蛮且自私的举动,科学和数学的专利阻碍了人类文明的发展。」从 LeCun 的遭遇来看,反对者的看法似乎是有依据的。