贝叶斯深度学习：整合深度学习和概率图模型的新方法

人工智能（AI）的进展显示，通过构建多层的深度网络，利用大量数据进行学习，可以获得性能的显著提升。但这些进展基本上是发生在感知任务中，对于认知任务，需要扩展传统的AI范式。

4月9日，罗格斯大学计算机科学系助理教授王灏，在AI TIME青年科学家&Mdash;&Mdash;AI 2000学者专场论坛上，分享了一种基于贝叶斯的概率框架，能够统一深度学习和概率图模型，以及统一AI感知和推理任务。

据介绍，框架有两个模块：深度模块，用概率型的深度模型表示；图模块，即概率图模型。深度模块处理高维信号，图模块处理偏推断的任务。

以下是演讲全文，AI科技评论做了不改变原意的整理：

今天和大家分享关于贝叶斯深度学习的工作，主题是我们一直研究的概率框架，希望用它统一深度学习和概率图模型，以及统一AI感知和推理任务。

众所周知，深度学习加持下的AI技术已经拥有了一定的视觉能力，能够识别物体；阅读能力，能够文本理解；听觉能力，能够语音识别。但还欠缺一些思考能力。

“思考&Rdquo;对应推理推断任务，具体指它能够处理复杂的关系，包括条件概率关系或者因果关系。

深度学习适合处理感知任务，但“思考&Rdquo;涉及到高层次的智能，例如决策数据分析、逻辑推理。概率图由于能非常自然的表示变量之间的复杂关系，所以处理推理任务具有优势。

贝叶斯深度学习：一个统一深度学习和概率图模型的框架

如上图，概览图示例。任务是：想通过目前草地上喷头开或关，以及外面的天气来推断外面的草地被打湿的概率是多少，也可以通过草地被打湿反推天气如何。概率图的缺点是无法高效处理高维数据。

贝叶斯深度学习：一个统一深度学习和概率图模型的框架

总结一下，深度学习比较擅长感知类的任务，不擅长推理、推断任务，概率图模型擅长推理任务，但不擅长感知任务。

很不幸，现实生活中这两类任务一般是同时出现、相互交互。因此，我们希望能够把深度学习的概率图统一成单一的框架，希望达到两全其美。

贝叶斯深度学习：一个统一深度学习和概率图模型的框架

我们提出的框架是贝叶斯深度学习。有两个模块：深度模块，用概率型的深度模型表示；图模块，即概率图模型。深度模块处理高维信号，图模块处理偏推断的任务。

值得一提的是，图模块本质是概率型的模型，因此为了保证能够融合，需要深度模型也是概率型。模型的训练可以用经典算法，例如MAP、MCMC、VI。

贝叶斯深度学习：一个统一深度学习和概率图模型的框架

给具体的例子，在医疗诊断领域，深度模块可以想象成是医生在看病人的医疗图像，图模块就是医生根据图像，在大脑中判断、推理病症。从医生的角度，医疗图像中的生理信号是推理的基础，优秀的能力能够加深他对医疗图像的理解。

贝叶斯深度学习：一个统一深度学习和概率图模型的框架

引申一下，电影推荐系统里，可以把深度模块想象成是对电影的视频情节、演员等内容的理解，而图模块需要对用户喜好、电影偏爱之间的相似性进行建模。进一步，视频内容理解和“喜好&Rdquo;建模也是相辅相成的。

贝叶斯深度学习：一个统一深度学习和概率图模型的框架

具体到模型细节，我们将概率图模型的变量分为三类：深度变量，属于深度模块，假设产生于比较简单的概率分布；图变量，属于图模块，和深度模块没有直接相连，假设它来自于相对比较复杂的分布；枢纽变量，属于深度模块和图模块中相互联系的部分。

下面介绍该框架是如何在实际应用中效果。

推荐系统

推荐系统基本假设是：已知用户对某些电影的喜好，然后希望预测用户对其他电影的喜好。

贝叶斯深度学习：一个统一深度学习和概率图模型的框架

可以将用户对电影的喜爱写成评分矩阵（Rating MatRix），该矩阵非常稀疏，用来直接建模，得到的准确性非常低。在推荐系统中，我们会依赖更多的信息，例如电影情节、电影的导演、演员信息进行辅助建模。

为了对内容信息进行建模，并进行有效提纯，有三种方式可供选择：手动建立特征，深度学习全自动建立特征、采用深度学习自适应建立特征。显然，自适应的方式能够达到最好的效果。

不幸的是，深度学习固有的独立同分布假设，对于推荐系统是致命的。因为假设用户和用户之间没有任何的关联的，显然是错误的。

贝叶斯深度学习：一个统一深度学习和概率图模型的框架

为了解决上述困难，我们推出协同深度学习，能够将“独立&Rdquo;推广到“非独立&Rdquo;。该模型有两个挑战：

1.如何找到有效的概率型的深度模型作为深度模块。希望该模型能够和图模块兼容，且和非概率型模块的效果相同。

2.如何把深度模块连接到主模块里，从而进行有效建模。

贝叶斯深度学习：一个统一深度学习和概率图模型的框架

来看第一个挑战。自编码器是很简单的深度学习模型，一般会被用在非监督的情况下提取特征，中间层的输出会被作为文本的表示。值得一提的是，中间层的表示它是确定性的，它不是概率型的，和图模块不兼容，无法工作。

贝叶斯深度学习：一个统一深度学习和概率图模型的框架

我们提出概率型的自编码器，区别在于将输出由“确定的向量&Rdquo;变换成“高斯分布&Rdquo;。概率型的自编码器可以退化成标准自编码器，因此后者是前者的一个特例。

贝叶斯深度学习：一个统一深度学习和概率图模型的框架

如何将深度模块与图模块相联系？先从高斯分布中提出物品j的隐向量：

贝叶斯深度学习：一个统一深度学习和概率图模型的框架

然后从高斯分布中，提取出用户i的隐向量：

贝叶斯深度学习：一个统一深度学习和概率图模型的框架

上图蓝框表示图模块。定义了物品、用户、评分等等之间的条件概率关系。一旦有了条件概率关系，就能通过评分反推用户、物品的隐向量，可以根据“内积&Rdquo;预测未知的背景。

贝叶斯深度学习：一个统一深度学习和概率图模型的框架

上图是整个模型的图解，其中&laMbda;是控制高斯分布方差的超参数。为了评测模型效果，我们用了三个数据集：cITeulike-a、cITeulike-t、Netflix。对于cITeulike是用了每篇论文的标题和摘要，Netflix是用电影情节介绍作为内容信息。

贝叶斯深度学习：一个统一深度学习和概率图模型的框架

实验结果如下图所示，Recall@M指标表示，我们的方法大幅度超越基准模型。在评分矩阵更加稀疏的时候，我们模型性能提高幅度甚至可以更大。原因在于，矩阵越稀疏，模型会更加依赖内容信息，以及从内容提取出来的表示。

贝叶斯深度学习：一个统一深度学习和概率图模型的框架

推荐系统性能提升能够提升企业利润，根据麦肯锡咨询公司的调查，亚马逊公司中35%的营业额是由推荐系统

chatGPT

近期文章

互联网资讯 / 人工智能 · 2024年1月4日

贝叶斯深度学习：整合深度学习和概率图模型的新方法

Need more than content? Move into the product flow.