大家好,今天来继续聊聊深度学习。
有同学跟我说很久没有更新深度学习的模型了,倒不是不愿意更新,主要是一次想把一个技术专题写完。但是纯技术文章观众老爷们不太爱看,所以我一般都把纯技术文章放在次条。不过既然有同学催更,那么我还是响应一下需求,来更新一篇。
神经网络与感知机的不同
我们当时在文章里放了一张图,这张图是一个多层感知机的图,大家看一下,就是下面这张图。
这张图乍一看没什么问题,但是细想会觉得有点奇怪,好像我们印象里看到的神经网络的图片也是这样的,既然如此,那么它们之间有什么区别呢?
表面上最明显的区别就是名字不同,这是一张神经网络的图片。我们发现同样是三层,但是它每一层的名字分别是输入层、中间层(隐藏层)和输出层。我们一般把输入层和输出层单独命名,中间的若干层都叫做隐藏层或者是中间层。当然像是感知机一样,以数字来命名层数也是可以的,比如下图当中的输入层叫做第0层,中间层叫做第一层,最后输出层叫做第2层。
我们一般不把输出层看作是有效的神经网络,所以下图的网络被称为二层神经网络,而不是三层神经网络。
除了名字的叫法不同之外,还有一个最关键的区别就是激活函数,为了说明白这点,我们先来看看神经网络当中的信号传递。
信号传递
下图是一张我随便找来的神经网络图,我们可以看到输入的第一个节点被置为了1。这样做是为了方便引入偏移量,只是我们一般情况下画图的时候,不会特意把偏移量画出来。我们以下图为例子来看下神经网络当中信号的传递方式。
到这里还没有结束,神经网络当中每一层都会有对应的激活函数。一般情况下同一层网络当中的激活函数相同,我们把它叫做h,所以最终这个节点的输出并不是刚刚得到的,而是。
激活函数我们已经比较熟悉了,之前介绍过很多次,常用的大概有以下几种:Relu、SigMoid、tanh、softMax,以及一些衍生出的变种。一般情况下,在输出层之前我们通常使用Relu,如果模型是一个分类模型,我们会在最后使用SigMoid或者是softMax,如果是回归模型则不使用任何激活函数。
SigMoid我们已经很熟悉了,如果我们把LR模型也看成是一个单层的神经网络的话,那么SigMoid就是它的激活函数。SigMoid应用在二分类场景当中单个的输出节点上,输出的值如果大于0.5表示为真,否则为假。在一些概率预估场景当中,也可以认为输出值就代表了事件发生的概率。
与之对应的是softMax函数,它应用在多分类问题当中,它应用的节点数量不是1个,而是k个。这里的k表示多分类场景当中的类别数量。我们以k=3举例,看下图:
在图中一共有三个节点,对于每一个节点来说,它的公式可以写成:
其实和SigMoid的计算方式是一样的,只不过最后计算了一个权重。最后我们会在这k个节点当中选择最大的作为最终的分类结果。
代码实现
最后,我们来试着写一下神经网络的代码,由于现在我们还没有介绍神经网络的训练方法,所以我们只能实现它预测的部分。等我们介绍完了反向传播算法之后,再来补上模型训练的过程。
如果不考虑反向传播的话,其实整个算法的代码非常简单,只要熟悉Python语法的同学都能看懂。
iMpoRt nuMpy as np def Relu(x): RetuRn np.wheRe(x > 0, x, 0) def sigMoid(x): RetuRn 1 / (1 + np.exp(-x)) claSS NeuRalNetwoRk(): def __inIT__(self): self.paRaMs = {} self.paRaMs[””W1””] = np.Random.Rand(2, 3) self.paRaMs[””b1””] = np.Random.Rand(1, 3) self.paRaMs[””W2””] = np.Random.Rand(3, 2) self.paRaMs[””b2””] = np.Random.Rand(1, 2) self.paRaMs[””W3””] = np.Random.Rand(2, 1) self.paRaMs[””b3””] = np.Random.Rand(1, 1) def foRwaRd(self, x): a1 = np.dot(x, self.paRaMs[””W1””]) + self.paRaMs[””b1””] z1 = Relu(a1) &