1. 卷积简介
作用:在计算机视觉中,卷积作为神经网络的一部分,常用来提取输入信息的特征。具体卷积的计算和操作步骤见 2. 单通道卷积
特性:具有局部感知能力,权值共享性和平移不变形。(因为一个3 × 3 filter遍历图片/前一层特征的时候,filter的值是固定不变的,同时filter每一次滑动所进行的操作都是局部的)
分类:具有目前卷积有很多类:2D卷积,3D卷积,空洞(膨胀)卷积,转置卷积,分组卷积,可形变卷积等等。下面的文章将会通过讲解和代码对各类卷积进行分析和对比。
2. 单通道卷积
如下图,展示了单通道卷积的过程,图片来源【知乎】整体步骤如下:
- 首先定义一个滤波器(卷积核),在下图中是[ [0,1,2], [2,2,0], [0,1,2] ]
- 然后依次从左往右,从上往下,在矩阵中移动卷积核(默认步长为1,可自定义步长)
- 将滤波器中的元素与对应的矩阵上的元素相乘,最后再相加,每次滑动一个步长,就会得到一个元素,最终的结果图,如上右图
- 注意:在CV中传统的卷积操作是提前定义好的,可用来去噪,或平滑图像。在神经网络中,卷积核的参数是需要网络自己学到的。
3. 多通道卷积
对于神经网络,输入的图片是RGB三通道,以及中间层通过卷积得到的特征大部分是多通道的,所以对于卷积核的个数和卷积后特征的大小,通道数等该如何确定,见下面示例:
1. 一个大小为3×3的输入图片(RGB),通过两个2×2卷积核,得到的特征图size和channel?
2. 首先通过卷积核1后,计算过程和结果如下图,得到一个通道数为1的特征,其中的 × 操作是上述中的遍历滑动相乘,再求和
3. 另外一个卷积核操作同上述步骤2
4. 最终得到是两个channel,size为 2×2 的特征
4. 总结
从上述结果我们也能看到:
1. 卷积核的通道数与 输入特征/图片的通道数 要保持一致
2. 输出特征的通道数与卷积核的个数要保持一致
3. 对于代码实现和padding以及stride对输出特征影响,看下一篇文章
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。
文章由极客之音整理,本文链接:https://www.bmabk.com/index.php/post/87471.html