Professional Documents
Culture Documents
19 11 2020学习笔记
19 11 2020学习笔记
2020
计算机视觉应该怎样入门——知乎
量子位
https://www.pyimagesearch.com/start-here/
知乎用户
CV 是啥:研究让机器像人一样具有能够“看”的能力,并在必要的时候给予合适的反馈(输出:比如看图说话,看视频
说话)
学 CV 的前提:python,C++,高数,线性代数,概率统计,机器学习基础
推荐书籍:《计算机视觉:模型、学习和推理》——入门
《Learning OpenCV》——实战经典
《计算机视觉:算法与应用》——工具书,大而全,不适合初学者
其他:国际顶尖的 CV 会议,扫扫论文的摘要、看看报告视频,稍作了解就好。
言有三(公众号:有三 AI)
读芯术(公众号同名)
http://vision.stanford.edu/
http://vision.stanford.edu/tea
http://cvgl.stanford.edu/teach
http://vision.stanford.edu/tea
七月在线(公众号:七月在线实验室)
团学社-大鹏
进行分类。
讨论群:837627861
Sophia(公众号:计算机视觉联盟)
CotCoux
冈萨雷斯的《数字图像处理》:基础的部分:取样量化,图像操作,灰度变换,空间/频域滤波,形态学处理,分割什么
找一个方向去先试着了解下:人脸检测,物体识别,姿态识别,行人检测,表情识别,基于内容的图像检索等等
莫小刀
行研读代码。
人邮异步社区(公众号:异步社区)
《计算机视觉度量 从特征描述到深度学习》
灰灰(公众号:磐创 AI)
Lensyu(公众号:汽车电控与智能驾驶)
永无止境
深度学习对计算机视觉有益:
卷积神经网络,深度残差网络,深度残差收缩网络
《计算机视觉—算法与应用》
Harris Corner Detector
有一个小的窗口在平面上移动来检测角点,在平坦区域,所有方向的亮度都没有明显梯度变化;在边缘区域,只有某个方向亮
度有明显梯度变化;在角点附近,几乎各个方向亮度梯度值都有明显的变化。
这个移动的窗口用 W 表示,W(x,y)的值就是窗口中的某点(x,y)的权重,这里分为两种情况,第一种情况是点在窗
口里面则权重为1,点不在窗口里面则权重是0;第二种情况是高斯分布,窗口最里面的点权重最高,窗口边缘的点权重最低。
(u,v)表示窗口沿着x方向移动了u个单位,沿着y方向移动了 v 个单位。
I(x+u,y+v)-I(x,y)表示移动后和移动前相比的变化程度。
综上,E 的值越大代表越有可能是检测到了角点。
二元函数的泰勒级数展开,为下面的计算铺垫。
窗口移动到任意位置(对任意的u和v)都使得 E 最大。
λ1 0 −1
下图中,M 矩阵是实对称矩阵,可以将它正交相似对角化,即 M = P [ ]P
0 λ2
经过下面的计算可以发现 E 是中心在坐标原点,但长轴和短轴不在x轴和y轴的椭圆。
方块图中绿色的部分表示 λ 1和 λ 2同时很大,也就是角点。
也可用上式来表示,k是一个自己选取的参数,比如0.5。
像素的4邻域和8邻域:
代码实例:
19 plt.show()
首先将图片灰度化之后再做边缘检测。做完边缘检测后的图每个像素都是二值的,要么黑(0)要么白(1)。
卷积:通常是奇数*奇数的大小,比如3*3,为了确保有一个中心点。
在下图左中,首先将原始图片灰度化后的四周补(padding)一圈0(为了保证卷积后的矩阵和原始图片大小一致),然后将右
边3*3的格子重叠到左边矩阵的左上角,相对应的元素相乘,然后所有的积相加,如图18+121=139,然后左上角
的3*3格子将向右移动一格(stride),重新计算卷积和,依次计算后会得到新的图片如下图右。3*3补一圈0,5*5补
两圈0。
常见的卷积核:高斯核(如下图中的等式,不包含 B 和 A 的部分)
5*5的高斯卷积核,159是矩阵内所有元素的和,1/159相当于对矩阵做归一化处理,归一化使得像素值不会溢出
(0,255)的范围。这个矩阵是高斯核,因为距离中心15距离相等的位置值相等。高斯核卷积后的图像会更加平滑,因
为每个像素点的值都被它附近的像素影响,而且也能去掉一些随机噪声,噪点。
常见的卷积核:sobel核,下图分别是水平方向(下图右)和竖直方向(下图左)的sobel核
利用下式计算得到梯度的幅值(G)和梯度的方向(θ)
边就是灰度变化率很大的地方,幅值就是衡量变化率的标志。要得到一条很细的边,即非常准确地找到边的位置,在这条边的
梯度方向,这个像素点变化率最大的一个极大值的位置才是准确的边的位置。
非极大值抑制: