摘要:边缘检测是计算机视觉中的核心任务,旨在识别图像中亮度发生剧烈变化的特征点。本文将深度解析四大主流边缘检测算子(Sobel, Scharr, Laplacian, Canny)的数学原理、卷积核结构、API 应用及性能对比。


1. 边缘检测核心原理

边缘是图像中像素灰度值发生显著变化的区域。从数学角度看,边缘对应着函数值的极值点

1.1 两大检测流派

  1. 基于搜索 (一阶导数)
    • 通过计算图像的一阶导数(梯度)来检测边缘。
    • 原理:边缘处的一阶导数通常取得最大值。
    • 代表算子:Sobel 算子Scharr 算子
  2. 基于零穿越 (二阶导数)
    • 通过寻找图像二阶导数的零交叉点(Zero-Crossing)来定位边界。
    • 代表算子:Laplacian 算子

2. 一阶微分算子:Sobel 与 Scharr

2.1 Sobel 算子原理

Sobel 算子结合了高斯平滑与微分求导,具有较好的抗噪能力。

Sobel_x_or_y = cv2.Sobel(src, ddepth, dx, dy, dst, ksize, scale, delta, borderType)

数学表达
对于离散图像,一阶导数近似为:
f′(x)=f(x+1)−f(x−1)2f'(x) = \frac{f(x+1) - f(x-1)}{2}f(x)=2f(x+1)f(x1)

卷积核结构

  • 水平方向 (Gx):检测垂直边缘
    Gx=[−10+1−20+2−10+1]∗IG_x = \begin{bmatrix} -1 & 0 & +1 \\ -2 & 0 & +2 \\ -1 & 0 & +1 \end{bmatrix} * IGx= 121000+1+2+1 I
  • 垂直方向 (Gy):检测水平边缘
    Gy=[−1−2−1000+1+2+1]∗IG_y = \begin{bmatrix} -1 & -2 & -1 \\ 0 & 0 & 0 \\ +1 & +2 & +1 \end{bmatrix} * IGy= 10+120+210+1 I

最终梯度幅度
G=Gx2+Gy2G = \sqrt{G_x^2 + G_y^2}G=Gx2+Gy2

2.2 代码实战

注意:由于导数会出现负值,必须使用 cv2.CV_16S 防止截断,处理后再转回 uint8

import cv2 as cv
import numpy as np
from matplotlib import pyplot as plt
# 1 读取图像
img = cv.imread('./image/horse.jpg',0)
# 2 计算Sobel卷积结果
x = cv.Sobel(img, cv.CV_16S, 1, 0)
y = cv.Sobel(img, cv.CV_16S, 0, 1)
# 3 将数据进行转换
Scale_absX = cv.convertScaleAbs(x)  # convert 转换  scale 缩放
Scale_absY = cv.convertScaleAbs(y)
# 4 结果合成
result = cv.addWeighted(Scale_absX, 0.5, Scale_absY, 0.5, 0)
# 5 图像显示
plt.figure(figsize=(10,8),dpi=100)
plt.subplot(121),plt.imshow(img,cmap=plt.cm.gray),plt.title('原图')
plt.xticks([]), plt.yticks([])
plt.subplot(122),plt.imshow(result,cmap = plt.cm.gray),plt.title('Sobel滤波后结果')
plt.xticks([]), plt.yticks([])
plt.show()

2.3 Scharr 算子 (Sobel 的增强版)

当内核大小为 3 时,Sobel 算子误差较大。Scharr 算子提供了更高的精度,其卷积核如下:
Gx=[−30+3−100+10−30+3],Gy=[−3−10−3000+3+10+3]G_x = \begin{bmatrix} -3 & 0 & +3 \\ -10 & 0 & +10 \\ -3 & 0 & +3 \end{bmatrix}, \quad G_y = \begin{bmatrix} -3 & -10 & -3 \\ 0 & 0 & 0 \\ +3 & +10 & +3 \end{bmatrix}Gx= 3103000+3+10+3 ,Gy= 30+3100+1030+3

2.4 代码实战

将上述代码中计算sobel算子的部分中将ksize设为-1,就是利用Scharr进行边缘检测。

x = cv.Sobel(img, cv.CV_16S, 1, 0, ksize = -1)
y = cv.Sobel(img, cv.CV_16S, 0, 1, ksize = -1)

3. 二阶微分算子:Laplacian

3.1 Laplacian算子原理

Laplacian 算子利用二阶微分捕捉图像中的突变。

laplacian = cv2.Laplacian(src, ddepth[, dst[, ksize[, scale[, delta[, borderType]]]]])

数学公式
Δsrc=∂2src∂x2+∂2src∂y2\Delta src = \frac{\partial^2 src}{\partial x^2} + \frac{\partial^2 src}{\partial y^2}Δsrc=x22src+y22src
离散化后的二阶导数:
f′′(x)=f(x+1)+f(x−1)−2f(x)f''(x) = f(x+1) + f(x-1) - 2f(x)f′′(x)=f(x+1)+f(x1)2f(x)

标准卷积核
Kernel=[0101−41010]Kernel = \begin{bmatrix} 0 & 1 & 0 \\ 1 & -4 & 1 \\ 0 & 1 & 0 \end{bmatrix}Kernel= 010141010

注:Laplacian 对噪声极其敏感,通常在执行前需要先进行高斯平滑。

3.2 代码实战

import cv2 as cv
import numpy as np
from matplotlib import pyplot as plt
# 1 读取图像
img = cv.imread('./image/horse.jpg',0)
# 2 laplacian转换
result = cv.Laplacian(img,cv.CV_16S)
Scale_abs = cv.convertScaleAbs(result)
# 3 图像展示
plt.figure(figsize=(10,8),dpi=100)
plt.subplot(121),plt.imshow(img,cmap=plt.cm.gray),plt.title('原图')
plt.xticks([]), plt.yticks([])
plt.subplot(122),plt.imshow(Scale_abs,cmap = plt.cm.gray),plt.title('Laplacian检测后结果')
plt.xticks([]), plt.yticks([])
plt.show()

4. 最优检测算法:Canny 边缘检测

Canny 算法由 John F. Canny 于 1986 年提出,被公认为边缘检测的标准算法。

canny = cv2.Canny(image, threshold1, threshold2)

4.1 四大核心步骤

  1. 噪声去除:使用 5×55 \times 55×5 高斯滤波器平滑图像。
  2. 计算梯度:利用 Sobel 算子计算图像梯度幅值 GGG 和方向 θ=tan⁡−1(Gy/Gx)\theta = \tan^{-1}(G_y / G_x)θ=tan1(Gy/Gx)
  3. 非极大值抑制 (NMS)
    • 逐个像素检查其梯度是否为邻域内的局部最大值。
    • 作用:排除非边缘点,获得“细边”效果。
  4. 滞后阈值 (Hysteresis Thresholding)
    • 设置两个阈值:minValmaxVal
    • 高于 maxVal 为强边缘(确定保留)。
    • 低于 minVal 为非边缘(抛弃)。
    • 介于两者之间且与强边缘相连的被保留。

4.2 代码实战

import cv2 as cv
import numpy as np
from matplotlib import pyplot as plt
# 1 图像读取
img = cv.imread('./image/horse.jpg',0)
# 2 Canny边缘检测
lowThreshold = 0
max_lowThreshold = 100
canny = cv.Canny(img, lowThreshold, max_lowThreshold) 
# 3 图像展示
plt.figure(figsize=(10,8),dpi=100)
plt.subplot(121),plt.imshow(img,cmap=plt.cm.gray),plt.title('原图')
plt.xticks([]), plt.yticks([])
plt.subplot(122),plt.imshow(canny,cmap = plt.cm.gray),plt.title('Canny检测后结果')
plt.xticks([]), plt.yticks([])
plt.show()

5. 核心 API 总结表

算子名称 OpenCV API 方法 关键参数 备注
Sobel cv2.Sobel() dx, dy, ksize 常用 CV_16S 防止截断
Scharr cv2.Sobel(ksize=-1) dx, dy 仅支持 3x3 卷积核
Laplacian cv2.Laplacian() ddepth, ksize 二阶导,对噪声敏感
Canny cv2.Canny() threshold1, threshold2 最优算法,边缘精细

6. 算子特性对比

  1. 准确性:Canny > Scharr > Sobel > Laplacian。
  2. 抗噪性:Sobel/Scharr 内置平滑,抗噪性强于未处理的 Laplacian。
  3. 效率:Sobel 算法简单,执行速度极快,适用于实时性要求高的工业场景。
  4. 结果形式:Sobel 输出的是梯度图像(有灰度变化),而 Canny 输出的是二值图像(清晰的单像素线条)。

💡 最佳实践建议:

  • 在对边缘精度要求极高的检测任务中,优先选择 Canny
  • 如果需要快速计算图像梯度方向(如 HOG 特征提取),优先选择 Sobel
  • 进行 Laplacian 操作前,请务必先执行 cv2.GaussianBlur() 以降低误报率。
Logo

昇腾计算产业是基于昇腾系列(HUAWEI Ascend)处理器和基础软件构建的全栈 AI计算基础设施、行业应用及服务,https://devpress.csdn.net/organization/setting/general/146749包括昇腾系列处理器、系列硬件、CANN、AI计算框架、应用使能、开发工具链、管理运维工具、行业应用及服务等全产业链

更多推荐