综述
最近在做计算机视觉的一些基础训练,用opencv做了做人脸检测。
注意opencv的人脸检测不是基于深度学习的。后期我还做了用tensorflow搞人脸识别的demo,到时候再发一下。
环境
mac os
pycharm
使用opencv3
代码
这是人脸检测的代码:原理是基于特征不变量来搞的
# -*- coding: utf-8 -*-
#作者信息:山东大学基地班frankdura
import sys
import dlib
import cv2
f = 'b.jpg'
detector = dlib.get_frontal_face_detector() #获取人脸分类器
# 传入的命令行参数
# opencv 读取图片,并显示
img = cv2.imread(f, cv2.IMREAD_COLOR)
# 摘自官方文档:
# image is a numpy ndarray containing either an 8bit grayscale or RGB image.
# 将图像作为一个数组
# opencv读入的图片默认是bgr格式,我们需要将其转换为rgb格式;都是numpy的ndarray类。
b, g, r = cv2.split(img) # 分离三个颜色通道
img2 = cv2.merge([r, g, b]) # 融合三个颜色通道生成新图片
dets = detector(img, 1) #使用detector进行人脸检测 dets为返回的结果
print("Number of faces detected: {}".format(len(dets))) # 打印识别到的人脸个数
# enumerate是一个Python的内置方法,用于遍历索引
# index是序号;face是dets中取出的dlib.rectangle类的对象,包含了人脸的区域等信息
# left()、top()、right()、bottom()都是dlib.rectangle类的方法,对应矩形四条边的位置
for index, face in enumerate(dets):
print('face {}; left {}; top {}; right {}; bottom {}'.format(index, face.left(), face.top(), face.right(), face.bottom()))
# 在图片中标注人脸,并显示
left = face.left()
top = face.top()
right = face.right()
bottom = face.bottom()
#这个命令是设置画一个框图
cv2.rectangle(img, (left, top), (right, bottom), (0, 255, 0), 3)
cv2.namedWindow(f, cv2.WINDOW_AUTOSIZE)
cv2.imshow(f, img)
# 等待按键,随后退出,销毁窗口
k = cv2.waitKey(0)
cv2.destroyAllWindows()
这是人脸特征点识别的代码
# -*- coding: utf-8 -*-
# 作者信息:山东大学计算机基地frankdura
import sys
import dlib
import cv2
import os
current_path = os.getcwd() # 获取当前路径
predictor_path = current_path + "/model/shape_predictor_68_face_landmarks.dat" # shape_predictor_68_face_landmarks.dat是进行人脸标定的模型,它是基于HOG特征的,这里是他所在的路径
face_directory_path = current_path + "/faces/" # 存放人脸图片的路径
detector = dlib.get_frontal_face_detector() #获取人脸分类器
predictor = dlib.shape_predictor(predictor_path) # 获取人脸检测器
con = ['a.jpg']
# 传入的命令行参数
for f in con:
# 图片路径,目录+文件名
face_path = face_directory_path + f
print(face_path)
# opencv 读取图片,并显示
img = cv2.imread(f, cv2.IMREAD_COLOR)
# 摘自官方文档:
# image is a numpy ndarray containing either an 8bit grayscale or RGB image.
# opencv读入的图片默认是bgr格式,我们需要将其转换为rgb格式;都是numpy的ndarray类。
b, g, r = cv2.split(img) # 分离三个颜色通道
#
img2 = cv2.merge([r, g, b]) # 融合三个颜色通道生成新图片
dets = detector(img, 1) #使用detector进行人脸检测 dets为返回的结果
print("Number of faces detected: {}".format(len(dets))) # 打印识别到的人脸个数
# enumerate是一个Python的内置方法,用于遍历索引
# index是序号;face是dets中取出的dlib.rectangle类的对象,包含了人脸的区域等信息
# left()、top()、right()、bottom()都是dlib.rectangle类的方法,对应矩形四条边的位置
for index, face in enumerate(dets):
print('face {}; left {}; top {}; right {}; bottom {}'.format(index, face.left(), face.top(), face.right(), face.bottom()))
# 这里不需要画出人脸的框了
# left = face.left()
# top = face.top()
# right = face.right()
# bottom = face.bottom()
# cv2.rectangle(img, (left, top), (right, bottom), (0, 255, 0), 3)
# cv2.namedWindow(f, cv2.WINDOW_AUTOSIZE)
# cv2.imshow(f, img)
shape = predictor(img, face) # 寻找人脸的68个标定点
# print(shape)
# print(shape.num_parts)
# 遍历所有点,打印出其坐标,并用蓝色的圈表示出来
for index, pt in enumerate(shape.parts()):
print('Part {}: {}'.format(index, pt))
pt_pos = (pt.x, pt.y)
cv2.circle(img, pt_pos, 2, (255, 0, 0), 1)
# 在新窗口中显示
cv2.namedWindow(f, cv2.WINDOW_AUTOSIZE)
cv2.imshow(f, img)
# 等待按键,随后退出,销毁窗口
k = cv2.waitKey(0)
cv2.destroyAllWindows()