【python】《多媒体技术与应用》实验报告「图像识别和对象检测」

实验名称

图像识别和对象检测

实验时间

2022/6/6

姓名

班级

计非201

学号

成绩

实验目的

1. 了解图像识别和对象检测的概念；

2. 了解和掌握常用分类算法，如 kNN、SVM 和 k 均值等；

3. 了解和掌握常见深度学习模型，如 AlexNet、Caffe、ResNet 和 DarkNet 等；

4. 掌握基于 YOLO 的图像识别和视频对象检测方法。

二．实验原理

1.图像识别

图像识别是计算机视觉的重要任务之一，很多应用都是一次为基础。当我们看到一个东

西，大脑会迅速判断是不是见过这个东西或者类似的东西。这个过程有点儿像搜索，我们把

看到的东西和记忆中相同或相类的东西进行匹配，从而识别它。利用计算机进行图像识别也

是类似的，通过分类并提取重要特征而排除多余的信息来识别图像。目前的图像识别算法常

借助各类机器学习或深度学习模型实现。

2.机器学习

机器学习( Machine Learning, ML )是人工智能的核心，它专门研究如何让计算机模拟和

学习人类的行为。深度学习( Deep Learning, DL)是机器学习中的一-个热 i 门研究方向，它主

要研究样本数据的内在规律和表示层次，让计算机能够像人一样具有分析与学习能力，能够

识别文字、图像和声音等数据。

OpenCV 的机器学习模块(名称为 ml )实现了与机器学习有关的类和相关函数。在机器学

习中常用于分类任务的算法有 k 最近邻( k-Nearest Neighbours, kNN )、支持向量机( Support

VectorMachines, SVM)和 k 均值聚类(k-Means Clustering )等。

三．实验内容与关键步骤

kNN算法

kNN识别手写数字

SVM算法

SVM识别手写数字

K均值聚类算法

使用基于AlexNet和Caffe模型的图像识别

使用基于ResNet和Caffe模型的图像识别

使用基于MobileNet_SSD和Caffe的预训练模型进行对象检测

使用基于YOLO和Darknet的预训练模型进行对象检测

使用YOLO检测摄像头中的对象

量化图像颜色

使用K均值聚类算法量化颜色

四．代码

kNN算法

# kNN算法
import cv2
import numpy as np
import matplotlib.pyplot as plt

points = np.random.randint(0, 100, (20, 2))  # 随机选择20个点
labels = np.random.randint(0, 2, (20, 1))  # 为随机点随机分配标志
label0s = points[labels.ravel() == 0]  # 分出标志为0的点
plt.scatter(label0s[:, 0], label0s[:, 1], 80, 'b', 's')  # 将标志为0的点绘制为蓝色矩形
label1s = points[labels.ravel() == 1]  # 分出标志为1的点
plt.scatter(label1s[:, 0], label1s[:, 1], 80, 'r', '^')  # 将标志为1的点绘制为红色三角形
newpoint = np.random.randint(0, 100, (1, 2))  # 随机选择一个点，下面确定其分类
plt.scatter(newpoint[:, 0], newpoint[:, 1], 80, 'g', 'o')  # 将待分类新点绘制为绿色圆点
plt.show()
# 进一步，使用kNN算法确认待分类新点的类别、3个最近邻居和与邻居的距离。
knn = cv2.ml.KNearest_create()  # 创建kNN分类器
knn.train(points.astype(np.float32), cv2.ml.ROW_SAMPLE, labels.astype(np.float32))  # 训练模型
ret, results, neighbours, dist = knn.findNearest(newpoint.astype(np.float32), 3)  # 找出3个最近邻居
print("新点标志:  %s" % results)
print("邻居: %s" % neighbours)
print("距离：%s" % dist)