您当前的位置：首页 > IT编程 > python
\| C语言 \| Java \| VB \| VC \| python \| Android \| TensorFlow \| C++ \| oracle \| 学术与代码 \| cnn卷积神经网络 \| gnn \| 图像修复 \| Keras \| 数据集 \| Neo4j \| 自然语言处理 \| 深度学习 \| 医学CAD \| 医学影像 \| 超参数 \| pointnet \| pytorch \| 异常检测 \| Transformers \| 情感分类 \| 知识图谱 \|

自学教程：如何基于opencv实现简单的数字识别

51自学网 2021-10-30 22:13:12

python

这篇教程如何基于opencv实现简单的数字识别写得很实用，希望能帮到您。

前言

由于自己学识尚浅，不能用python深度学习来识别这里的数字，所以就完全采用opencv来识别数字，然后在这里分享、记录一下自己在学习过程中的一些所见所得和所想

要解决的问题

这是一个要识别的数字，我这里首先是对图像进行一个ROI的提取，提取结果就仅仅剩下数字，把其他的一些无关紧要的要素排除在外，

这是ROI图片，我们要做的就是识别出该照片中的数字，

解决问题的思路

1、先把这个图片中的数字分割，分割成为5张小图片，每张图片包含一个数字，为啥要分割呢？因为我们没办法让计算机知道这个数字是多少，所以只能根据特征，让计算机去识别特征，然后每一个特征对应一个值，首先贴出分割图片的程序，然后在程序下方会有一段思路解释

#include <opencv2/core/core.hpp>#include <opencv.hpp>#include <opencv2/highgui/highgui.hpp>#include <opencv2/features2d/features2d.hpp>#include <opencv2/imgproc/imgproc.hpp>#include <iostream>#include <ctime>using namespace std ;using namespace cv;#include <map>Mat src_threshold;Mat src_dil;int sunImage(Mat &image);vector<Mat>ROI_image;//待测图片int main() {	clock_t start ,finish;	start=clock();	Mat src;	src=imread("D://vspic//picture//number6.jpg");	resize(src,src,Size(src.cols/7,src.rows/7));	imshow("src",src);	Mat src_gray;	cvtColor(src,src_gray,COLOR_BGR2GRAY);	//imshow("gsrc_ray",src_gray);	Mat src_blur;	blur(src_gray,src_blur,Size(9,9));	//GaussianBlur(src_gray,src_blur,Size(11,11),1,1);	Mat src_threshold;	threshold(src_blur,src_threshold,150,255,THRESH_OTSU);	//imshow("src_threshold",src_threshold);	Mat src_canny;	Canny(src_threshold,src_canny,125,255,3);	//imshow("src_canny",src_canny);	vector<vector<Point>>contours_src;	vector<Vec4i>hierarchy_src(contours_src.size());	findContours(src_canny,contours_src,hierarchy_src,RETR_EXTERNAL,CHAIN_APPROX_NONE);	Rect rect_s;	Rect choose_rect;	for (size_t i=0;i<contours_src.size();i++)	{		rect_s=boundingRect(contours_src[i]);		double width=rect_s.width;		double height= rect_s.height;		double bizhi=width/height;		if (bizhi>1.5&&height>50)		{			/*rectangle(src,rect_s.tl(),rect_s.br(),Scalar(255,255,255),1,1,0);*/			choose_rect=Rect(rect_s.x+20,rect_s.y+30,rect_s.x-30,rect_s.y-108);		}	}	Mat roi;	roi=src(choose_rect);	//imshow("src_",roi);	Mat img =roi;	Mat gray_img;	// 生成灰度图像	cvtColor(img, gray_img, CV_BGR2GRAY);	// 高斯模糊	Mat img_gau;	GaussianBlur(gray_img, img_gau, Size(3, 3), 0, 0);	// 阈值分割	Mat img_seg;	threshold(img_gau, img_seg, 0, 255, THRESH_BINARY + THRESH_OTSU);	Mat element;	element=getStructuringElement(MORPH_RECT,Size(8,8));	erode(img_seg,src_dil,element);	//imshow("src_dil",src_dil);	// 边缘检测，提取轮廓	Mat img_canny;	Canny(src_dil, img_canny, 200, 100);	//imshow("canny",img_canny);	vector<vector<Point>> contours;	vector<Vec4i> hierarchy(contours.size());	findContours(img_canny, contours, hierarchy, CV_RETR_EXTERNAL, CV_CHAIN_APPROX_NONE, Point());//寻找轮廓	int size = (int)(contours.size());//轮廓的数量	//cout<<size<<endl;6个	// 保存符号边框的序号	vector<int> num_order;//定义一个整型int容器	map<int, int> num_map;//容器，需要关键字和模板对象两个模板参数，此处定义一个int作为索引，并拥有相关连的指向int的指针	for (int i = 0; i < size; i++)   {		// 获取边框数据		Rect number_rect = boundingRect(contours[i]);		int width = number_rect.width;//获取矩形的宽		int height = number_rect.height;//获取矩形的高		// 去除较小的干扰边框，筛选出合适的区域		if (width > img.cols/20 )		{			rectangle(img,number_rect.tl(),number_rect.br(),Scalar(255,255,255),1,1,0);//绘制矩形			imshow("img",img);//显示矩形框			num_order.push_back(number_rect.x);//把矩形的x坐标放入number_order容器中，将一个新的元素添加到vector的最后面，			//位置为当前元素的下一个元素			num_map[number_rect.x] = i;//向map中存入键值对，number_rect.x是关键字，i是值			/*把矩形框的x坐标与对应的i值一起放入map容器中，形成一一对应的键值对			*/		}	}	// 按符号顺序提取	sort(num_order.begin(), num_order.end());/*把number_order容器中的内容按照从小到大的顺序排列,这里面是X的坐标*/	for (int i = 0; i < num_order.size(); i++) {		Rect number_rect = boundingRect(contours[num_map.find(num_order[i])->second]);//num_order里面放的是坐标		//cout<<"num_map的值是："<<num_map.find(num_order[i])->second<<endl;		Rect choose_rect(number_rect.x, 0, number_rect.width, img.rows);//矩形左上角x,y的坐标以及矩形的宽和高		Mat number_img = img(choose_rect);		resize(number_img,number_img,Size(30,100));//归一化尺寸		ROI_image.push_back(number_img);//保存为待测图片		//imshow("number" + to_string(i), number_img);		char name[50];		sprintf_s(name,"D://vs2012//model//%d.jpg",i);//保存模板		imwrite(name, number_img);		}	cout<<"图片分割完毕"<<endl;	//加载模板	vector<Mat>temptImage;//存放模板	for (int i=0;i<4;i++)	{		char name[50];		sprintf_s(name,"D://vs2012//model//%d.jpg",i);		Mat temp;		temp=imread(name);		//cout<<"加载模板图片通道数："<<temp.channels()<<endl;		temptImage.push_back(temp);	}	vector<int>seq;//存放顺序结果	for (int i=0;i<ROI_image.size();i++)	{		Mat subImage;		int sum=0;		int min=50000;		int seq_min=0;//记录最小的和对应的数字		for (int j=0;j<4;j++)		{			absdiff(ROI_image[i],temptImage[j],subImage);//待测图片像素减去模板图片像素			sum=sunImage(subImage);//统计像素和			if (sum<min)			{				min=sum;			    seq_min=j;			}			sum=0;		}		seq.push_back(seq_min);	}	cout<<"输出数字匹配结果:";//endl是换行的意思	for (int i=0;i<seq.size();i++)//输出结果，小数点固定在第3位	{		cout<<seq[i];		if (i==1)		{			cout<<".";		}	}	finish=clock();	double all_time=double(finish-start)/CLOCKS_PER_SEC;	/*cout<<"运行总时间是："<<all_time<<endl;*/	waitKey(0);	return 0;}//计算像素和int sunImage(Mat &image){	int sum=0;	for (int i=0;i<image.cols;i++)	{		for (int j=0;j<image.rows;j++)		{			sum+=image.at<uchar>(j,i);		}	}	return sum;}

整体思路是这样子的：0-9这10个数字也都是已经被分割好的，并且保存好了，也就是模板，然后我们把待测的图片也分割掉，然后从0-9模板文件夹中去读取模板图片，让待测的分割完毕的图片去和10个模板逐个相减，然后去统计他们相减后的像素和，如果这个在这10个中最低，那么他们就是同一个数字，然后输出值就可以了，分割后的大概是这样

上边是第一种方法，然后还有第二种，是穿针引线的方法，是根据晶体管数字特征来识别的

这是晶体管数字的特征，每个0-9每个数字都是不一样的，我们下一篇文章再做详细的介绍

总结

到此这篇关于如何基于opencv实现简单的数字识别的文章就介绍到这了,更多相关opencv实现数字识别内容请搜索51zixue.net以前的文章或继续浏览下面的相关文章希望大家以后多多支持51zixue.net！

Python结合Selenium简单实现Web自动化测试
关于Python中字符串的各种操作

自学教程：如何基于opencv实现简单的数字识别

目录

前言

要解决的问题

解决问题的思路

总结