证件照背景分割

论坛 期权论坛 编程之家     
选择匿名的用户   2021-5-29 23:40   107   0

K-means算法是硬聚类算法,是典型的基于原型的目标函数聚类方法的代表,它是数据点到原型的某种距离作为优化的目标函数,利用函数求极值的方法得到迭代运算的调整规则。

1、data:为cv::Mat类型,每行代表一个样本,即特征,即mat.cols=特征长度,mat.rows=样本数,数据类型仅支持float;

2、K:指定聚类时划分为几类;

3、bestLabels:为cv::Mat类型,是一个长度为(样本数,1)的矩阵,即mat.cols=1,mat.rows=样本数;为K-Means算法的结果输出,指定每一个样本聚类到哪一个label中;

4、criteria:TermCriteria类,算法进行迭代时终止的条件,可以指定最大迭代次数,也可以指定预期的精度,也可以这两种同时指定;

5、attempts:指定K-Means算法执行的次数,每次算法执行的结果是不一样的,选择最好的那次结果输出;

6、flags:初始化均值点的方法,目前支持三种:KMEANS_RANDOM_CENTERS、KMEANS_PP_CENTERS、KMEANS_USE_INITIAL_LABELS;

7、centers:为cv::Mat类型,输出最终的均值点,mat.cols=特征长度,mat.rols=K.

一般当attempts和TermCriteria中迭代次数值越大时,聚类效果越好。

工作原理

首先从n个数据对象任意选择 k 个对象作为初始聚类中心;而对于所剩下其它对象,则根据它们与这些聚类中心的相似度(距离),分别将它们分配给与其最相似的(聚类中心所代表的)聚类;然 后再计算每个所获新聚类的聚类中心(该聚类中所有对象的均值);不断重复这一过程直到标准测度函数开始收敛为止。

证件照背景分割操作步骤

1、数据组装

2、KMeans分割kmeans()

3、去背景

4、遮罩生成

5、形态学腐蚀 getStructuringElement()

6、高斯模糊GaussianBlur

7、通道混合

源代码

#include <opencv2/opencv.hpp>
#include <iostream>

using namespace cv;
using namespace std;

Mat mat_samples(Mat &image) {
 int w = image.cols;
 int h = image.rows;
 int samplecount = w*h;
 int dims = image.channels();
 Mat points(samplecount, dims, CV_32F, Scalar(10));

 int index = 0;
 for (int row = 0; row < h; row++) {
  for (int col = 0; col < w; col++) {
   index = row*w + col;
   Vec3b bgr = image.at<Vec3b>(row, col);
   points.at<float>(index, 0) = static_cast<int>(bgr[0]);
   points.at<float>(index, 1) = static_cast<int>(bgr[1]);
   points.at<float>(index, 2) = static_cast<int>(bgr[2]);
  }
 }
 return points;
}

int main(int argc, char** argv) {
 Mat src = imread("C:/Users/thinkpad/Desktop/SeetaEye/SeetaEye/1.jpg");
 if (src.empty()) {
  printf("could not load image!\n");
  return -1;
 }
 namedWindow("input image", CV_WINDOW_AUTOSIZE);
 imshow("input image", src);

 // 组装数据
 Mat points = mat_samples(src);
 // KMeans分割
 int numCluster = 4;
 Mat labels;
 Mat centers;
 TermCriteria criteria = TermCriteria(TermCriteria::EPS + TermCriteria::COUNT, 10, 0.1);
 kmeans(points, numCluster, labels, criteria, 3, KMEANS_PP_CENTERS, centers);

 // 去背景+遮罩生成
 Mat mask=Mat::zeros(src.size(), CV_8UC1);
 int index = src.rows*2 + 2;
 int cindex = labels.at<int>(index, 0);
 int height = src.rows;
 int width = src.cols;
 //Mat dst;
 //src.copyTo(dst);
 for (int row = 0; row < height; row++) {
  for (int col = 0; col < width; col++) {
   index = row*width + col;
   int label = labels.at<int>(index, 0);
   if (label == cindex) { 
    // 背景
    //dst.at<Vec3b>(row, col)[0] = 0;
    //dst.at<Vec3b>(row, col)[1] = 0;
    //dst.at<Vec3b>(row, col)[2] = 0;
    mask.at<uchar>(row, col) = 0; 
   } else {
    mask.at<uchar>(row, col) = 255;//前景
   }
  }
 }
 //imshow("mask", mask);

 // 形态学腐蚀 
 Mat k = getStructuringElement(MORPH_RECT, Size(3, 3), Point(-1, -1));
 erode(mask, mask, k);
 //imshow("erode-mask", mask);
 // 高斯模糊
 GaussianBlur(mask, mask, Size(3, 3), 0, 0);
 //imshow("Blur Mask", mask);

 // 通道混合
 Vec3b color;
 //蓝色B:219、G142、R67
 //白色B:255、G255、R255
 color[0] = 255;
 color[1] = 255;
 color[2] = 255;
 Mat result(src.size(), src.type());

 double w = 0.0;
 int b = 0, g = 0, r = 0;
 int b1 = 0, g1 = 0, r1 = 0;
 int b2 = 0, g2 = 0, r2 = 0;

 for (int row = 0; row < height; row++) {
  for (int col = 0; col < width; col++) {
   int m = mask.at<uchar>(row, col);
   if (m == 255) {
    result.at<Vec3b>(row, col) = src.at<Vec3b>(row, col); // 前景
   }
   else if (m == 0) {
    result.at<Vec3b>(row, col) = color; // 背景
   } 
   else {
    w = m / 255.0;
    b1 = src.at<Vec3b>(row, col)[0];
    g1 = src.at<Vec3b>(row, col)[1];
    r1 = src.at<Vec3b>(row, col)[2];

    b2 = color[0];
    g2 = color[1];
    r2 = color[2];

    b = b1*w + b2*(1.0 - w);
    g = g1*w + g2*(1.0 - w);
    r = r1*w + r2*(1.0 - w);

    result.at<Vec3b>(row, col)[0] = b;
    result.at<Vec3b>(row, col)[1] = g;
    result.at<Vec3b>(row, col)[2] = r;
   }
  }
 }
 imshow("output image", result);

 waitKey(0);
 return 0;
}

运行结果

分享到 :
0 人收藏
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

积分:3875789
帖子:775174
精华:0
期权论坛 期权论坛
发布
内容

下载期权论坛手机APP