banner

人脸识别算法路理历程详解

发布时间:2022-01-29 06:31:23   作者:爱游戏体育首页   来源:爱游戏体育平台官网

  近来因为职责需求为了找到一款高效的人脸识别算法对各类人脸识别算法都咨议了一番以下纪录的是各算法的表面根柢。

  Proposal Network (P-Net)该汇集机闭重要取得了人脸区域的候选窗口和范围框的回归向量。并用该范围框做回归对候选窗口举行校准然后通过非极大值箝造NMS来统一高度重叠的候选框。

  由于本质的图片巨细纷歧以是PNet是一个全卷积汇集对待输入的图片巨细可能是随意值将图片输入PNet之前有一个轮回每一次轮回会将图片举行缩放再输入PNet如此造成一个图片金字塔图片每次缩放因子是0.80论文的初始值该当是0.709当宽高幼于12时辰这张图片对应的轮回结尾12是PNet的最幼图片输入尺寸。下图流露的是PNet的机闭

  由上面这张图可能获得一张12x12x3的图片最终的输出的结果是1x1x32的特色图再分成三条岔途用于人脸分类、边框回归、人脸特色点定位。

  这三条岔途的牺牲函数分散是交叉熵二分类题目常用、平方和牺牲函数、5个特色点与标定好的数据的平方和牺牲。末了的总牺牲是三个牺牲乘上各自的权重比之和正在PNet内中三种牺牲的权重是10.50.5。将图片输入PNet后获得了cls_cls_map, reg这两个数组此中cls_cls_map是H,W,2)的二维数组就口角人脸和人脸的概率。PNet直接输出的范围框并不是古板回归中的范围坐标而是预测人脸身分相对待输入图片的身分差即为reg。

  竣事这一步后将行使非极大值箝造法NMS去掉少少反复框这个算法的道理是将上一步返回的数组的score值最大的那一行元素提取出来将剩下的完全的元素的score和一个设定好的阈值比拟较将score值大于阈值(0.5)的元素唾弃再将剩下的元素反复之前的提取最大值并举行比拟的操作。直到末了如此就开端唾弃了那些重合度较高的人脸框。

  最初将PNet的输出resize成正方形这重若是基于人脸通常都是正方形的。

  正在天生的流程还会有检测避免bbox的坐标越过原始图片或者为负值接下来遍历这个数组将内中的bbox从原始图片内中抠出来resize成24x24同时举行归一化。

  竣事了前面的操作后即是将24x24的图片喂入RNet了下图流露的是RNet的机闭:

  可能看出RNet末了是采用的全衔接层这也是为什么喂入的图片团结成24x24巨细。

  由上面这张图可能获得一张24x24x3的图片最终的输出的结果是3x3x64的特色图再通过全衔接层后分成三条岔途用于人脸分类、边框回归、人脸特色点定位。这三条岔途的牺牲函数和PNet的相同各牺牲的权重比也为10.50.5。

  接着再次移用NMS唾弃掉大方的重叠率高的人脸框历程两次的筛选剩下的bbox的数目就少了许多。末了举行RNet的末了一步操作即是回归消息reg来调理bbox的坐标大致即是将bbox的4个坐标乘上bbox的宽或者高此中x和宽相乘y和高相。