当前位置：首页 > 数码 > 正文内容

多层感知机在深度学习中扮演的重要角色 (多层感知机的缺点)

admin2年前 (2024-05-03)数码298

深度学习是一种强大的机器学习技术，已经在各个领域取得了显著的成果。多层感知机（Multilayer Perceptron，MLP）是深度学习的基础模型之一，发挥着重要的作用。本文将介绍多层感知机在深度学习中的作用，并探讨其优势和应用场景。

一、多层感知机的基本原理

多层感知机是一种前馈神经网络模型，由多个神经元层组成。每个神经元层都与前一层的所有神经元相连，通过权重和激活函数的组合来实现非线性映射。多层感知机通过多个隐藏层的叠加，可以学习到更加复杂的特征表示，从而提高模型的表达能力。

二、多层感知机在深度学习中的作用

特征提取

多层感知机可以通过多个隐藏层的组合，学习到更加抽象和高级的特征表示。这些特征可以捕捉到数据中的更深层次的结构和模式，从而提高模型的性能。

非线性映射

多层感知机通过激活函数的非线性变换，可以实现对非线性关系的建模。这使得多层感知机能够处理更加复杂的数据，如图像、语音等。

解决高维问题

多层感知机可以通过增加隐藏层的数量和神经元的数量，来处理高维数据。这使得多层感知机在处理大规模数据和复杂任务时具有优势。

模型的泛化能力

多层感知机通过多个隐藏层的组合，可以学习到更加泛化的特征表示。这使得多层感知机在处理未见过的数据时具有较好的泛化能力。

三、多层感知机的应用场景

图像识别

多层感知机在图像识别任务中具有广泛的应用。通过多个隐藏层的组合，多层感知机可以学习到图像中的更加抽象和高级的特征表示，从而提高图像识别的准确性。

自然语言处理

多层感知机在自然语言处理任务中也有重要的应用。通过多个隐藏层的组合，多层感知机可以学习到文本中的更深层次的语义信息，从而提高自然语言处理的效果。

语音识别

多层感知机在语音识别任务中也发挥着重要的作用。通过多个隐藏层的组合，多层感知机可以学习到语音中的更加抽象和高级的特征表示，从而提高语音识别的准确性。

四、结论

多层感知机作为深度学习的基础模型之一，在深度学习中发挥着重要的作用。它通过多个隐藏层的组合，可以学习到更加复杂和抽象的特征表示，从而提高模型的表达能力和泛化能力。多层感知机在图像识别、自然语言处理、语音识别等领域具有广泛的应用场景。多层感知机在处理大规模数据和复杂任务时也面临一些挑战，需要进一步的研究和改进。

身为电气工程师的你懂机器视觉吗?为什么它这么厉害?

机器视觉是通过计算机来模拟人类视觉功能，以让机器获得相关视觉信息和加以理解。可分为“视”和“觉”两部分原理。

“视”是将外界信息通过成像来显示成数字信号反馈给计算机，需要依靠一整套的硬件解决方案，包括光源、相机、图像采集卡、视觉传感器等。“觉”则是计算机对数字信号进行处理和分析，主要是软件算法。

机器视觉在工业上应用领域广阔，核心功能包括：测量、检测、识别、定位等。

产业链可以分为上游部件级市场、中游系统集成/整机装备市场和下游应用市场。

机器视觉上游有光源、镜头、工业相机、图像采集卡、图像处理软件等软硬件提供商，中游有集成和整机设备提供商，行业下游应用较广，主要下游市场包括电子制造行业、汽车、印刷包装、烟草、农业、医药、纺织和交通等领域。

机器视觉全球市场主要分布在北美、欧洲、日本、中国等地区，根据统计数据，2014年，全球机器视觉系统及部件市场规模是 36.7 亿美元，2015年全球机器视觉系统及部件市场规模是42亿美元，2016年全球机器视觉系统及部件市场规模是62亿美元，2002-2016年市场年均复合增长率为12%左右。而机器视觉系统集成，根据北美市场数据估算，大约是视觉系统及部件市场的6倍。

中国机器视觉起步于80年代的技术引进，随着98年半导体工厂的整线引进，也带入机器视觉系统，06年以前国内机器视觉产品主要集中在外资制造企业，规模都较小，06年开始，工业机器视觉应用的客户群开始扩大到印刷、食品等检测领域，2011年市场开始高速增长，随着人工成本的增加和制造业的升级需求，加上计算机视觉技术的快速发展，越来越多机器视觉方案渗透到各领域，到2016年我国机器视觉市场规模已达近70亿元。

机器视觉中，缺陷检测功能，是机器视觉应用得最多的功能之一，主要检测产品表面的各种信息。在现代工业自动化生产中，连续大批量生产中每个制程都有一定的次品率，单独看虽然比率很小，但相乘后却成为企业难以提高良率的瓶颈，并且在经过完整制程后再剔除次品成本会高很多（例如，如果锡膏印刷工序存在定位偏差，且该问题直到芯片贴装后的在线测试才被发现，那么返修的成本将会是原成本的100倍以上），因此及时检测及次品剔除对质量控制和成本控制是非常重要的，也是制造业进一步升级的重要基石。

1.在检测行业，与人类视觉相比，机器视觉优势明显

1）精确度高：人类视觉是64灰度级，且对微小目标分辨力弱；机器视觉可显著提高灰度级，同时可观测微米级的目标；

2）速度快：人类是无法看清快速运动的目标的，机器快门时间则可达微秒级别；

3）稳定性高：机器视觉解决了人类一个非常严重的问题，不稳定，人工目检是劳动非常枯燥和辛苦的行业，无论你设计怎样的奖惩制度，都会发生比较高的漏检率。但是机器视觉检测设备则没有疲劳问题，没有情绪波动，只要是你在算法中写好的东西，每一次都会认真执行。在质控中大大提升效果可控性。

4）信息的集成与留存：机器视觉获得的信息量是全面且可追溯的，相关信息可以很方便的集成和留存。

2.机器视觉技术近年发展迅速

1）图像采集技术发展迅猛

CCD、CMOS等固件越来越成熟，图像敏感器件尺寸不断缩小，像元数量和数据率不断提高，分辨率和帧率的提升速度可以说日新月异，产品系列也越来越丰富，在增益、快门和信噪比等参数上不断优化，通过核心测试指标（MTF、畸变、信噪比、光源亮度、均匀性、色温、系统成像能力综合评估等）来对光源、镜头和相机进行综合选择，使得很多以前成像上的难点问题得以不断突破。

2）图像处理和模式识别发展迅速

图像处理上，随着图像高精度的边缘信息的提取，很多原本混合在背景噪声中难以直接检测的低对比度瑕疵开始得到分辨。

模式识别上，本身可以看作一个标记过程，在一定量度或观测的基础上，把待识模式划分到各自的模式中去。图像识别中运用得较多的主要是决策理论和结构方法。决策理论方法的基础是决策函数，利用它对模式向量进行分类识别，是以定时描述（如统计纹理）为基础的；结构方法的核心是将物体分解成了模式或模式基元，而不同的物体结构有不同的基元串（或称字符串），通过对未知物体利用给定的模式基元求出编码边界，得到字符串，再根据字符串判断它的属类。在特征生成上，很多新算法不断出现，包括基于小波、小波包、分形的特征，以及独二分量分析；还有关子支持向量机，变形模板匹配，线性以及非线性分类器的设计等都在不断延展。

3）深度学习带来的突破

传统的机器学习在特征提取上主要依靠人来分析和建立逻辑，而深度学习则通过多层感知机模拟大脑工作，构建深度神经网络（如卷积神经网络等）来学习简单特征、建立复杂特征、学习映射并输出，训练过程中所有层级都会被不断优化。在具体的应用上，例如自动ROI区域分割；标点定位（通过防真视觉可灵活检测未知瑕疵）；从重噪声图像重检测无法描述或量化的瑕疵如橘皮瑕疵；分辨玻璃盖板检测中的真假瑕疵等。随着越来越多的基于深度学习的机器视觉软件推向市场（包括瑞士的vidi，韩国的SUALAB，香港的应科院等），深度学习给机器视觉的赋能会越来越明显。

4）3d视觉的发展

3D视觉还处于起步阶段，许多应用程序都在使用3D表面重构，包括导航、工业检测、逆向工程、测绘、物体识别、测量与分级等，但精度问题限制了3D视觉在很多场景的应用，目前工程上最先铺开的应用是物流里的标准件体积测量，相信未来这块潜力巨大。

3.要全面替代人工目检，机器视觉还有诸多难点有待攻破

1）光源与成像：机器视觉中优质的成像是第一步，由于不同材料物体表面反光、折射等问题都会影响被测物体特征的提取，因此光源与成像可以说是机器视觉检测要攻克的第一个难关。比如现在玻璃、反光表面的划痕检测等，很多时候问题都卡在不同缺陷的集成成像上。

2）重噪音中低对比度图像中的特征提取：在重噪音环境下，真假瑕疵的鉴别很多时候较难，这也是很多场景始终存在一定误检率的原因，但这块通过成像和边缘特征提取的快速发展，已经在不断取得各种突破。

3）对非预期缺陷的识别：在应用中，往往是给定一些具体的缺陷模式，使用机器视觉来识别它们到底有没有发生。但经常遇到的情况是，许多明显的缺陷，因为之前没有发生过，或者发生的模式过分多样，而被漏检。如果换做是人，虽然在操作流程文件中没让他去检测这个缺陷，但是他会注意到，从而有较大几率抓住它，而机器视觉在这点上的“智慧”目前还较难突破。

4.机器视觉产业链情况

1）上游部件级市场

主要包括光源、镜头、工业相机、图像采集卡、图像处理软件等提供商，近几年智能相机、工业相机、光源和板卡都保持了不低于20%的增速。根据中国机器视觉产业联盟（CMVU）调查统计，现在已进入中国的国际机器视觉品牌已近200多家（如康耐视、达尔萨、堡盟等为代表的核心部件制造商，以基恩士、欧姆龙、松下、邦纳、NI等为代表的则同时涉足机器视觉核心部件和系统集成），中国自有的机器视觉品牌也已有100多家（如海康、华睿、盟拓光电、神州视觉、深圳灿锐、上海方诚、上海波创电气等），机器视觉各类产品代理商超过300家（如深圳鸿富视觉、微视新纪元、三宝兴业、凌云光、阳光视觉等）。很多国内机器视觉的部件市场都是从代理国外品牌开始，很多企业均与国外的同行有较好的合作，且这种合作具有一定的排他性，这给潜在进入者带来了一定的门槛，因此优质产品的代理商也都有不错的市场竞争力和利润表现。同时，以海康、华睿为代表的国产工业视觉核心部件正在快速崛起。

2）中游系统集成和整机装备市场

国内中游的系统集成和整机装备商有100多家，他们可以给各行业自动化公司提供综合的机器视觉方案，如凌云光、微视新纪元、嘉恒、凌华、阳光视觉、鼎信、大恒图像等。由于国内产品与国际依然有不小差距，很多中游系统集成商和整机装备商又是从核心零部件的贸易做起来的，因此很多在视觉产品的选择方面，依然更为青睐国外品牌。国内品牌为推广自己的软硬件产品，往往需要发展自己的方案集成能力，才能更好的面对市场竞争。

3）下游应用市场

机器视觉下游，主要是给终端用户提供非标自动化综合解决方案的公司，行业属性非常强，核心竞争力是对行业和生产的综合理解和多类技术整合。由于行业自动化的更迭有一定周期性，深受行业整体升级速度、出货量和利润状况影响，因此近两年来看，拉动机器视觉应用普及最主要的还是在电子制造业，其次是汽车和制药。

i. 半导体和电子生产行业：从国内机器视觉工业上的应用分布来看，46％都集中在电子及半导体制造行业，包括晶圆加工制造的分类切割、PCB检测（底片、内／外层板、成品外观终检等）、SMT贴装检测、LCD全流程的AOI缺陷检测、各种3c组件的表面缺陷检测、3c产品外观检测等

ii.汽车：车身装配检测、零件的几何尺寸和误差测量、表面和内部缺陷检测、间隙检测等

iii. 印刷、包装检测：烟草外壳印刷、食品的包装和印刷、药品的铝塑板包装和印刷等

iv. 农业：对农产品的分级、检验和分类

v. 纺织：对异纤、云织、经疵、纬疵等瑕疵检测、织物表面绒毛鉴定、纱线结构分析等等。

5.机器视觉系统未来发展趋势

1）嵌入式解决方案发展迅猛，智能相机性能与成本优势突出，嵌入式PC会越来越强大

2）模块化的通用型软件平台和人工智能软件平台将降低开发人员技术要求和缩短开发周期

3）3d视觉将走向更多应用场景

如何通过Python进行深度学习？

摘要：深度学习背后的主要原因是人工智能应该从人脑中汲取灵感。本文就用一个小例子无死角的介绍一下深度学习！

人脑模拟

深度学习背后的主要原因是人工智能应该从人脑中汲取灵感。此观点引出了“神经网络”这一术语。人脑中包含数十亿个神经元，它们之间有数万个连接。很多情况下，深度学习算法和人脑相似，因为人脑和深度学习模型都拥有大量的编译单元（神经元），这些编译单元（神经元）在独立的情况下都不太智能，但是当他们相互作用时就会变得智能。

我认为人们需要了解到深度学习正在使得很多幕后的事物变得更好。深度学习已经应用于谷歌搜索和图像搜索，你可以通过它搜索像“拥抱”这样的词语以获得相应的图像。－杰弗里·辛顿

神经元

神经网络的基本构建模块是人工神经元，它模仿了人类大脑的神经元。这些神经元是简单、强大的计算单元，拥有加权输入信号并且使用激活函数产生输出信号。这些神经元分布在神经网络的几个层中。

inputs 输入 outputs 输出 weights 权值 activation 激活

人工神经网络的工作原理是什么？

深度学习由人工神经网络构成，该网络模拟了人脑中类似的网络。当数据穿过这个人工网络时，每一层都会处理这个数据的一方面，过滤掉异常值，辨认出熟悉的实体，并产生最终输出。

输入层：该层由神经元组成，这些神经元只接收输入信息并将它传递到其他层。输入层的图层数应等于数据集里的属性或要素的数量。输出层：输出层具有预测性，其主要取决于你所构建的模型类型。隐含层：隐含层处于输入层和输出层之间，以模型类型为基础。隐含层包含大量的神经元。处于隐含层的神经元会先转化输入信息，再将它们传递出去。随着网络受训练，权重得到更新，从而使其更具前瞻性。

神经元的权重

权重是指两个神经元之间的连接的强度或幅度。你如果熟悉线性回归的话，可以将输入的权重类比为我们在回归方程中用的系数。权重通常被初始化为小的随机数值，比如数值0-1。

前馈深度网络

前馈监督神经网络曾是第一个也是最成功的学习算法。该网络也可被称为深度网络、多层感知机（MLP）或简单神经网络，并且阐明了具有单一隐含层的原始架构。每个神经元通过某个权重和另一个神经元相关联。

该网络处理向前处理输入信息，激活神经元，最终产生输出值。在此网络中，这称为前向传递。

inputlayer 输入层 hidden layer 输出层 output layer 输出层

激活函数

激活函数就是求和加权的输入到神经元的输出的映射。之所以称之为激活函数或传递函数是因为它控制着激活神经元的初始值和输出信号的强度。

用数学表示为：

我们有许多激活函数，其中使用最多的是整流线性单元函数、双曲正切函数和solfPlus函数。

激活函数的速查表如下：

反向传播

在网络中，我们将预测值与预期输出值相比较，并使用函数计算其误差。然后，这个误差会传回这个网络，每次传回一个层，权重也会根绝其导致的误差值进行更新。这个聪明的数学法是反向传播算法。这个步骤会在训练数据的所有样本中反复进行，整个训练数据集的网络更新一轮称为一个时期。一个网络可受训练数十、数百或数千个时期。

prediction error 预测误差

代价函数和梯度下降

代价函数度量了神经网络对给定的训练输入和预期输出“有多好”。该函数可能取决于权重、偏差等属性。

代价函数是单值的，并不是一个向量，因为它从整体上评估神经网络的性能。在运用梯度下降最优算法时，权重在每个时期后都会得到增量式地更新。

兼容代价函数

用数学表述为差值平方和：

target 目标值 output 输出值

权重更新的大小和方向是由在代价梯度的反向上采取步骤计算出的。

其中η 是学习率

其中Δw是包含每个权重系数w的权重更新的向量，其计算方式如下：

target 目标值 output 输出值

图表中会考虑到单系数的代价函数

initial weight 初始权重 gradient 梯度 global cost minimum 代价极小值

在导数达到最小误差值之前，我们会一直计算梯度下降，并且每个步骤都会取决于斜率（梯度）的陡度。

多层感知器（前向传播）

这类网络由多层神经元组成，通常这些神经元以前馈方式（向前传播）相互连接。一层中的每个神经元可以直接连接后续层的神经元。在许多应用中，这些网络的单元会采用S型函数或整流线性单元（整流线性激活）函数作为激活函数。

要解决这个问题，首先，我们需要先创建一个前向传播神经网络。我们的输入层将是家庭成员和账户的数量，隐含层数为1，输出层将是处理次数。

将图中输入层到输出层的给定权重作为输入：家庭成员数为2、账户数为3。

现在将通过以下步骤使用前向传播来计算隐含层（i，j）和输出层（k）的值。

步骤：

1，乘法－添加方法。

2，点积（输入＊权重）。

3，一次一个数据点的前向传播。

4，输出是该数据点的预测。

i的值将从相连接的神经元所对应的输入值和权重中计算出来。

i = (2 * 1) + (3* 1) → i = 5

同样地，j = (2 * -1) + (3 * 1) → j =1

K = (5 * 2) + (1* -1) → k = 9

Python中的多层感知器问题的解决

激活函数的使用

为了使神经网络达到其最大预测能力，我们需要在隐含层应用一个激活函数，以捕捉非线性。我们通过将值代入方程式的方式来在输入层和输出层应用激活函数。

这里我们使用整流线性激活（ReLU）:

用Keras开发第一个神经网络

关于Keras：

Keras是一个高级神经网络的应用程序编程接口，由Python编写，能够搭建在TensorFlow,CNTK,或Theano上。

使用PIP在设备上安装Keras,并且运行下列指令。

在keras执行深度学习程序的步骤

1，加载数据；

2，创建模型；

3，编译模型；

4，拟合模型；

5，评估模型。

开发Keras模型

全连接层用Dense表示。我们可以指定层中神经元的数量作为第一参数，指定初始化方法为第二参数，即初始化参数，并且用激活参数确定激活函数。既然模型已经创建，我们就可以编译它。我们在底层库（也称为后端）用高效数字库编译模型，底层库可以用Theano或TensorFlow。目前为止，我们已经完成了创建模型和编译模型，为进行有效计算做好了准备。现在可以在PIMA数据上运行模型了。我们可以在模型上调用拟合函数f（），以在数据上训练或拟合模型。

我们先从KERAS中的程序开始，

神经网络一直训练到150个时期，并返回精确值。

免责声明：本文转载或采集自网络，版权归原作者所有。本网站刊发此文旨在传递更多信息，并不代表本网赞同其观点和对其真实性负责。如涉及版权、内容等问题，请联系本网，我们将在第一时间删除。同时，本网站不对所刊发内容的准确性、真实性、完整性、及时性、原创性等进行保证，请读者仅作参考，并请自行核实相关内容。对于因使用或依赖本文内容所产生的任何直接或间接损失，本网站不承担任何责任。

标签: 深度学习