第7讲 人工神经网络

You might also like

Download as pdf or txt
Download as pdf or txt
You are on page 1of 28

中 中 中 中 中

国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C
张宁

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
中央财经大学金融学院

学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C
邮箱:zhang-ning@vip.163.com

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
第七章人工神经网络

C C C C

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C
M

M





教师介绍
C

C
O

O
O

O
M

M



• 张宁,中央财经大学金融学院教授,博士生导师,中央财经大学中国



金融科技研究中心主任、金融科技专业负责人;
• 学术兼职包括:中国人工智能学会 委员、中国银保监会偿咨委委员、
C

C
O

O
家族办公室合作与发展组织理事会主席兼首席经济学家、生命质量研
O

O
M

M
究会理事长、中关村金融科技产业联盟专家委员会副主任委员、北京




市两区建设咨询专家、石景山区数字金融高级顾问、科技部国家科技


评估中心及火炬中心评议专家等。
• 累计在《中国科学》等权威期刊发表论文52篇,出版专著编著教材23
C

C
O

O
O

O
本,多次参与金融科技、平台经济、金融保险、健康金融相关政策咨
M

M


询建议及标准制定,作为骨干成员获评第二批全国高校黄大年式教学




团队、起草编写了多个教育部1+X职业标准(如健康财富规划师等),
通用生命质量理论和知识经济框架的提出者和健康金融的推动者。
C

C
O

O
O

O
M

M



2



中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C
本讲内容

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C
二.神经元模型与感知机

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C
三.人工神经网络在金融领域的应用
一.人工神经网络概述及其应用场景

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C

中 中 中 中 中
3

国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C
中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C
一、人工神经网络概述及其应用场景

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C
中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
从这里开始

M M M M M
O O O O
O O O O
C C C C

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C
中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C
结构的数学化

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
zϵR表示一个神经元所获得的输入信号x的加权和,

M M M M M
O O O O
O O O O
C C C C
假设一个神经元接收D个输入x1 ,x2 ,…,xD ,令向量

中 中 中 中 中
国 国 国 国 国
x=[x1;x2;…;xD]来表示这组输入,并用净输入(Net Input)

大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C
中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C

(Nielsen)
中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
Neural Network,ANN

O O O O
O O O O
C C C C

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C
1.1 定义:人工神经网络,Artificial

中 中 中 中 中
它通过对连续或断续的输入进行信息处理并做出相应的状态。

国 国 国 国 国
• 人工神经网络(Artificial Neural Network,ANN),简称神经网络

大 大 大 大 大
能,并在不同程度和层次上模仿人脑神经系统的信息处理能力。

学 学 学 学 学
(NN),是对人脑或自然神经网络若干基本特征的抽象和模拟。

M M M M M
质是通过网络变换和动力学行为得到一种并行分布式的信息处理功
• 作为一种非程序化、适应性、大脑风格的信息处理,神经网络的本
• 人工神经网络是由人工建立的,以有向图为拓扑结构的动态系统,

O O O O
O O O O
C C C C

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C
中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
1.2 人工神经网络的发展

O O O O
C C C C

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C
中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C
系统等智能信息系统……

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
研究领域取得了广泛的成功。

O O O O
C C C C

中 中 中 中 中
国 国 国 国 国
电信号的识别和处理等获得了广泛应用。

大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C

中 中 中 中 中
国 国 国 国 国
1.3 人工神经网络的应用场景

大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C
• 金融:股票市场的预测,风险分析,价格预测……

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C
• 交通:交通仿真、车辆检测、交通流量预测、自动导航、交通控制……

中 中 中 中 中
• 医学:在医疗专家系统,脑电信号、听觉诱发电位信号、肌电和胃肠电、心
• 信息:智能仪器、自动跟踪监测仪器、自动控制导航系统、故障诊断与预警
经过几十年的发展,神经网络理论在信息、医学金融、交通等众多

国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C
中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C

中 中 中 中 中
二、神经元模型与感知机

国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C
中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C

中 中 中 中 中
2.1 神经元与激活函数

国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
zϵR表示一个神经元所获得的输入信号x的加权和,

M M M M M
O O O O
O O O O
C C C C
假设一个神经元接收D个输入x1 ,x2 ,…,xD ,令向量

中 中 中 中 中
国 国 国 国 国
x=[x1;x2;…;xD]来表示这组输入,并用净输入(Net Input)

大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C
中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C

算效率;
激活函数

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C
大也不能太小,否则会影响训练的效率和稳定性。

中 中 中 中 中
示能力和学习能力,激活函数需要具备以下几点性质:

国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
的激活函数可以直接利用数值优化的方法来学习网络参数;

C C C C

中 中 中 中 中
• 激活函数 激活函数在神经元中非常重要的,为了增强网络的表

• (2)激活函数及其导函数要尽可能的简单,有利于提高网络计

• (3)激活函数的导函数的值域要在一个合适的区间内,不能太
• (1)连续并可导(允许少数点上不可导)的非线性函数。可导

国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C
中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O

tanh ( x ) =
C C C C
(x)=
Logistic 函数 Logistic 函数定义为

中 中 中 中 中
1

国 国 国 国 国
大 大 大 大 大

tanh ( x) = 2 (2 x) − 1
学 学 学 学 学
exp( x ) − exp( − x )
exp( x ) + exp( − x )

M M M M M
1 + exp ( - x)

O O O O
O O O O
C C C C
Tanh 函数 Tanh 函数也是一种 Sigmoid 型函数,其定义为

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
Tanh 函数可以看作是放大并平移的 Logistic 函数,其值域是(-1,1)

O O O O
O O O O
C C C C

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
常用的Sigmoid型函数有Logistic函数和Tanh函数.

学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C
Sigmoid型函数是指一类S型曲线函数,为两端饱和函数。

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C
中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C

中 中 中 中 中

号 θ 表示。
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
2.2 感知机

M M M M M
O O O O
O O O O
C C C C

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C
时,才会输出 1。这也称为“神经元被激活”

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C
。这里将这个界限值称为阈值,用符
w2x2)。神经元会计算传送过来的信号总和,只有当这个总和超过了某个界限值
是一个接收两个输入信号的感知机的例子。x1、x2 是输入信号,y 是输出信
号,w1、w2 是权重。输入信号被送往神经元时,会被分别乘以固定的权重(w1x1、

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C
中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
y=

O O O O
O O O O
C C C C
1
0

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大

y (n) 𝐰 ∗T 𝐱 (n) > 0,


学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C
将感知机的运行原理以数学形式表现为:

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
(w1 x1 + w2 x2 > θ)
(w1 x1 + w2 x2 ≤ θ)

M M M M M
O O O O
O O O O
C C C C
∀n ∈ 1, … ,N
算法试图找到一组参数 w*,使得对于每个样本(𝐱 (n) , y (n) )有

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
的重要性的作用。也就是说,权重越大,对应该权重的信号的重要性就越高。

M M M M M
O O O O
感知机的多个输入信号都有各自固有的权重,这些权重发挥着控制各个信号

给定 N 个样本的训练集:{(𝐱 (n) , y (n) )}Nn=1 ,其中𝑦 (𝑛) ∈ −1, +1 ,感知器学习

O O O O
C C C C

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C
中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
感知机训练

M M M M M
O O O O
O O O O
C C C C

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C
𝜕𝐰
𝜕L(𝐰; 𝐱, y)

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
=ቊ

学 学 学 学 学
感知机的损失函数为

M M M M M
0

O O O O
O O O O
C C C C
𝐰 ← 𝐰 + y𝐱

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
即ywTx<0,就用这个样本来更新权重。

−y𝐱 𝑖𝑓 y𝐰T𝐱 > 0.


𝑖𝑓 y𝐰T𝐱 > 0,

O O O O
L(w;x,y)= max(0,−ywTx)

C C C C
采用随机梯度下降,其每次更新的梯度为
根据以上感知机的学习策略,可以反推出
先初始化一个权重向量w←0(通常是全零
向量),然后每次分错一个样本(x,y)时,

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C
中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C
2.3 反向传播

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
• 1986年,David E. Rumelhart, Geoffrey E. Hinton和 Ronald J.

O O O O
O O O O
C C C C
Williams发表文章《Learning representations by back-propagating

中 中 中 中 中
国 国 国 国 国
errors》,重新报道这一方法,BP神经网络学习算法才受到重视。

大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C
中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C
前向传播过程

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C
第 l 层神经网络有 k 个神经元),则向量化后为:
z (l ) = ( w(l ) )T ·a (l −1) + b (l )

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C
每个神经元的输入信号 z,由参数 w、b,和前一层的输出信号 a 决定(假设

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C
中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C

的目标。
反向传播

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C
神经网络也需要经过多次迭代,才能够逼近并获得最优模型。

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
• 为了能够得到一个优质的神经网络模型,我们需要求模

学 学 学 学 学
型的两类参数w和b的最优值,以达到令损失函数值最小

• 反向传播算法:首先利用损失函数求得模型的最终误差;接着再将误差自后向前层层传

M M M M M
递,获取每个神经元的误差;最后将每层每个神经元的误差对w和b求偏导,迭代获取的

O O O O
w和b的最优解,从而构建损失函数最小的最优神经网络模型。当然,和梯度下降法类似,

O O O O
C C C C

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C
中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C
反向传播过程

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C
中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C
中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C
中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C
域中的应用

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C
三、人工神经网络在金融领

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C
M

M





案例背景
C

C
O

O
O

O
互联网技术发展改变了传统的消费方式,人们开始倾向于使用手机、
M

M


银行卡等方式消费,信用卡这种便捷的小额贷款受到了很多人的欢迎。在




人们的需求与给银行带来的利益下,经过长期发展,在2020年中国信用卡
人均持卡量已经发展为0.6张,各大银行都积极开展信用卡业务,但是巨额
C

C
的利润下还隐藏着巨大的风险,截止2020年第三季度,我国信用卡逾期半
O

O
O

O
M

M
年未偿还信贷总额超过900亿元。





给银行信用卡业务带来经济损失的风险种类很多,最主要的是信用风
险。目前迫切需要研究如何加强信用卡业务的风险管理,探索信用卡违约
C

C
的影响因素,并提前进行信用卡违约行为预测,帮助银行规避风险,减少
O

O
O

O
M

M
银行损失,建立更完善的客户信用卡风险评估体系。神经网络模型可以帮




助银行把经营风险和违约风险尽可能降到最低,同时符合银行审核速度快


且准确的要求,并且具有能够同时处理大量数据的能力,因此目前BP神经
网络已广泛应用于信用卡风险预测。
C

C
O

O
O

O
M

M
本案例针对从UCI机器学习数据库中获取的信用卡审批数据集(Credit




Approval Data Set),使用BP神经网络模型帮助银行区分好客户和坏客户,


中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
数据预处理

M M M M M
O O O O
O O O O
C C C C

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C
缩放到单位方差。

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
同意申请,符合“-”代表不同意申请。该数据集有缺失值,且数据类型不统一,需

和输出变量,采用One-Hot编码处理。在完成处理后,在690条数据中,共有307个样
本的信用卡申请通过,383个样本的信用卡申请未通过,说明该数据集为平衡面板。

学 学 学 学 学
该数据集属于多变量数据集,含有15个客户属性特征和1个输出变量。符合“+”代表

要先进行数据预处理。除处理异常值外,对于名义型变量如特征变量1、特征变量4等

M M M M M
O O O O
集与测试集的比例为9:1,归

O O O O
C C C C
一化则是将数据删除平均值并
化操作。其中划分数据时训练
接下来进行数据集划分和归一
M

M





模型构建与预测结果分析
C

C
O

O
O

O
在模型构建上,设计了输入、输出层和两个隐藏层。首先,对模型训练
M

M


中需要的激活函数和损失函数进行定义。同时,还需要定义反向传播过程中




使用的各个函数的导数。其次,对整体的模型网络架构进行构建。然后,在
完成基础准备后,进行信息正向传播函数的构建,而为了获得反向传播过程
C

C
中的修正参数,需要保存每层的输入和最后一层的输出作为返回结果。最后,
O

O
O

O
M

M
根据正向输出结果进行参数更新,即BP神经网络的误差的反向传播过程。





C

C
O

O
O

O
M

M





随着训练次数的增加,神经网络模型整体的预测错误率逐渐下降。测
C

C
O

O
O

O
试集准确率与训练集相比有所降低,说明该模型对于历史已有的数据拟合
M

M



能力较强,但对于未知的结果预测的错误率较高,泛化能力较弱。



M

M





BP神经网络优点
C

C
O

O
O

O
M

M


(1)它具备自学习、自适应的功能,可以从外部环境中获取知识进



行学习,从而提高自身的性能。同时,其内部具有的大量可调参数也


使系统更加灵活;
(2)它的本质是输入到输出的映射,数学理论表明可以用三层的神
C

C
O

O
O

O
经网络就能够以任意精度逼近任何非线性映射关系。
M

M



(3) BP神经所具有后天学习的能力,使其可以根据环境的改变而持



续地进行学习。因而相比传统的评价方法,其功能更强;
(4) BP神经网络是一种非线性建模方法,克服了传统方法分析过程
C

C
O

O
的复杂性和模型函数形式的选择困难;
O

O
M

M


(5) BP神经网络在评价和预测中具有客观性。传统的个人信用风险



评价主要取决于信贷员的主观判断,而BP神经网络能够再现专家的


经验、知识和直觉,从而使评价和预测的客观性得到很好的保障。
C

C
O

O
O

O
M

M





中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C
谢谢!

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C

中 中 中 中 中
国 国 国 国 国
大 大 大 大 大
学 学 学 学 学
M M M M M
O O O O
O O O O
C C C C

You might also like