第7讲人工神经网络

中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
张宁
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
中央财经大学金融学院
学学学学学
M M M M M
O O O O
O O O O
C C C C
邮箱：zhang-ning@vip.163.com
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
第七章人工神经网络
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
M
M
学
学
大
大
国
国
中
中
教师介绍
C
C
O
O
O
O
M
M
学
学
大
大
• 张宁，中央财经大学金融学院教授，博士生导师，中央财经大学中国
国
国
中
中
金融科技研究中心主任、金融科技专业负责人；
• 学术兼职包括：中国人工智能学会委员、中国银保监会偿咨委委员、
C
C
O
O
家族办公室合作与发展组织理事会主席兼首席经济学家、生命质量研
O
O
M
M
究会理事长、中关村金融科技产业联盟专家委员会副主任委员、北京
学
学
大
大
国
国
市两区建设咨询专家、石景山区数字金融高级顾问、科技部国家科技
中
中
评估中心及火炬中心评议专家等。
• 累计在《中国科学》等权威期刊发表论文52篇，出版专著编著教材23
C
C
O
O
O
O
本，多次参与金融科技、平台经济、金融保险、健康金融相关政策咨
M
M
学
学
询建议及标准制定，作为骨干成员获评第二批全国高校黄大年式教学
大
大
国
国
中
中
团队、起草编写了多个教育部1+X职业标准（如健康财富规划师等），
通用生命质量理论和知识经济框架的提出者和健康金融的推动者。
C
C
O
O
O
O
M
M
学
学
大
大
2
国
国
中
中
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
本讲内容
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
二．神经元模型与感知机
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
三．人工神经网络在金融领域的应用
一．人工神经网络概述及其应用场景
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
3
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
一、人工神经网络概述及其应用场景
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
从这里开始
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
结构的数学化
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
zϵR表示一个神经元所获得的输入信号x的加权和，
M M M M M
O O O O
O O O O
C C C C
假设一个神经元接收D个输入x1 ，x2 ，…，xD ，令向量
中中中中中
国国国国国
x=[x1；x2；…；xD]来表示这组输入，并用净输入（Net Input）
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
（Nielsen）
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
Neural Network,ANN
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
1.1 定义：人工神经网络，Artificial
中中中中中
它通过对连续或断续的输入进行信息处理并做出相应的状态。
国国国国国
• 人工神经网络（Artificial Neural Network,ANN），简称神经网络
大大大大大
能，并在不同程度和层次上模仿人脑神经系统的信息处理能力。
学学学学学
（NN），是对人脑或自然神经网络若干基本特征的抽象和模拟。
M M M M M
质是通过网络变换和动力学行为得到一种并行分布式的信息处理功
• 作为一种非程序化、适应性、大脑风格的信息处理，神经网络的本
• 人工神经网络是由人工建立的，以有向图为拓扑结构的动态系统，
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
1.2 人工神经网络的发展
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
系统等智能信息系统……
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
研究领域取得了广泛的成功。
O O O O
C C C C
中中中中中
国国国国国
电信号的识别和处理等获得了广泛应用。
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
1.3 人工神经网络的应用场景
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
• 金融：股票市场的预测，风险分析，价格预测……
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
• 交通：交通仿真、车辆检测、交通流量预测、自动导航、交通控制……
中中中中中
• 医学：在医疗专家系统，脑电信号、听觉诱发电位信号、肌电和胃肠电、心
• 信息：智能仪器、自动跟踪监测仪器、自动控制导航系统、故障诊断与预警
经过几十年的发展，神经网络理论在信息、医学金融、交通等众多
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
二、神经元模型与感知机
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
2.1 神经元与激活函数
国国国国国
大大大大大
学学学学学
zϵR表示一个神经元所获得的输入信号x的加权和，
M M M M M
O O O O
O O O O
C C C C
假设一个神经元接收D个输入x1 ，x2 ，…，xD ，令向量
中中中中中
国国国国国
x=[x1；x2；…；xD]来表示这组输入，并用净输入（Net Input）
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
算效率；
激活函数
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
大也不能太小，否则会影响训练的效率和稳定性。
中中中中中
示能力和学习能力，激活函数需要具备以下几点性质：
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
的激活函数可以直接利用数值优化的方法来学习网络参数；
C C C C
中中中中中
• 激活函数激活函数在神经元中非常重要的，为了增强网络的表
• （2）激活函数及其导函数要尽可能的简单，有利于提高网络计
• （3）激活函数的导函数的值域要在一个合适的区间内，不能太
• （1）连续并可导（允许少数点上不可导）的非线性函数。可导
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
tanh ( x ) =
C C C C
（x）=
Logistic 函数 Logistic 函数定义为
中中中中中
1
国国国国国
大大大大大
tanh ( x) = 2 (2 x) − 1
学学学学学
exp( x ) − exp( − x )
exp( x ) + exp( − x )
M M M M M
1 + exp （ - x）
O O O O
O O O O
C C C C
Tanh 函数 Tanh 函数也是一种 Sigmoid 型函数，其定义为
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
Tanh 函数可以看作是放大并平移的 Logistic 函数，其值域是（-1,1）
。
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
常用的Sigmoid型函数有Logistic函数和Tanh函数．
学学学学学
M M M M M
O O O O
O O O O
C C C C
Sigmoid型函数是指一类S型曲线函数，为两端饱和函数。
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
号 θ 表示。
国国国国国
大大大大大
学学学学学
2.2 感知机
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
时，才会输出 1。这也称为“神经元被激活”
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
。这里将这个界限值称为阈值，用符
w2x2）。神经元会计算传送过来的信号总和，只有当这个总和超过了某个界限值
是一个接收两个输入信号的感知机的例子。x1、x2 是输入信号，y 是输出信
号，w1、w2 是权重。输入信号被送往神经元时，会被分别乘以固定的权重（w1x1、
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
y=
O O O O
O O O O
C C C C
1
0
中中中中中
国国国国国
大大大大大
y (n) 𝐰 ∗T 𝐱 (n) > 0,

学学学学学
M M M M M
O O O O
O O O O
C C C C
将感知机的运行原理以数学形式表现为：
中中中中中
国国国国国
大大大大大
学学学学学
(w1 x1 + w2 x2 > θ)
(w1 x1 + w2 x2 ≤ θ)
M M M M M
O O O O
O O O O
C C C C
∀n ∈ 1， … ，N
算法试图找到一组参数 w*，使得对于每个样本(𝐱 (n) , y (n) )有
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
的重要性的作用。也就是说，权重越大，对应该权重的信号的重要性就越高。
M M M M M
O O O O
感知机的多个输入信号都有各自固有的权重，这些权重发挥着控制各个信号
给定 N 个样本的训练集：{(𝐱 (n) , y (n) )}Nn=1 ，其中𝑦 (𝑛) ∈ −1, +1 ，感知器学习
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
感知机训练
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
𝜕𝐰
𝜕L（𝐰; 𝐱, y）
中中中中中
国国国国国
大大大大大
=ቊ
学学学学学
感知机的损失函数为
M M M M M
0
O O O O
O O O O
C C C C
𝐰 ← 𝐰 + y𝐱
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
即ywTx<0，就用这个样本来更新权重。
−y𝐱 𝑖𝑓 y𝐰T𝐱 > 0.

𝑖𝑓 y𝐰T𝐱 > 0,
O O O O
L（w；x，y）= max（0，−ywTx）
C C C C
采用随机梯度下降，其每次更新的梯度为
根据以上感知机的学习策略，可以反推出
先初始化一个权重向量w←0（通常是全零
向量），然后每次分错一个样本（x,y）时，
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
2.3 反向传播
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
• 1986年，David E. Rumelhart, Geoffrey E. Hinton和 Ronald J.
O O O O
O O O O
C C C C
Williams发表文章《Learning representations by back-propagating
中中中中中
国国国国国
errors》，重新报道这一方法，BP神经网络学习算法才受到重视。
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
前向传播过程
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
第 l 层神经网络有 k 个神经元），则向量化后为：
z (l ) = ( w(l ) )T ·a (l −1) + b (l )
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
每个神经元的输入信号 z，由参数 w、b，和前一层的输出信号 a 决定（假设
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
的目标。
反向传播
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
神经网络也需要经过多次迭代，才能够逼近并获得最优模型。
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
• 为了能够得到一个优质的神经网络模型，我们需要求模
学学学学学
型的两类参数w和b的最优值，以达到令损失函数值最小
• 反向传播算法：首先利用损失函数求得模型的最终误差；接着再将误差自后向前层层传
M M M M M
递，获取每个神经元的误差；最后将每层每个神经元的误差对w和b求偏导，迭代获取的
O O O O
w和b的最优解，从而构建损失函数最小的最优神经网络模型。当然，和梯度下降法类似，
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
反向传播过程
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
域中的应用
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
三、人工神经网络在金融领
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
M
M
学
学
大
大
国
国
中
中
案例背景
C
C
O
O
O
O
互联网技术发展改变了传统的消费方式，人们开始倾向于使用手机、
M
M
学
学
银行卡等方式消费，信用卡这种便捷的小额贷款受到了很多人的欢迎。在
大
大
国
国
中
中
人们的需求与给银行带来的利益下，经过长期发展，在2020年中国信用卡
人均持卡量已经发展为0.6张，各大银行都积极开展信用卡业务，但是巨额
C
C
的利润下还隐藏着巨大的风险，截止2020年第三季度，我国信用卡逾期半
O
O
O
O
M
M
年未偿还信贷总额超过900亿元。
学
学
大
大
国
国
中
中
给银行信用卡业务带来经济损失的风险种类很多，最主要的是信用风
险。目前迫切需要研究如何加强信用卡业务的风险管理，探索信用卡违约
C
C
的影响因素，并提前进行信用卡违约行为预测，帮助银行规避风险，减少
O
O
O
O
M
M
银行损失，建立更完善的客户信用卡风险评估体系。神经网络模型可以帮
学
学
大
大
国
国
助银行把经营风险和违约风险尽可能降到最低，同时符合银行审核速度快
中
中
且准确的要求，并且具有能够同时处理大量数据的能力，因此目前BP神经
网络已广泛应用于信用卡风险预测。
C
C
O
O
O
O
M
M
本案例针对从UCI机器学习数据库中获取的信用卡审批数据集（Credit
学
学
大
大
国
国
Approval Data Set），使用BP神经网络模型帮助银行区分好客户和坏客户，
中
中
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
数据预处理
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
缩放到单位方差。
中中中中中
国国国国国
大大大大大
同意申请，符合“-”代表不同意申请。该数据集有缺失值，且数据类型不统一，需
和输出变量，采用One-Hot编码处理。在完成处理后，在690条数据中，共有307个样
本的信用卡申请通过，383个样本的信用卡申请未通过，说明该数据集为平衡面板。
学学学学学
该数据集属于多变量数据集，含有15个客户属性特征和1个输出变量。符合“+”代表
要先进行数据预处理。除处理异常值外，对于名义型变量如特征变量1、特征变量4等
M M M M M
O O O O
集与测试集的比例为9:1，归
O O O O
C C C C
一化则是将数据删除平均值并
化操作。其中划分数据时训练
接下来进行数据集划分和归一
M
M
学
学
大
大
国
国
中
中
模型构建与预测结果分析
C
C
O
O
O
O
在模型构建上，设计了输入、输出层和两个隐藏层。首先，对模型训练
M
M
学
学
中需要的激活函数和损失函数进行定义。同时，还需要定义反向传播过程中
大
大
国
国
中
中
使用的各个函数的导数。其次，对整体的模型网络架构进行构建。然后，在
完成基础准备后，进行信息正向传播函数的构建，而为了获得反向传播过程
C
C
中的修正参数，需要保存每层的输入和最后一层的输出作为返回结果。最后，
O
O
O
O
M
M
根据正向输出结果进行参数更新，即BP神经网络的误差的反向传播过程。
学
学
大
大
国
国
中
中
C
C
O
O
O
O
M
M
学
学
大
大
国
国
中
中
随着训练次数的增加，神经网络模型整体的预测错误率逐渐下降。测
C
C
O
O
O
O
试集准确率与训练集相比有所降低，说明该模型对于历史已有的数据拟合
M
M
学
学
大
大
能力较强，但对于未知的结果预测的错误率较高，泛化能力较弱。
国
国
中
中
M
M
学
学
大
大
国
国
中
中
BP神经网络优点
C
C
O
O
O
O
M
M
学
学
（1）它具备自学习、自适应的功能，可以从外部环境中获取知识进
大
大
国
国
行学习，从而提高自身的性能。同时，其内部具有的大量可调参数也
中
中
使系统更加灵活；
（2）它的本质是输入到输出的映射，数学理论表明可以用三层的神
C
C
O
O
O
O
经网络就能够以任意精度逼近任何非线性映射关系。
M
M
学
学
大
大
（3） BP神经所具有后天学习的能力，使其可以根据环境的改变而持
国
国
中
中
续地进行学习。因而相比传统的评价方法，其功能更强；
（4） BP神经网络是一种非线性建模方法，克服了传统方法分析过程
C
C
O
O
的复杂性和模型函数形式的选择困难；
O
O
M
M
学
学
（5） BP神经网络在评价和预测中具有客观性。传统的个人信用风险
大
大
国
国
评价主要取决于信贷员的主观判断，而BP神经网络能够再现专家的
中
中
经验、知识和直觉，从而使评价和预测的客观性得到很好的保障。
C
C
O
O
O
O
M
M
学
学
大
大
国
国
中
中
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
谢谢！
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C
中中中中中
国国国国国
大大大大大
学学学学学
M M M M M
O O O O
O O O O
C C C C

第7讲人工神经网络

Uploaded by

Copyright:

Available Formats

You might also like

第7讲人工神经网络

Uploaded by

Document Information

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

第7讲人工神经网络

Uploaded by

Copyright:

Available Formats

中中中中中

y (n) 𝐰 ∗T 𝐱 (n) > 0,

给定 N 个样本的训练集：{(𝐱 (n) , y (n) )}Nn=1 ，其中𝑦 (𝑛) ∈ −1, +1 ，感知器学习

−y𝐱 𝑖𝑓 y𝐰T𝐱 > 0.

You might also like

第7讲 人工神经网络

Uploaded by

Copyright:

Available Formats

You might also like

第7讲 人工神经网络

Uploaded by

Document Information

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

第7讲 人工神经网络

Uploaded by

Copyright:

Available Formats

中 中 中 中 中

y (n) 𝐰 ∗T 𝐱 (n) > 0,

给定 N 个样本的训练集：{(𝐱 (n) , y (n) )}Nn=1 ，其中𝑦 (𝑛) ∈ −1, +1 ，感知器学习

−y𝐱 𝑖𝑓 y𝐰T𝐱 > 0.

You might also like

第7讲人工神经网络

第7讲人工神经网络

第7讲人工神经网络

中中中中中