Welcome to Scribd!

Skip carousel

4 聚类算法

Uploaded by

wem7wang

0% found this document useful (0 votes)

2 views10 pages

Original Title

4-聚类算法

Copyright

Available Formats

PDF, TXT or read online from Scribd

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Report this Document

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

Flag for inappropriate content

Download as pdf or txt

0% found this document useful (0 votes)

2 views10 pages

4 聚类算法

Uploaded by

wem7wang

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

Flag for inappropriate content

Download as pdf or txt

Jump to Page

You are on page 1of 10

Search inside document

K-MEANS算法

聚类概念：

无监督问题：我们手里没有标签了

聚类：相似的东西分到一组

难点：如何评估，如何调参
K-MEANS算法
基本概念：

要得到簇的个数，需要指定K值

质心：均值，即向量各维取平均即可

距离的度量：常用欧几里得距离和余弦相似度（先标准化）

优化目标：
K-MEANS算法
工作流程：
K-MEANS算法
优势：

简单，快速，适合常规数据集

劣势：

K值难确定

复杂度与样本呈线性关系

很难发现任意形状的簇
DBSCAN算法
基本概念：（Density-Based Spatial Clustering of Applications with Noise）

核心对象：若某个点的密度达到算法设定的阈值则其为核心点。
（即 r 邻域内点的数量不小于 minPts）

ϵ-邻域的距离阈值：设定的半径r

直接密度可达：若某点p在点q的 r 邻域内，且q是核心点则p-q直接密度可达。

密度可达：若有一个点的序列q0、q1、…qk，对任意qi-qi-1是直接密度可达的
，则称从q0到qk密度可达，这实际上是直接密度可达的“传播”。
DBSCAN算法
基本概念：

密度相连：若从某核心点p出发，点q和点k都是密度可达的
,则称点q和点k是密度相连的。

边界点:属于某一个类的非核心点,不能发展下线了

直接密度可达：若某点p在点q的 r 邻域内，且q是核心点则p-q直接密度可达。

噪声点：不属于任何一个类簇的点，从任何一个核心点出发都是密度不可达的
DBSCAN算法
基本概念：

A：核心对象

B,C：边界点

N：离群点
DBSCAN算法
工作流程：

参数D：输入数据集

参数ϵ：指定半径

MinPts：密度阈值
DBSCAN算法
参数选择：

半径ϵ，可以根据K距离来设定：找突变点
K距离：给定数据集P={p(i); i=0,1,…n}，计算点P(i)到集合D的子集S中所有点
之间的距离，距离按照从小到大的顺序排序，d(k)就被称为k-距离。

MinPts： k-距离中k的值，一般取的小一些，多次尝试

可视化：https://www.naftaliharris.com/blog/visualizing-dbscan-clustering/
https://www.naftaliharris.com/blog/visualizing-k-means-clustering/
DBSCAN算法
优势：

不需要指定簇个数
可以发现任意形状的簇
擅长找到离群点（检测任务）
两个参数就够了

劣势： https://www.naftaliharris.com/blog/visualizing-dbscan-
clustering/

高维数据有些困难（可以做降维）
参数难以选择（参数对结果的影响非常大）
Sklearn中效率很慢（数据削减策略）

PBL Lecture 3
Document166 pages
PBL Lecture 3
Chloe Liu
No ratings yet
ML别人笔记
Document14 pages
ML别人笔记
yerly X
No ratings yet
Chapter 7 Support Vector Machine (SVM)
Document34 pages
Chapter 7 Support Vector Machine (SVM)
Xg Wu
No ratings yet
03 第三章 k 近邻法
Document20 pages
03 第三章 k 近邻法
snow lee
No ratings yet
Chap 网络优化与正则化
Document59 pages
Chap 网络优化与正则化
dulei
No ratings yet
机器学习演讲
Document27 pages
机器学习演讲
唐朝
No ratings yet
第2和12章感知机和统计学习方法总结
Document27 pages
第2和12章感知机和统计学习方法总结
1042742887
No ratings yet
儀分第一次考試重點
Document4 pages
儀分第一次考試重點
蔡承德
No ratings yet
UCAS AI模式识别2021 4 参数估计
Document40 pages
UCAS AI模式识别2021 4 参数估计
jzuozhou
No ratings yet
SVM算法
Document40 pages
SVM算法
wulinjun1360943519
No ratings yet
硬聚类算法
Document23 pages
硬聚类算法
3291782300
No ratings yet
遗传算法和神经网络的结合
Document6 pages
遗传算法和神经网络的结合
Ian He
No ratings yet
量化论文
Document9 pages
量化论文
ubcaaufng
No ratings yet
最小二乘拟合的蒙特卡罗移动定位算法研究
Document6 pages
最小二乘拟合的蒙特卡罗移动定位算法研究
Feng Yu
No ratings yet
机器学习分类问题及算法研究综述杨剑锋
Document5 pages
机器学习分类问题及算法研究综述杨剑锋
Chou Charles
No ratings yet
PCA降维与SVD
Document19 pages
PCA降维与SVD
wulinjun1360943519
No ratings yet
Python
Document171 pages
Python
lijuncq
No ratings yet
2011694 吴辉强化学习第六次课程作业
Document12 pages
2011694 吴辉强化学习第六次课程作业
2739557203
No ratings yet
CUMCM2013B 讲评
Document23 pages
CUMCM2013B 讲评
朱元章
No ratings yet
北京邮电大学信息与通信工程学院郭彩丽 guocaili@bupt edu cn guocaili@bupt.edu.cn
Document48 pages
北京邮电大学信息与通信工程学院郭彩丽 guocaili@bupt edu cn guocaili@bupt.edu.cn
yāng
No ratings yet
4 降维算法 live
Document16 pages
4 降维算法 live
suzytang5544
No ratings yet
6 支持向量机
Document23 pages
6 支持向量机
wem7wang
No ratings yet
用于网络入侵检测的多尺度卷积CNN模型刘月峰 PDF
Document7 pages
用于网络入侵检测的多尺度卷积CNN模型刘月峰 PDF
Fei Cong
No ratings yet
4 1 决策智能：任务与技术概览
Document35 pages
4 1 决策智能：任务与技术概览
刘向阳
No ratings yet
Lecture 1
Document24 pages
Lecture 1
胡呵呵
No ratings yet
6 神经网络
Document28 pages
6 神经网络
应河
No ratings yet
人工智能笔记整理
Document69 pages
人工智能笔记整理
Leqing Li
No ratings yet
11 Review
Document38 pages
11 Review
1145018948
No ratings yet
盘古气象大模型中文版 v8
Document42 pages
盘古气象大模型中文版 v8
FengWenfeng
No ratings yet
INFO AI Ch2-1
Document81 pages
INFO AI Ch2-1
rojen003
No ratings yet
第3章 k-近邻算法
Document69 pages
第3章 k-近邻算法
Yancy Yin
No ratings yet
基于幅相分离的属性散射中心参数估计新方法蒋文
Document10 pages
基于幅相分离的属性散射中心参数估计新方法蒋文
zjq792150941
No ratings yet
并行求解多维递归方程组的三... Krylov子空间迭代方法李芳
Document4 pages
并行求解多维递归方程组的三... Krylov子空间迭代方法李芳
shang zhang
No ratings yet
5-1 機器學習
Document59 pages
5-1 機器學習
宮伊恩
No ratings yet
第五章公钥密码体制
Document72 pages
第五章公钥密码体制
dzxr1234mess
No ratings yet
列车视觉防冒进
Document16 pages
列车视觉防冒进
111
No ratings yet
基于卷积神经网络模型数值求解双曲型偏微分方程的研究
Document16 pages
基于卷积神经网络模型数值求解双曲型偏微分方程的研究
zhichaoy126
No ratings yet
面向多目标参数整定的协同深度强化学习方法
Document7 pages
面向多目标参数整定的协同深度强化学习方法
zyoung378
No ratings yet
石 Et Al 2008 产品感性评价系统的模糊D-S推理建模方法与应用
Document5 pages
石 Et Al 2008 产品感性评价系统的模糊D-S推理建模方法与应用
5czybn6bfd
No ratings yet
第6章 Logistic回归
Document75 pages
第6章 Logistic回归
Yancy Yin
No ratings yet
概率主成分分析（Ppca）Pre
Document14 pages
概率主成分分析（Ppca）Pre
??
No ratings yet
2 熵权法
Document12 pages
2 熵权法
An-Sheng Jhang
No ratings yet
结合改进主动学习的SVD-CNN弹幕文本分类算法邱宁佳
Document7 pages
结合改进主动学习的SVD-CNN弹幕文本分类算法邱宁佳
perpetual
No ratings yet
基于卷积神经网络的交通场景语义分割方法研究李琳辉
Document8 pages
基于卷积神经网络的交通场景语义分割方法研究李琳辉
SmallHHH
No ratings yet
总结复习
Document49 pages
总结复习
w2285192081
No ratings yet
期末報告翻譯版-02clustering and Anomaly Detection Method Using Nearest and Farthest Neighbor
Document15 pages
期末報告翻譯版-02clustering and Anomaly Detection Method Using Nearest and Farthest Neighbor
鄭毓賢
No ratings yet
07 第七章支持向量机
Document95 pages
07 第七章支持向量机
snow lee
No ratings yet
UCAS AI模式识别2021 5 非参数方法
Document39 pages
UCAS AI模式识别2021 5 非参数方法
jzuozhou
No ratings yet
7 Chapter 4 Nonlinear Classifier-2
Document51 pages
7 Chapter 4 Nonlinear Classifier-2
enzezhuucas
No ratings yet
实验报告A周灵
Document6 pages
实验报告A周灵
1548737158
No ratings yet
第5章边缘检测与图像分割
Document184 pages
第5章边缘检测与图像分割
陈志宣
No ratings yet
4 BioinformaticsMethods - 1
Document98 pages
4 BioinformaticsMethods - 1
aymanesh
100% (2)
Chap02 机器学习基本问题
Document56 pages
Chap02 机器学习基本问题
Me Me
No ratings yet
Casual GCNM
Document16 pages
Casual GCNM
konomafuz
No ratings yet
1emp Introduction 2021 Fall
Document24 pages
1emp Introduction 2021 Fall
陈新
No ratings yet
吴恩达倾情推荐！这28张图全解深度学习知识真棒！ - 知乎
Document32 pages
吴恩达倾情推荐！这28张图全解深度学习知识真棒！ - 知乎
Yang Cao
No ratings yet
基于聚类分析和人工智能的个性化推荐算法研究
Document3 pages
基于聚类分析和人工智能的个性化推荐算法研究
Lynn Polyxena
No ratings yet
1 6小米在知识表示学习方向的探索与实践
Document27 pages
1 6小米在知识表示学习方向的探索与实践
JIA zheng
No ratings yet
2022机器学习考题
Document7 pages
2022机器学习考题
enzezhuucas
No ratings yet