ML Summit参会报告

Uploaded by

rjdimo98

0% found this document useful (0 votes)

11 views2 pages

Original Title

ML-Summit参会报告

Copyright

Available Formats

TXT, PDF, TXT or read online from Scribd

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Report this Document

Copyright:

Available Formats

Download as TXT, PDF, TXT or read online from Scribd

Flag for inappropriate content

Download as txt, pdf, or txt

0% found this document useful (0 votes)

11 views2 pages

ML Summit参会报告

Uploaded by

rjdimo98

Copyright:

Available Formats

Download as TXT, PDF, TXT or read online from Scribd

Flag for inappropriate content

Download as txt, pdf, or txt

Jump to Page

You are on page 1of 2

Search inside document

【RAG】

RAG 定义：数据检索 + 生成式 AI

2B 场景，大模型做系统的数据集成；2C 场景，大模型是系统的新入口

RAG 优势
- 数据管理：像传统 DB 一样，可扩展到 billion 量级的文档
- 信息检索：用自然语言检索，减轻模型幻觉

RAG 劣势
- 检索内容正确性
- 检索前可能需要澄清语义

RAG 挑战
- 长文本分割
- Embedding 模型
- 检索结果相关性：Self-consistency、Reflection、COVE
- 生成内容质量：BLEU / ROGUE 指标

RAG 应用
- Retrieval Augmented Few-Shot learning
- AI Agent = 生成式 AI + 工具（包括信息检索） + 动作 + 记忆 + 规划

【知识图谱】
与知识图谱结合的应用
- 问答与推理：检索、CoT
- 查询：NL2DSL
- 图谱构建与知识挖掘：NER

【AI 基础设施】
训练效率
- 资源、性能效率：利用率、加速比、内存与算力资源匹配
- 人效：工程稳定性、人工运维多、训练策略配置

DLRover：AI 模型训练的“serverless”——引擎优化、资源调度，同时与训练框架、调度系统解耦
- 引擎优化：PyTorch / TF 加速库（Flash Attention、计算图优化）；显存 / 通信优化库；优化器
- 资源调度：自动配置并行策略;自动配置训练资源，自动扩缩容；弹性训练，支持节点抢占和释放。
- 自动运维：自动故障检测，隔离故障机不影响其余节点训练，

【工程经验】
数据
- 对数据的要求：正确、多样、有难度。
- 对总量做减法，对质量做加法：质量是模型效果的基石，Ziya 模型在 2W 高质量 SFT 数据上准确率 55%，在
45W 全量 SFT 数据上准确率 43%。
- 质量评估：客观评估，编译器、验证环境；主观评估，对齐人类偏好（RLHF）
- 质量增强：使用 Reward Model 筛选样本，使用 FeedBack Model 优化样本

RAG 对齐：从模型不知道自己不知道，到知道自己不知道
RLHF 的挑战
- 奖励稀疏：采用混合粒度奖励（token-level, step-level, sample-level）；局部奖励对数学推理非
常重要；oracle guide 做空间搜索增强

LLM 语义理解能力与知识
- 扩展词表对模型影响大，失去原始 Embedding 信息，需要大量训练才能恢复
- 做多语言对齐的增强预训练，不能在知识层面提升模型能力
- 大模型存在核心语言区
-- 增量预训练 / 微调需要配比其他数据
-- 与小模型不同，不能针对少量数据做过拟合。少量数据做多 EPOCH 的训练，可能导致整个模型失效
-- 对训练数据中的噪音敏感

奇点将至，探他山之石从算力、算法、数据和应用看AIGC
Document48 pages
奇点将至，探他山之石从算力、算法、数据和应用看AIGC
宋强
No ratings yet
Untitled
Document78 pages
Untitled
Ye Wang
No ratings yet
3-4 人人可用的图计算：GraphScope 的现状和未来
Document41 pages
3-4 人人可用的图计算：GraphScope 的现状和未来
chunhua li
No ratings yet
SD
Document9 pages
SD
Lin Phil
No ratings yet
Clickhouse ZH
Document429 pages
Clickhouse ZH
zc.bjut
No ratings yet
001 第1篇第00章：前言 1讲背景&目的
Document13 pages
001 第1篇第00章：前言 1讲背景&目的
瞿加辉
No ratings yet
原理、实践与生态
Document22 pages
原理、实践与生态
howardhu0403
No ratings yet
1 拾象硅谷调研 0629
Document56 pages
1 拾象硅谷调研 0629
xzou1984
No ratings yet
ChatGPT狂飙破壁，现象级AI应用引发范式革命
Document25 pages
ChatGPT狂飙破壁，现象级AI应用引发范式革命
Kenson Yeoh
No ratings yet
Python自动化开发课程2 2版
Document24 pages
Python自动化开发课程2 2版
johnny zhou
No ratings yet
11 Review
Document38 pages
11 Review
1145018948
No ratings yet
解决二次分配问题
Document11 pages
解决二次分配问题
afmohkjbg
100% (1)
2 基于Ray底座，快速构建大模型为核心的生产级应用 1215
Document47 pages
2 基于Ray底座，快速构建大模型为核心的生产级应用 1215
sekiftlyz
No ratings yet
4. Python常用的50个第3方模块及说明
Document3 pages
4. Python常用的50个第3方模块及说明
atest0808qq
No ratings yet
【C 中 - 高级开发工程师 - 北京】戴先生 6年
Document4 pages
【C 中 - 高级开发工程师 - 北京】戴先生 6年
370994944
No ratings yet
中国AIGC数据标注产业全景报告
Document26 pages
中国AIGC数据标注产业全景报告
lifespokesman
No ratings yet
2020美团技术年货算法篇
Document317 pages
2020美团技术年货算法篇
gpfvic
No ratings yet
C语言从入门到精通（第4版）
Document630 pages
C语言从入门到精通（第4版）
chenwei
No ratings yet
基于开源技术的地质空间大数据系统设计与实现齐少凡
Document6 pages
基于开源技术的地质空间大数据系统设计与实现齐少凡
Chi
No ratings yet
德勤全球人工智能研究院 AIGC生成式人工智能对企业的影响和意义
Document37 pages
德勤全球人工智能研究院 AIGC生成式人工智能对企业的影响和意义
Amber Chiu
No ratings yet
Introduction To StarRocks
Document38 pages
Introduction To StarRocks
tanbokan
No ratings yet
CCKS 讲习班知识计算即服务赋能企业知识化转型（郑毅）
Document57 pages
CCKS 讲习班知识计算即服务赋能企业知识化转型（郑毅）
757786288
No ratings yet
2021年11月基于DAG的任务调度框架
Document29 pages
2021年11月基于DAG的任务调度框架
fbnbygcs
No ratings yet
从软件复杂度的角度去理解DDD
Document25 pages
从软件复杂度的角度去理解DDD
TiSone Wen
No ratings yet
002 第1篇第00章：前言 2讲目标、特点、对象、效果
Document13 pages
002 第1篇第00章：前言 2讲目标、特点、对象、效果
瞿加辉
No ratings yet
PosterMan Share
Document18 pages
PosterMan Share
inkzhou
No ratings yet
艾瑞咨询：2021年中国企业级无代码白皮书
Document62 pages
艾瑞咨询：2021年中国企业级无代码白皮书
黄俊
No ratings yet
Azure OpenAI Service Jixin ZH - CN - Customer Facing v0.1
Document33 pages
Azure OpenAI Service Jixin ZH - CN - Customer Facing v0.1
Guoqiang Gai
100% (1)
工业大数据采集处理与应用项目1
Document36 pages
工业大数据采集处理与应用项目1
chaoxiangdong45
No ratings yet
07 云巧工程体系-云巧组件标准与度量
Document10 pages
07 云巧工程体系-云巧组件标准与度量
huangjiehui92
No ratings yet
02 数据库环境
Document15 pages
02 数据库环境
kingsleydingke
No ratings yet
4 黄伟聪构建企业级aigc应用的典型模式和实践 1215
Document18 pages
4 黄伟聪构建企业级aigc应用的典型模式和实践 1215
sekiftlyz
No ratings yet
58同城Android客户端Walle框架演进与实践之路
Document29 pages
58同城Android客户端Walle框架演进与实践之路
彭亮
No ratings yet
1 ChatGPT与生成式AI技术发展概述
Document80 pages
1 ChatGPT与生成式AI技术发展概述
mojunjie521
No ratings yet
02 - Apache Hadoop、HDFS
Document135 pages
02 - Apache Hadoop、HDFS
San Zhang
No ratings yet
胡剑，胡慧，周靖翔30676854109837
Document37 pages
胡剑，胡慧，周靖翔30676854109837
westapple38
No ratings yet
02 ChatGPT项目实战 PDF
Document63 pages
02 ChatGPT项目实战 PDF
wb c (cwbzjh)
No ratings yet
生成式AI的行业应用场景
Document38 pages
生成式AI的行业应用场景
cheunghanssy
No ratings yet
云计算教案 2页
Document8 pages
云计算教案 2页
xiaoma
No ratings yet
AIGC发展研究1.0版0.93
Document192 pages
AIGC发展研究1.0版0.93
howardhu0403
No ratings yet
华泰证券：文心一言：技术与能力拆解
Document19 pages
华泰证券：文心一言：技术与能力拆解
Mike
No ratings yet
03 - Hadoop MapReduce与Hadoop YARN
Document81 pages
03 - Hadoop MapReduce与Hadoop YARN
San Zhang
No ratings yet
Rohoon Quality Runtime
Document22 pages
Rohoon Quality Runtime
dlg20180722
No ratings yet
方剑冰公开版
Document35 pages
方剑冰公开版
禹范
No ratings yet
轻舟低代码平台外宣
Document64 pages
轻舟低代码平台外宣
cckun
No ratings yet
19、2023系统架构设计师知识点精华【背熟，提高10分】 PDF
Document133 pages
19、2023系统架构设计师知识点精华【背熟，提高10分】 PDF
66刘
No ratings yet
浙商证券：AI行业深度报告 ChatGPT AI模型框架研究
Document37 pages
浙商证券：AI行业深度报告 ChatGPT AI模型框架研究
Jason Zhang
No ratings yet
AIGC行业调研：行业市场、核心玩家和技术路径
Document70 pages
AIGC行业调研：行业市场、核心玩家和技术路径
caizichen888
No ratings yet
China Mobile - Feng Junlan AI in Network Seminar Presentation FINAL
Document18 pages
China Mobile - Feng Junlan AI in Network Seminar Presentation FINAL
unknown
No ratings yet
2022数据库系统概论期末项目相关论文
Document23 pages
2022数据库系统概论期末项目相关论文
马文辉
No ratings yet
安卓恶意软件检测
Document16 pages
安卓恶意软件检测
qtiying
No ratings yet
004 第1篇第01章：知识体系概述 2讲知识框架、思路
Document16 pages
004 第1篇第01章：知识体系概述 2讲知识框架、思路
瞿加辉
No ratings yet
Apache Ignite内存数据库
Document17 pages
Apache Ignite内存数据库
Howie Sun
No ratings yet
TrendDB技术说明书
Document16 pages
TrendDB技术说明书
bupa Mao
No ratings yet
巨量資料技術與應用
Document60 pages
巨量資料技術與應用
Ruei-Jr Tseng
No ratings yet
艾瑞咨询：2021年中国人工智能基础层行业发展研究报告
Document60 pages
艾瑞咨询：2021年中国人工智能基础层行业发展研究报告
David Tai
No ratings yet
AIGC深度产业报告量子位智库
Document34 pages
AIGC深度产业报告量子位智库
YUE SUN
No ratings yet
大数据工程师必读手册
Document122 pages
大数据工程师必读手册
Gary Chan
No ratings yet
数据科学 Pandas数据分析讲义
Document189 pages
数据科学 Pandas数据分析讲义
Malio奇
No ratings yet
Intelligent System Based on Cloud and Internet Of Things: 基於雲端物聯網之智慧型系統
From Everand
Intelligent System Based on Cloud and Internet Of Things: 基於雲端物聯網之智慧型系統
Jian Ming-Shen
No ratings yet