LeCun、田渊栋参与撰写，70页「自监督学习」大全，附下载地址

首页 > 资讯 > > 内容页

LeCun、田渊栋参与撰写，70页「自监督学习」大全，附下载地址

2023-04-27 09:19:57 商业新知网

「关于自监督学习，你想知道但又不敢问的一切都在这里了。」图灵奖得主、Meta 人工智能首席科学家 Yann LeCun 刚刚发了这样一则推文。

在推文中，LeCun 介绍了他和 Meta 人工智能研究院研究员、研究经理田渊栋等人共同撰写的一份「Cookbook」（非常实用、可操作性强、就像一本菜谱一样的论文）。这本 Cookbook 总共 70 页，涵盖了自监督学习的定义、重要性、起源、家族、训练部署方法、扩展方法等方面知识，是一份不可多得的学习材料。「如果你想研究自监督学习，那最好看看这本书。」田渊栋补充说。

论文链接：https://arxiv.org/pdf/2304.12210v1.pdf

(资料图片)

自监督学习可以被看作是机器学习的一种「理想状态」，模型直接从无标签数据中自行学习，无需标注数据。它主要是利用辅助任务（pretext task）从大规模的无监督数据中挖掘自身的监督信息，通过这种构造的监督信息对网络进行训练，从而可以学习到对下游任务有价值的表征。自监督学习的优势在于它能够利用大量的无标签数据进行训练，而不需要人工标注。这样可以节省大量的人力和时间成本，并且可以利用更多的数据进行训练，从而提高模型的性能。

众所周知，Yann LeCun 一直是自监督学习的积极支持者。近几年，Meta 发表了一系列关于自监督学习的论文。LeCun 坚定地认为，自监督学习是 AI 系统的必要前提，它可以帮助 AI 系统构建世界模型，以获得类似人类的能力，如理性、常识，以及将技能和知识从一个环境迁移到另一个环境的能力。GPT-4 的成功有力地证明了自监督学习的有效性。不过，Yann LeCun 并不看好 GPT 家族所采用的自回归方法（预测下一个词），而是更倾向于构建「世界模型」。

这份 Cookbook 在社交媒体上受到了广泛好评。

自监督学习是什么？为什么如此重要？

2021 年，Yann LeCun 等人发布了一篇题为「Self-supervised learning: The dark matter of intelligence」的博客。在博客中，他们把自监督学习（SSL）称为「智能的暗物质」，认为这是推进机器学习的一条有前途的道路。

自监督学习（SSL）是深度学习在自然语言处理领域取得成功的基础，它带来了从自动机器翻译到在网络规模的无标签文本语料库上训练的大型语言模型的进步。在计算机视觉方面，它推动了数据规模的新边界，如在 10 亿张图像上训练的 SEER 模型。用于计算机视觉的 SSL 方法已经能够媲美或在某些情况下超过在标记数据上训练的模型，甚至在 ImageNet 等竞争激烈的基准上也是如此。SSL 也被成功地应用于其他模态，如视频、音频和时间序列。

自监督学习定义了一个基于无标签输入的辅助任务，以产生描述性的、可理解的表示。在自然语言中，一个常见的 SSL 目标是掩盖文本中的一个词并预测周围的词。这种预测一个词周围的上下文的目标鼓励模型捕捉文本中的词之间的关系，而不需要任何标签。同样的 SSL 模型表示可用于一系列下游任务，如跨语言的文本翻译、总结，甚至是生成文本，以及其他许多任务。在计算机视觉中，类似的目标存在于 MAE 或 BYOL 学习等模型中，以预测图像或表征中被遮蔽的内容块。其他 SSL 目标鼓励同一图像的两个视图，例如通过添加颜色或裁剪形成，以映射到类似的表示。

在大量无标签数据上进行训练的能力带来了许多好处。传统的监督学习方法是在一个特定的任务上进行训练，而这个任务通常是基于可用的标记数据而预先知道的，SSL 则是在许多任务中学习有用的通用表征。SSL 在医学等领域特别有用，因为这些领域的标签成本很高，或者具体的任务不能事先知道。也有证据表明，SSL 模型可以学习到对对抗性例子、标签损坏和输入扰动更稳健的表征，而且与有监督的模型相比更公平。因此，SSL 是一个越来越受关注的领域。然而，就像烹饪一样，训练 SSL 的方法是一门精致的艺术，有很高的入门门槛。

为什么要编写自监督学习的 Cookbook

虽然研究人员熟悉 SSL 的许多组件，但成功训练 SSL 的方法涉及从辅助任务到训练超参数的一系列令人眼花缭乱的选择。SSL 研究具有很高的进入门槛，包括：

1、计算成本高；

2、缺乏完全透明的论文来详细说明充分实现 SSL 潜力所需的复杂实现；

3、缺乏统一 SSL 的专业词汇和理论观点。

由于 SSL 建立了与传统的基于重建的无监督学习方法 —— 如（去噪、变分）自编码器 —— 不同的范式，因此我们在统一框架下理解 SSL 的词汇量是有限的。事实上，在单一框架下统一 SSL 方法的尝试直到去年才开始出现。因为没有一个共同的基础来描述 SSL 方法的不同组成部分，研究人员着手研究 SSL 方法变得更具挑战性。与此同时，SSL 研究迫切需要新的研究人员加入，以将其部署到现实世界中。然而，关于 SSL 泛化性的保证、公平性以及对对抗性攻击甚至自变体的稳健性，仍然存在许多未解之谜。这些问题对于 SSL 方法的可靠性至关重要。

此外，由经验驱动的 SSL 带有许多可变的部分（主要是超参数），它们是可能会影响最终表示的关键属性，而且在已发表的工作中不一定有详细的说明。也就是说，要开始研究 SSL 方法，首先必须详尽地对这些方法进行经验探究，以充分掌握所有这些部件的影响和行为。这种经验盲点有很大的局限性，因为它们需要大量的计算资源和预先存在的实践经验。总而言之，SOTA 的性能来自于看似不同但又重叠的方法，现有的理论研究很少，而这类模型在现实世界中的部署又很广泛。因此，我们需要一本统一这项技术及其有关方法的 cookbook。这对降低 SSL 的研究门槛至关重要。

研究人员的目标是以 cookbook 的形式奠定 SSL 研究的基础，并呈现与 SSL 有关的最新方法，从而降低 SSL 研究的门槛。

比如要成功烹饪，你必须首先学习基本技术：切碎、炒菜等。研究者从第 2 章开始使用通用词汇介绍自监督学习的基本技术。具体来说，他们描述了系统的方法以及理论线索，以统一的视角连接它们的目标。研究者们在概念框中突出显示出关键的概念，例如 loss terms 或 training objectives。

接下来，「厨师们」必须学会熟练地应用这些技术来形成「美味的菜肴」，这需要学习现有的食谱，组合食材并评估菜肴。在第 3 章中，研究人员介绍了成功实现 SSL 方法的实际注意事项，讨论了常见的训练方法，包括超参数选择、如何组装网络架构和优化器等组件，以及如何评估 SSL 的方法。

他们还分享了一些优秀的研究人员关于常见训练配置和躲避陷阱的实用技巧。希望这本 cookbook 能成为大家成功训练和探索自监督学习的实践基础。

LeCun、田渊栋参与撰写，70页「自监督学习」大全，附下载地址

LeCun、田渊栋参与撰写，70页「自监督学习」大全，附下载地址

转给爸妈｜“五一”假期老年人出游避“坑”指南_当前资讯

世界观天下！抖音是哪年出来的（抖音的主要功能是什么）

新能源汽车：中国外贸“新名片”

找“搭子”出游，是旅游也是社交|精彩看点

天山电子将于5月4日解禁130.81万股-全球微资讯

成渝地区双城经济圈全球投资推介会举行 推出超万亿元规模投资项目

奔驰车c级和e级的区别_奔驰c级和e级的区别

逆转の妖精 第一章4 梦想

定制鞋柜深度标准尺寸是多少 世界热讯

焦点快播：最近看到的三个国产化的例子的一些感想

外贸中nos什么意思 nos是什么意思

环球热文：lol魔盒（lol多玩魔盒）

广汽引领汽车低碳新时代-速看料

全球实时：小鸡宝宝考考你俗语“不撞南墙不回头”中的“南墙”指的是什么墙

瑞典央行如期加息50个基点 承诺将再加息25个基点

中石化油服(01033.HK)首季归属股东净利润升95.6%至1.45亿人民币

三六五网股东户数下降4.84%，户均持股7.87万元_环球要闻

【全球聚看点】@长沙朋友，“五一”常德把城留给你【遛娃最强攻略】来了！

即时：锂价走低，不到半年跌六成！回报周期缩短，今年或成工商业储能爆发“元年”

新能源汽车蓬勃发展背后，补能行业如何“加速奔跑”_世界热消息

2023贵州金太阳高三4月联考各科答案及试题参考！_当前快看

英伟达(NVDA.US)推出“护栏”软件以防止AI模型失控

中国星辰 | 叶光富：向着光，成为光！

4月26日 14:23分 水发燃气（603318）股价快速拉升

世界今热点：挂了怎么就不能玩游戏

2023合肥五一国际车展购车优惠详情（持续更新）

我国与中亚五国全面复航 “空中丝绸之路”不断扩能提速

新一代奔驰E级正式发布！再次颠覆同级豪华轿车天花板_环球播报

服务人民！郑州经开分局治理蝶湖公园取得良好成效|快看点

拉萨贡嘎机场第二跑道预计年底投用

重实效 强实干 抓落实丨签约项目18个，成交金额超100亿元！广西举办工业服务保障重大工程项目推进会

环球快资讯：日本首个登月舱或已撞向月球表面 航天计划再受挫

苏丹卫生部：该国武装冲突已致460人死亡-每日动态

今年“5.20”适逢星期六，多地明确婚姻登记处将照常办公

黄金价格下跌，市场等待更多数据来判断美联储的决定|天天热点

每日报道：防患于未然未雨绸缪分别是什么意思_防患于未然未雨绸缪的意思

全国共有托育服务机构约7.5万家 提供托位数约350万个

贵研铂业：4月25日融券净卖出8345股，连续3日累计净卖出1.47万股

读书类大V博主：年入千万，没那么容易

美国至4月21日当周API原油库存-608.3万桶，预期-166.7万桶，前值-267.5万桶。-环球热头条

邮折是什么_邮折

环球新动态：黄金分割线段的比例_黄金分割线的比例是多少

环球视点！正常人的体温是多少度到多少度之间_正常人的体温是多少度

海南临高一学生被撞身亡，涉事司机已被抓捕归案

天天讯息：《IDOLiSH7》各组合连续登上杂志《anan》封面

溜出去露营官网在哪下载 最新官方下载安装地址

全球讯息：《海贼王》的白胡子空降中国，国漫哪些厉害人物可以与之对抗？

三只松鼠一季度净利同比增18.73% 连续两季实现增长

视点！视频｜合肥这一“谷”力量 让中国更美

安车检测：2023年第一季度净利润约420万元 同比下降72.28% 世界热文

猜不透歌词完整版_猜不透歌词_世界新消息

热资讯！中老缅泰启动第128次湄公河联合巡逻执法行动

全球快报:3月10日是什么星座_1月30日是什么星座

公司问答 | 风华高科：公司祥和项目三期建设已于今年3月启动试生产

继续缺席明日比赛 小卡已打完快艇生涯最后一战？

2000年国家最高科学技术奖数学大师_2000年国家最高科学技术奖获奖者-世界滚动

汉口北国际贸易城有了“商标品牌纠纷调解室”_全球通讯

热推荐：中国科传2涨停

短讯！精锻科技2022年报及2023年一季报点评：新能源汽车维持高景气度，业绩实现高增

最新快讯!99元睡大厅?酒店回应:会免费升房 不会真的睡大厅

热文：“环湖V马”龙潭中湖公园开跑，颁发定制“摩天轮奖牌”

女子遇火灾将2娃扔下楼获救自己身亡 基本情况讲解-天天看点

2023北京各火车站五一地铁运营时间延长方便抵京旅客出行

山西省地质调查院 世界观焦点

桩桩的最新小说（鲜橙的小说）

租金下跌、净吸纳量环比下降55%，深圳一季度写字楼市场仍处于恢复状态_环球快播报

伊利股份：4月24日融资买入1.76亿元，融资融券余额42.36亿元 全球热消息

《黑暗之魂3》猎龙铠甲打法指南（《黑暗之魂3》猎龙铠甲打法指南）-焦点热门

环球热消息：upwork官网中文版下载手机_upwork官网中文版

全新别克君越内饰曝光！30英寸曲面屏太惹眼，这么厚道干不过雅阁？

吃芒果会胖吗早上 吃芒果会胖_天天速递

世界观察：汤姆猫：一季度净利润同比减少44.01%

高铁奶茶_关于高铁奶茶简述_今日报

世界信息:只交了养老保险没有交医保可以吗？养老保险要交多少钱？

男子自认被冤枉来派出所报警 一查真有事_每日视点

天天速读：湖南裕能最新公告：拟投建云南裕能新能源电池材料生产基地二期项目

实时焦点：亲子共读书香润泉城 襄都区举办亲子朗诵比赛

欧洲央行管委维勒鲁瓦：全球央行的核心任务是价格稳定，气候变化已经影响了价格和活动水平-今日热闻

成渝地区双城经济圈全球投资推介会举行推出超万亿元规模投资项目

逆转の妖精第一章4 梦想

定制鞋柜深度标准尺寸是多少世界热讯

瑞典央行如期加息50个基点承诺将再加息25个基点

4月26日 14:23分水发燃气（603318）股价快速拉升

重实效强实干抓落实丨签约项目18个，成交金额超100亿元！广西举办工业服务保障重大工程项目推进会

环球快资讯：日本首个登月舱或已撞向月球表面航天计划再受挫

全国共有托育服务机构约7.5万家提供托位数约350万个

溜出去露营官网在哪下载最新官方下载安装地址

视点！视频｜合肥这一“谷”力量让中国更美

安车检测：2023年第一季度净利润约420万元同比下降72.28% 世界热文

继续缺席明日比赛小卡已打完快艇生涯最后一战？

最新快讯!99元睡大厅?酒店回应:会免费升房不会真的睡大厅

女子遇火灾将2娃扔下楼获救自己身亡基本情况讲解-天天看点

山西省地质调查院世界观焦点

伊利股份：4月24日融资买入1.76亿元，融资融券余额42.36亿元全球热消息

吃芒果会胖吗早上吃芒果会胖_天天速递

男子自认被冤枉来派出所报警一查真有事_每日视点

实时焦点：亲子共读书香润泉城襄都区举办亲子朗诵比赛

美媒：美军陷征兵危机民众信任度骤降

灌篮高手电影OP主唱确诊食道癌后续音乐活动全部取消每日视讯

天士力(600535.SH)：一季度营业收入20.8亿元当前热点

A股跌破3300点！AI板块出现分化游戏传媒方向暴涨

投资人出差去西宁今日快看

当前热文：长远锂科：一季度净利润92.9万元同比下降99.69%

【天天快播报】受益持有东鹏饮料股份巴比食品一季度归母净利润大增

当前热议!瓶邪头像_瓶邪桌面精灵

中国星辰丨格物致知叩问苍穹焦点消息

跨越千里来相“舰”！南部战区海军某基地举办舰艇开放活动今日关注

当前热门：“二阳”冲上热搜张文宏发声中疾控最新通报

京东健康皮肤医院正式上线系国内首个皮肤互联网医院

热消息：标普500超75%公司业绩超预期是期望太低还是业绩太好？

焦点关注：意甲-米兰主场2-0莱切连续4轮不败莱奥梅开二度

山西省交通开发投资集团有限公司当前视点

海警的工资待遇_中国海警工资待遇全球实时

长沙理工大学：惠生“最后一公里”！智慧物流车校园忙天天观点

中国红牛被禁止生产销售是什么样的呢？

全球视点！天津社保卡余额怎么查询有哪些方法查询

全球焦点！安徽萧县一合作社存款无法取出官方通报

推荐一款轻量级全栈式开源测试平台！报道

外企面试英语自我介绍_外企面试英语自我介绍范文世界视讯

世界看热讯：“中国鞋都”晋江稳订单鞋博会“吸金”311.6亿元创新高

三次出卖同胞，专躲背后插刀，谍战剧史上“最强捡漏王”，非他莫属速看

天弘中证医药100指数型发起式证券投资基金2023年第1季度报告环球视讯

南钢争夺战升级！沙钢起诉，复星回应：滥用诉权当前聚焦

今日播报!泸州老窖携手中国歌剧舞剧院出品音乐诗剧《大河》开启全球巡演

信用卡逾期发短信说排期是真的吗？信用卡逾期多久会被停用？全球播报