Transformer论文逐段精读

Transformers, explained: Understand the model behind GPT, BERT, and T5

But what is a GPT? Visual intro to transformers | Chapter 5, Deep Learning

Please be kind🙏

Мы никогда не были так напуганы!

МАМА И STANDOFF 2 😳 !FAKE GUN! #shorts

Wait for the last one! 👀

Transformer论文逐段精读

Рет қаралды 381,074

Mu Li

Күн бұрын

00:00 标题和作者
03:21 摘要
08:11 结论
10:05 导言
14:35 相关工作
16:34 模型
1:12:49 实验
1:21:46 讨论

Пікірлер: 195

@rikkatakanashi9703

@rikkatakanashi9703 Жыл бұрын

讲的非常清楚，非常感谢老师的讲解！！❤

@jinhuizhang702

@jinhuizhang702 2 жыл бұрын

太棒了，很喜欢精读论文系列

@jasperlin1996 Жыл бұрын

謝謝大佬深入淺出又補充了不少相關知識真的是造福後進

@haoranding3324

@haoranding3324 10 ай бұрын

感谢大佬，真的是深入浅出！支持老师出更多视频！

@rampagetam9042

@rampagetam9042 Жыл бұрын

解释得非常好，Thanks

@tuoli7266 Жыл бұрын

万分感谢! 期待您更多的作品

@user-jw8bf7sx6z

@user-jw8bf7sx6z Жыл бұрын

讲的太好了！非常适合我这样的小白学习。

@tokyoaflowertokyo8300

@tokyoaflowertokyo8300 Жыл бұрын

真有耐心啊，谢谢主播分享

@testyoutubetest5910

@testyoutubetest5910 Жыл бұрын

理解透彻，讲解深入浅出，还肯花时间录制视频，收下我的膝盖

@hw5622 3 ай бұрын

讲得真好，我反复读了好多遍了听你讲还能温故知新太棒了！谢谢李老师！

@cici4148 2 жыл бұрын

最近刚好在学transformers有点疑惑老师讲得非常清晰问题迎刃而解感谢！

@alexsuen3506 9 ай бұрын

Thank you very much for you work, Dr. Li!

@user-qi6qi7rj3i

@user-qi6qi7rj3i 11 ай бұрын

感谢大佬的分享，非常的浅显易懂，能够很好的将以往的技术和论文中的架构设计结合起来去讲解，让听众能够明白为什么这样设计，以前是怎么设计，以前和现在的设计各自的优点和缺点是什么，视频中还有许多很直观的比喻，之前看原文真实看的一头雾水、不体系，正式因为看到一小段就需要去深入挖掘一些额外的知识才能继续阅读，这可能也是信息密度高的文章比较晦涩难懂的原因，还好有您的视频才让更多对AI、对模型感兴趣的人能够更好的学习这个领域的知识，感谢~^_^

@jiahangsu7100 10 ай бұрын

谢谢大佬的讲解，详细易懂～感谢感谢！

@UTE2 Жыл бұрын

非常感谢您的分享！

@justintw888 5 ай бұрын

聽了好幾遍，講得實在太好了！

@g1y5x3 Ай бұрын

57:00 感觉是整个精读的精髓，谢谢老师！

@jinhuizhang702

@jinhuizhang702 2 жыл бұрын

太棒了受益匪浅

@karlshomekitchen

@karlshomekitchen 9 күн бұрын

感謝指點我們的注意力

@zhengqingpei7136

@zhengqingpei7136 3 ай бұрын

讲的太好了。我 AI 完全不懂，都可以理解你讲的。感谢！

@yewenli Жыл бұрын

老师讲的太好了！深入浅出！

@bennyzhao6577 Жыл бұрын

讲的太好了老师，谢谢！

@sephiroth0733 7 ай бұрын

感谢分享层层深入

@jx92haha Жыл бұрын

讲的太棒了！！必须点赞

@jonathanwan5519

@jonathanwan5519 Жыл бұрын

真的太好了宝藏频道

@amymu2731 Жыл бұрын

Very impressive! Thank you!

@Shyan68 Жыл бұрын

你的解說讓我的眼界更進一步了…

@lilllllllllllll

@lilllllllllllll 10 ай бұрын

受益良多，期待更多分享。

@changken Жыл бұрын

老師太神了

@zyw2134 Жыл бұрын

感谢大神无私分享，拜谢~！

@LinnaDu Жыл бұрын

大神讲的真是浅显易懂，切中要害，听了那么多版本的attenion，就您这版最好理解。感觉自己听懂了，明白了。非常感谢您的分享。

@senx8758 Жыл бұрын

李宏毅的更细节一些。

@jamesmina7258 18 күн бұрын

感谢李沐老师，常读常新。

@DakerTT Жыл бұрын

谢谢老师，很有价值的分享。褒奖的褒，念Bao（同保）。

@xiaoxucao470 Жыл бұрын

谢谢老师，感谢大佬带我入门Transformer

@shl9336 2 ай бұрын

视频真的非常好

@fanyang2061 2 жыл бұрын

谢谢，讲得清晰明了

@ryanwang7160 2 ай бұрын

lz讲得真好，视频做得也很上心！一部视频tshirt换了好几次

@brycegu2245 10 ай бұрын

讲的是真的好

@cancui1192 2 ай бұрын

感谢，多年之后回来看还是有所收获。

@rchenandrews2850

@rchenandrews2850 2 ай бұрын

非常赞，讲得很清楚

@zz_home 8 ай бұрын

非常有用,感謝大老

@jazlynlin9995 2 жыл бұрын

讲得好细啊！超棒！

@NierAutomata2B

@NierAutomata2B 2 жыл бұрын

膜拜大神，认真学习！

@csctbadi Жыл бұрын

真的不错！大神就是大神！

@show_timemagic7030

@show_timemagic7030 Жыл бұрын

感谢老师分享

@user-vd5pr6ss5t

@user-vd5pr6ss5t Жыл бұрын

感谢分享！

@yunqin3407 2 күн бұрын

感谢精讲！挑个小毛病。4:52 褒（音同包）义词

@yian4589 Жыл бұрын

谢谢很有裨益

@m13253 Жыл бұрын

哇，竟然有一个半小时的全程字幕。辛苦了。

@noonehere238 Жыл бұрын

讲的真好

@wenwenzhang635

@wenwenzhang635 11 ай бұрын

宝藏博主！谢谢您的分享。想跟着博主学习更多ML的知识。

@derek142 3 ай бұрын

未看先感谢沐神~

@ilpreterosso Жыл бұрын

太感谢啦！

@user-bn1rh9xm5h

@user-bn1rh9xm5h Жыл бұрын

講的太好了，痛哭流涕啊

@unclejoe666 Жыл бұрын

感谢大佬！

@misspanda5717 6 ай бұрын

在encoder中的自注意力可以计算所有的score（Q*K),encode中的mask是为了防止对输入序列中padding的数据计算分数。在decoder中mask是为了屏蔽“未来“的数据。

@zhaohaiding9220

@zhaohaiding9220 3 ай бұрын

再来看李老师的讲解，终于看懂了（差不多）

@greenshadowooo

@greenshadowooo 4 ай бұрын

Thanks for detail explanation

@terryliu3635 Ай бұрын

THE BEST!!!

@yingguo4174 Жыл бұрын

大神❤

@user-bp3zf1rt3t

@user-bp3zf1rt3t Жыл бұрын

厉害！

@muxingg 3 ай бұрын

非常棒！没有完全听懂，因为不是搞AI计算的，但是几十年前搞过并行算法的科学计算，很多东西是类比的。还是很有收获。大概需要多看几遍

@allandogreat Жыл бұрын

非常好，大学没有这么好的课程。沐神，身体健康

@user-un3ci9jp7s

@user-un3ci9jp7s 11 ай бұрын

你在黑你大学的教学质量哈哈

@otrees Жыл бұрын

谢谢，老师，太帅了

@Fat_Cat_Fly Жыл бұрын

感谢！

@xwyangjshb2 Жыл бұрын

感谢🙏

@JiancongXie Жыл бұрын

感谢~~

@dannyp5358 Жыл бұрын

感謝！

@zy5522 Жыл бұрын

感謝

@jameshao2270 Жыл бұрын

多谢！

@user-lh3yi9fi7v

@user-lh3yi9fi7v Жыл бұрын

辛苦辛苦

@zioncheng7798 Жыл бұрын

Repect！感恩大佬

@williamlee4215

@williamlee4215 11 ай бұрын

Very good

@kennys4100 2 ай бұрын

在LLM大规模发展应用的今天再回头来看这个，感叹核心技术对行业发展的强大推动力，还有就是大道至简

@kururuhuang3829

@kururuhuang3829 2 ай бұрын

感谢大佬

@sunwrighttrainingschool8138

@sunwrighttrainingschool8138 2 жыл бұрын

加油

@li-pingho1441 Жыл бұрын

太牛逼了！！！

@CasinoBaccaratKingmaker

@CasinoBaccaratKingmaker Ай бұрын

了不起的成就與貢獻❤❤❤😂😂😂

@tongli4110 Жыл бұрын

感谢！！之前有一个点一直理解错了😂🤣

@user-sk3dr8nl9u

@user-sk3dr8nl9u Жыл бұрын

一輪簽! 謝謝大大，讓我知識完備很多

@TJVideoChannelUTube

@TJVideoChannelUTube Жыл бұрын

In Transformer model, only these layer types are involved in the deep learning/containing trainable parameters, and (3) with activation functions: (1). Word Embedding Layer; (2). Weighted matrices for K, V, Q; (3). Feed Forward Layer or Fully Connected Layer. Correct?

@hasszhao 3 ай бұрын

目前全网最优论文“解毒”保姆，小白这里佩服你。

@ginawhalevg Жыл бұрын

thanks!

@lionhuang9209 2 жыл бұрын

Thanks.

@starbuckseric4038

@starbuckseric4038 Жыл бұрын

大佬您為何那麼晚才讓我看到您的影片太感激了

@cy2340 Жыл бұрын

太好了, 反复看!!!!

@meiriweixin 6 ай бұрын

局外人发言。不小心搜到这个视频。视频看了一大半，觉得博主讲得好，心想这人一定自己懂很多，纳闷他会是哪个大学的计算机老师。原来是传说中的人物:)

@victorzhao212 Жыл бұрын

沐神，读论文一般用什么设备什么软件啊？

@qiangzhu1572 2 жыл бұрын

一万个赞

@yujinhuang8112

@yujinhuang8112 2 жыл бұрын

So strong

@user-ev2ix2rs3c

@user-ev2ix2rs3c 2 жыл бұрын

大神

@huajieshao5226

@huajieshao5226 2 жыл бұрын

Mu神厉害

@ipconfiger Жыл бұрын

大佬牛逼

@b95109028 Жыл бұрын

大老恕我爆粗口但是給予敬意：他媽的這種視頻都有。謝謝了

@user-nx6wn4xc9y

@user-nx6wn4xc9y 11 ай бұрын

牛逼r

@jiyuanan6927 Ай бұрын

太清楚了，谢谢，能问一下数据训练是在哪个阶段做的？

@bowarrow8045 Жыл бұрын

👍👍👍👍

@user-iq9cp1ht5w

@user-iq9cp1ht5w Жыл бұрын

这简直是种享受，大佬教学确实不一样

@knightleung 11 ай бұрын

非常好! 唯一有一点没讲太清楚的时候就是训练和预测的时候outputs sequence是具体怎么用的

@samuelleung9930

@samuelleung9930 11 ай бұрын

这个视频还有前两集，它们在visualize上做得挺好的。

@TreeForest2023

@TreeForest2023 2 жыл бұрын

沐神阔以讲解下对比学习，无监督自监督类的文章吗？

Transformers, explained: Understand the model behind GPT, BERT, and T5

9:11

Transformers, explained: Understand the model behind GPT, BERT, and T5

Google Cloud Tech

Рет қаралды 894 М.

But what is a GPT? Visual intro to transformers | Chapter 5, Deep Learning

27:14

But what is a GPT? Visual intro to transformers | Chapter 5, Deep Learning

3Blue1Brown

Рет қаралды 2,6 МЛН

Please be kind🙏

00:34

Please be kind🙏

ISSEI / いっせい

Рет қаралды 163 МЛН

Мы никогда не были так напуганы!

00:15

Мы никогда не были так напуганы!

Аришнев

Рет қаралды 2 МЛН

МАМА И STANDOFF 2 😳 !FAKE GUN! #shorts

00:34

МАМА И STANDOFF 2 😳 !FAKE GUN! #shorts

INNA SERG

Рет қаралды 2,9 МЛН

Wait for the last one! 👀

00:28

Wait for the last one! 👀

Josh Horton

Рет қаралды 100 МЛН

【機器學習2021】自注意力機制 (Self-attention) (上)

28:18

【機器學習2021】自注意力機制 (Self-attention) (上)

Hung-yi Lee

Рет қаралды 210 М.

Transformer Neural Networks, ChatGPT's foundation, Clearly Explained!!!

36:15

Transformer Neural Networks, ChatGPT's foundation, Clearly Explained!!!

StatQuest with Josh Starmer

Рет қаралды 602 М.

Vision Transformer Quick Guide - Theory and Code in (almost) 15 min

16:51

Vision Transformer Quick Guide - Theory and Code in (almost) 15 min

DeepFindr

Рет қаралды 59 М.

Transformer

49:32

Hung-yi Lee

Рет қаралды 197 М.

Transformer Neural Networks - EXPLAINED! (Attention is all you need)

13:05

Transformer Neural Networks - EXPLAINED! (Attention is all you need)

CodeEmporium

Рет қаралды 783 М.

从编解码和词嵌入开始，一步一步理解Transformer，注意力机制(Attention)的本质是卷积神经网络(CNN)

1:45:12

从编解码和词嵌入开始，一步一步理解Transformer，注意力机制(Attention)的本质是卷积神经网络(CNN)

王木头学科学

Рет қаралды 61 М.

Transformers for beginners | What are they and how do they work

19:59

Transformers for beginners | What are they and how do they work

AssemblyAI

Рет қаралды 147 М.

[1hr Talk] Intro to Large Language Models

59:48

[1hr Talk] Intro to Large Language Models

Andrej Karpathy

Рет қаралды 1,9 МЛН

Transformer models and BERT model: Overview

11:38

Transformer models and BERT model: Overview

Google Cloud Tech

Рет қаралды 83 М.

Illustrated Guide to Transformers Neural Network: A step by step explanation

15:01

Illustrated Guide to Transformers Neural Network: A step by step explanation

The AI Hacker

Рет қаралды 924 М.

Please be kind🙏

00:34

Please be kind🙏

ISSEI / いっせい

Рет қаралды 163 МЛН