Пікірлер
@user-nu9kh7sy5j
@user-nu9kh7sy5j 7 ай бұрын
讲的太好了
@jackielee8089
@jackielee8089 7 ай бұрын
讲的挺好,就是收音效果太差了,听着难受
@wadergu
@wadergu 9 ай бұрын
挺容易懂得。老师多问一句, 那Input在Decoder里的作用是什么呢?
@DavidShen-ph6iq
@DavidShen-ph6iq 8 ай бұрын
不好意思,没理解你的input和decode是指的什么。
@davidhangzhou5113
@davidhangzhou5113 10 ай бұрын
讲的挺 清晰的
@DavidShen-ph6iq
@DavidShen-ph6iq 8 ай бұрын
谢谢! :)
@davidhangzhou5113
@davidhangzhou5113 10 ай бұрын
多谢老师
@DavidShen-ph6iq
@DavidShen-ph6iq Жыл бұрын
本视频所有资料都是从网络上获取,如有侵权,请告知,谢谢。😄
@DavidShen-ph6iq
@DavidShen-ph6iq Жыл бұрын
以下是Transformer模型学习路径所涉及到资料的链接。 1. What Are Transformer Models and How Do They Work?, txt.cohere.com/what-are-transformer-models/ 中文版 blog.csdn.net/shenyang2/article/details/131199513?spm=1001.2014.3001.5502 面向初学者的科普文章,不涉及到任何数学公式。本视频的内容也大部分来源于此。 2. The Illustrated Transformer, jalammar.github.io/illustrated-transformer/?ref=txt.cohere.com 中文版 blog.csdn.net/yujianmin1990/article/details/85221271 Transformer模型最出名的科普文章,介绍了模型的原理,架构还有数学公式。作者是Jay Alammar。 3。 Transformer通俗笔记:从Word2Vec、Seq2Seq逐步理解到GPT、BERT blog.csdn.net/v_JULY_v/article/details/127411638 周磊(July)的科普文章,更系统地介绍了模型和其所依赖的体系知识。 4。 从零实现Transformer、ChatGLM-6B、LangChain+LLM的本地知识库问答 blog.csdn.net/v_JULY_v/article/details/130090649 周磊(July)的科普文章,从代码实现的角度加深对模型的认识。而且更有ChatGLM和Langchain的代码分析。 5. Transformer论文逐段精读 kzfaq.info/get/bejne/pOChn6l6yKm3h4U.html 李沐关于transformer论文的精彩视频解读。 6. Attention is All You Need arxiv.org/abs/1706.03762 Transformer模型的原始论文。 7. 世界的参数倒影:为何GPT通过Next Token Prediction可以产生智能 zhuanlan.zhihu.com/p/632795115 张俊林对于LLM语言一些更深层次的思考和总结 ​