David Shen

Пікірлер

@user-nu9kh7sy5j 7 ай бұрын

讲的太好了

@jackielee8089 7 ай бұрын

讲的挺好，就是收音效果太差了，听着难受

@wadergu 9 ай бұрын

挺容易懂得。老师多问一句，那Input在Decoder里的作用是什么呢？

@DavidShen-ph6iq 8 ай бұрын

不好意思，没理解你的input和decode是指的什么。

@davidhangzhou5113 10 ай бұрын

讲的挺清晰的

@DavidShen-ph6iq 8 ай бұрын

谢谢！：）

@davidhangzhou5113 10 ай бұрын

多谢老师

@DavidShen-ph6iq Жыл бұрын

本视频所有资料都是从网络上获取，如有侵权，请告知，谢谢。😄

@DavidShen-ph6iq Жыл бұрын

以下是Transformer模型学习路径所涉及到资料的链接。 1. What Are Transformer Models and How Do They Work?， txt.cohere.com/what-are-transformer-models/ 中文版 blog.csdn.net/shenyang2/article/details/131199513?spm=1001.2014.3001.5502 面向初学者的科普文章，不涉及到任何数学公式。本视频的内容也大部分来源于此。 2. The Illustrated Transformer， jalammar.github.io/illustrated-transformer/?ref=txt.cohere.com 中文版 blog.csdn.net/yujianmin1990/article/details/85221271 Transformer模型最出名的科普文章，介绍了模型的原理，架构还有数学公式。作者是Jay Alammar。 3。 Transformer通俗笔记：从Word2Vec、Seq2Seq逐步理解到GPT、BERT blog.csdn.net/v_JULY_v/article/details/127411638 周磊(July)的科普文章，更系统地介绍了模型和其所依赖的体系知识。 4。从零实现Transformer、ChatGLM-6B、LangChain+LLM的本地知识库问答 blog.csdn.net/v_JULY_v/article/details/130090649 周磊(July)的科普文章，从代码实现的角度加深对模型的认识。而且更有ChatGLM和Langchain的代码分析。 5. Transformer论文逐段精读 kzfaq.info/get/bejne/pOChn6l6yKm3h4U.html 李沐关于transformer论文的精彩视频解读。 6. Attention is All You Need arxiv.org/abs/1706.03762 Transformer模型的原始论文。 7. 世界的参数倒影：为何GPT通过Next Token Prediction可以产生智能 zhuanlan.zhihu.com/p/632795115 张俊林对于LLM语言一些更深层次的思考和总结

Ең жақсы KZfaq

Пікірлер