«GigaChat: наш опыт обучения LLM»

  Рет қаралды 2,482

Yandex for ML

Yandex for ML

7 ай бұрын

«GigaChat: наш опыт обучения LLM»
Дани Эль-Айясс, Исполнительный директор, SberDevices
Большие языковые модели (LLM) являются новым этапом развития интеллектуальных систем, решающих задачи на естественном языке. Помимо глубокого понимания структуры языка, LLM также формируют знания о мире во время обучения на больших корпусах текста, что выводит их на новый качественный уровень, открывая новые эмерджентные способности, такие как подходы, основанные на нулевом или крайне мало числе примеров (Few-Shot/Zero-Shot Learning/Prompting) и построение рассуждений (Reasoning).
Но обучение подобных моделей является сложной задачей, требующей большого количества ресурсов и тонкой настройки. В докладе мы хотим поделится нашим опытом обучения модели ruGPT-3.5 - большой языковой модели от Сбера, лежащей в основе генеративного сервиса GigaChat, начиная с предобучения и заканчивая RLHF-пайплайном.

Пікірлер: 2
@karatemoscow
@karatemoscow 5 ай бұрын
llama2 в русском полное говно по сравнению с чатчпт
@user-gn6ml5tm8l
@user-gn6ml5tm8l 3 ай бұрын
Ну а пруфы?
Normal vs Smokers !! 😱😱😱
00:12
Tibo InShape
Рет қаралды 87 МЛН
[1hr Talk] Intro to Large Language Models
59:48
Andrej Karpathy
Рет қаралды 1,8 МЛН
Что такое искусственный интеллект и какие у него цели
57:26
Как работает ChatGPT: объясняем нейросети просто
39:04
RationalAnswer | Павел Комаровский
Рет қаралды 1,1 МЛН
Вечер в Музее. Как устроен искусственный интеллект?
1:36:46
Яндекс Образование
Рет қаралды 2,6 М.
Normal vs Smokers !! 😱😱😱
00:12
Tibo InShape
Рет қаралды 87 МЛН