«GigaChat: наш опыт обучения LLM»

«Компьютерное зрение в Роботах на складах Маркета»

Иван Бондаренко |Большие языковые модели против трансформер-энкодеров для распознавания им.сущностей

Normal vs Smokers !! 😱😱😱

Did the cockroaches eat the whole cake?🪳🍰 Baby is not afraid of insects🙀

Khi Ba Mẹ ép cưới kiểu | #beneagle #eaglesacademy #kungfu #martialarts #heroic #action #trending

ОХЛОДИЛ ПЫЛ "ЗВЕРЯ" И СДЕЛАЛ ЕГО ЧУТКА ПОСКРОМНЕЕ!

«GigaChat: наш опыт обучения LLM»

Рет қаралды 2,482

Yandex for ML

Yandex for ML

7 ай бұрын

«GigaChat: наш опыт обучения LLM»
Дани Эль-Айясс, Исполнительный директор, SberDevices
Большие языковые модели (LLM) являются новым этапом развития интеллектуальных систем, решающих задачи на естественном языке. Помимо глубокого понимания структуры языка, LLM также формируют знания о мире во время обучения на больших корпусах текста, что выводит их на новый качественный уровень, открывая новые эмерджентные способности, такие как подходы, основанные на нулевом или крайне мало числе примеров (Few-Shot/Zero-Shot Learning/Prompting) и построение рассуждений (Reasoning).
Но обучение подобных моделей является сложной задачей, требующей большого количества ресурсов и тонкой настройки. В докладе мы хотим поделится нашим опытом обучения модели ruGPT-3.5 - большой языковой модели от Сбера, лежащей в основе генеративного сервиса GigaChat, начиная с предобучения и заканчивая RLHF-пайплайном.

Пікірлер: 2

@karatemoscow 5 ай бұрын

llama2 в русском полное говно по сравнению с чатчпт

@user-gn6ml5tm8l

@user-gn6ml5tm8l 3 ай бұрын

Ну а пруфы?

«Компьютерное зрение в Роботах на складах Маркета»

36:37

«Компьютерное зрение в Роботах на складах Маркета»

Yandex for ML

Рет қаралды 427

Иван Бондаренко |Большие языковые модели против трансформер-энкодеров для распознавания им.сущностей

53:39

Иван Бондаренко |Большие языковые модели против трансформер-энкодеров для распознавания им.сущностей

ODS AI Ru

Рет қаралды 1,6 М.

Normal vs Smokers !! 😱😱😱

00:12

Normal vs Smokers !! 😱😱😱

Tibo InShape

Рет қаралды 87 МЛН

Did the cockroaches eat the whole cake?🪳🍰 Baby is not afraid of insects🙀

00:40

Did the cockroaches eat the whole cake?🪳🍰 Baby is not afraid of insects🙀

Giggle Jiggle

Рет қаралды 31 МЛН

Khi Ba Mẹ ép cưới kiểu | #beneagle #eaglesacademy #kungfu #martialarts #heroic #action #trending

00:57

Khi Ba Mẹ ép cưới kiểu | #beneagle #eaglesacademy #kungfu #martialarts #heroic #action #trending

BEN EAGLE

Рет қаралды 36 МЛН

ОХЛОДИЛ ПЫЛ "ЗВЕРЯ" И СДЕЛАЛ ЕГО ЧУТКА ПОСКРОМНЕЕ!

00:56

ОХЛОДИЛ ПЫЛ "ЗВЕРЯ" И СДЕЛАЛ ЕГО ЧУТКА ПОСКРОМНЕЕ!

HARD_MMA

Рет қаралды 9 МЛН

Как трансформация общества повлияла на подходы к управлению командой. Денис Паршин

28:46

Как трансформация общества повлияла на подходы к управлению командой. Денис Паршин

ProductCamp Russia

Рет қаралды 7

Михаил Хрущев. Большие языковые модели: что это, как их обучать и что с ними делать

51:21

Михаил Хрущев. Большие языковые модели: что это, как их обучать и что с ними делать

Видео с мероприятий {speach!

Рет қаралды 748

[1hr Talk] Intro to Large Language Models

59:48

[1hr Talk] Intro to Large Language Models

Andrej Karpathy

Рет қаралды 1,8 МЛН

От T9 до ChatGPT/ ML-инженер о том, как работают языковые модели и мифах вокруг AI

1:26:13

От T9 до ChatGPT/ ML-инженер о том, как работают языковые модели и мифах вокруг AI

KOTELOV

Рет қаралды 5 М.

Дмитрий Бугайченко - Демистифицируем машинное обучение - из разработчика в ML-инженеры

37:22

Дмитрий Бугайченко - Демистифицируем машинное обучение - из разработчика в ML-инженеры

JPoint, Joker и JUG ru

Рет қаралды 6 М.

Inside the LLM: Visualizing the Embeddings Layer of Mistral-7B and Gemma-2B

26:59

Inside the LLM: Visualizing the Embeddings Layer of Mistral-7B and Gemma-2B

Chris Hay

Рет қаралды 5 М.

Что такое искусственный интеллект и какие у него цели

57:26

Что такое искусственный интеллект и какие у него цели

Яндекс Образование

Рет қаралды 7 М.

Как работает ChatGPT: объясняем нейросети просто

39:04

Как работает ChatGPT: объясняем нейросети просто

RationalAnswer | Павел Комаровский

Рет қаралды 1,1 МЛН

Вечер в Музее. Как устроен искусственный интеллект?

1:36:46

Вечер в Музее. Как устроен искусственный интеллект?

Яндекс Образование

Рет қаралды 2,6 М.

Алина Чугунова - Идеальный разметчик данных: как найти и обучить?

30:54

Алина Чугунова - Идеальный разметчик данных: как найти и обучить?

ODS AI Ru

Рет қаралды 3 М.

Normal vs Smokers !! 😱😱😱

00:12

Normal vs Smokers !! 😱😱😱

Tibo InShape

Рет қаралды 87 МЛН