Интенсив GPT Week. Лекция 4: "Alignment"

Интенсив GPT Week. Семинар 3: "Alignment"

🔴Наводнение века в Германии; Зеленский критикует Китай; Израиль принял план Байдена? DW Новости

ХОТЯ БЫ КИНОДА 2 - официальный фильм

Footage Released of Moment Truck Pludges Off Clark Memorial Bridge in Louisville | 10 News First

Did you find it?! 🤔✨✍️ #funnyart

NO NO NO YES! (50 MLN SUBSCRIBERS CHALLENGE!) #shorts

Интенсив GPT Week. Лекция 4: "Alignment"

Рет қаралды 3,390

Яндекс Образование

Яндекс Образование

6 ай бұрын

Спикер: Паша Темирчев, разработчик группы поиска смысла
Статьи, на которые есть отсылки в лекции или которые использовались при подготовке материала:
1) A General Language Assistant as a Laboratory for Alignment, arxiv.org/abs/2112.00861
Статья от Anthropic, в которой вводится терминология Harmless, Helpful, Honest агента, и в целом описан процесс обучения модели предпочтений.
2) Reinforcement Learning Textbook, Ivanov S., arxiv.org/abs/2201.09746
Конспект лекций по обучению с подкреплением от Сергея Иванова на русском языке (рекомендуем)
3) Proximal Policy Optimization, arxiv.org/abs/1707.06347
РРО - алгоритм, который обычно используется в дообучении LMок на задачу Alignment
В лекции мы его проскочили вскользь, разобрав его базу - градиент по политике.
4) Direct Preference Optimization arxiv.org/pdf/2305.18290.pdf
Метод alignment'а, с которым мы познакомимся на семинаре

Пікірлер: 6

@ilnaz007 6 ай бұрын

классный лектор, все доступно объяснил

@user-sx2ju9nv5o

@user-sx2ju9nv5o 6 ай бұрын

очень крутой лектор!

@mstas1977 6 ай бұрын

Лучший лектор!

@bukovelby 6 ай бұрын

Какие люди работают в Яндексе, неожиданно классные лекторы!

@nikprilutskiy7064

@nikprilutskiy7064 6 ай бұрын

Очень живая лекция получилась, особенно на контрасте со вчерашней) спасибо!

@mgonetwo 6 ай бұрын

Паша похож на джина из восточных сказок лол

Интенсив GPT Week. Семинар 3: "Alignment"

1:02:11

Интенсив GPT Week. Семинар 3: "Alignment"

Яндекс Образование

Рет қаралды 2,2 М.

🔴Наводнение века в Германии; Зеленский критикует Китай; Израиль принял план Байдена? DW Новости

58:11

🔴Наводнение века в Германии; Зеленский критикует Китай; Израиль принял план Байдена? DW Новости

DW на русском

Рет қаралды 187 М.

ХОТЯ БЫ КИНОДА 2 - официальный фильм

1:35:34

ХОТЯ БЫ КИНОДА 2 - официальный фильм

ХОТЯ БЫ В КИНО

Рет қаралды 2,5 МЛН

Footage Released of Moment Truck Pludges Off Clark Memorial Bridge in Louisville | 10 News First

00:18

Footage Released of Moment Truck Pludges Off Clark Memorial Bridge in Louisville | 10 News First

10 News First

Рет қаралды 73 МЛН

Did you find it?! 🤔✨✍️ #funnyart

00:11

Did you find it?! 🤔✨✍️ #funnyart

Artistomg

Рет қаралды 123 МЛН

NO NO NO YES! (50 MLN SUBSCRIBERS CHALLENGE!) #shorts

00:26

NO NO NO YES! (50 MLN SUBSCRIBERS CHALLENGE!) #shorts

PANDA BOI

Рет қаралды 102 МЛН

Проект успешно завершен, теперь "Prince of Persia" есть и для БК0011М!

8:38

Проект успешно завершен, теперь "Prince of Persia" есть и для БК0011М!

grf

Рет қаралды 14 М.

UFC 302: Главные моменты пресс-конференции

13:50

UFC 302: Главные моменты пресс-конференции

UFC Eurasia

Рет қаралды 599 М.

БАЛТИКА - ЗЕНИТ, ОБЗОР МАТЧА | Суперфинал FONBET Кубок России

11:10

БАЛТИКА - ЗЕНИТ, ОБЗОР МАТЧА | Суперфинал FONBET Кубок России

FONBET Кубок России

Рет қаралды 117 М.

💥АСЛАНЯН: питання з дозволом бити по рф виявилося складнішим, ніж здавалося

35:35

💥АСЛАНЯН: питання з дозволом бити по рф виявилося складнішим, ніж здавалося

Телеканал Прямий

Рет қаралды 137 М.

Мастер и Маргарита: Мессир, мне больше нравится Рим

33:50

Мастер и Маргарита: Мессир, мне больше нравится Рим

Екатерина Шульман

Рет қаралды 77 М.

Зеленский Пересек Красную Линию | ВС РФ Наступают По Всему Фронту. Военные Сводки И Анализ 02.6.2024

29:17

Зеленский Пересек Красную Линию | ВС РФ Наступают По Всему Фронту. Военные Сводки И Анализ 02.6.2024

Военные Сводки

Рет қаралды 277 М.

Пара мыслей о том, как уместить ПЛАН, ФАКТ и ПРОГНОЗ на одном графике | Power BI - Лайфхаки и фишки

10:10

Пара мыслей о том, как уместить ПЛАН, ФАКТ и ПРОГНОЗ на одном графике | Power BI - Лайфхаки и фишки

Power BI - Лайфхаки и фишки

Рет қаралды 571

ХОТЯ БЫ КИНОДА 2 - официальный фильм

1:35:34

ХОТЯ БЫ КИНОДА 2 - официальный фильм

ХОТЯ БЫ В КИНО

Рет қаралды 2,5 МЛН