Fine-Tuning в ChatGPT. Как дообучить LLM (простым языком и на примере)

  Рет қаралды 5,017

Singularity is Coming

Singularity is Coming

9 ай бұрын

Разбираем, что такое:
В видео рассказываю как устроен fine tuning в ChatGPT и других LLM.
Содержание
1:16 - про Zero-shot, one-shot, few-shots в Prompt Engineering
3:47 - что такое fine-tuning моделей
5:57 - плюсы и минус использования файн-тюнинга
8:51 - советы по подготовке дата сетов
11:45 - мой личный пример файн-тюнинга chatgpt
Presentation:
docs.google.com/presentation/...

Пікірлер: 26
@xeno7828
@xeno7828 5 күн бұрын
Ну наконец то нашелся вменяемый канал который по пальцам объясняет новичкам что и как устроено !)
@user-vz4vc6dy4r
@user-vz4vc6dy4r 17 күн бұрын
10 в нулевой степени это 1 10 в первой степени это 10 А видос крутой
@yarafilms
@yarafilms 9 ай бұрын
Прям мега полезно! Как раз искал понятные материал, буду пробовать! Спасибо! ;)
@secondlifetools6060
@secondlifetools6060 Ай бұрын
это охрененно полезная инфа! продолжай пожалуйста.
@TheAmadur
@TheAmadur 4 ай бұрын
Это топовый видос. Очень помог, спасибо
@yason24ru
@yason24ru 9 ай бұрын
Крутой видос. Спасибо большое
@dmitriyneledva4693
@dmitriyneledva4693 7 ай бұрын
очень крутое видео!
@user-ud3rv5xo6z
@user-ud3rv5xo6z 8 ай бұрын
Спасибо
@kiryllshynharow9058
@kiryllshynharow9058 7 ай бұрын
2:39 Чтоооо? 10^1 это ну уж точно не сотня. Математически это 10, но судя о масштабе по подписи "Number of Examples in Context (K)" по горизонтальной оси отложены тысячи примеров
@Singularity_is_Coming
@Singularity_is_Coming 7 ай бұрын
спасибо за комментарий, верно заметили! там 10 примеров а не 100
@moresevas
@moresevas 9 ай бұрын
Отличный видос! Хотелось бы обсудить вот что: всегда ли возможны другие режимы, кроме zero-shot? Например, работаем через API чтобы оценивать ответы студентов на тест по физике, допустим из 20 заданий. Каким образом мы можем проапгрейдить zero-shot(s), если от раза к разу у нас разные 20 заданий по разным темам физики?
@Singularity_is_Coming
@Singularity_is_Coming 9 ай бұрын
в файн тюнинге зеро-шот под такую задачу идеально зайдет, нужно побольше примеров из разных тем и LLM будет справляться с разными темами без проблем. для файтюнинга я бы делал 1 запрос = 1 задание и собрал датасет хотя бы на 200-300 задач с ответами. а как улучшить уже сам zero-shot промпт рассказал в новом видео: kzfaq.info/get/bejne/eJ1hmceLtcC4Z4E.html
@Roman-hv3ss
@Roman-hv3ss 2 ай бұрын
Огонь! С огромным интересом посмотрел. Подписка. А можно таким образом дообучить локальные нейронки?
@Singularity_is_Coming
@Singularity_is_Coming 2 ай бұрын
Да, можно и локальные конечно, но ресурсов нужно много для этого, если модели большие
@povezlo46
@povezlo46 4 ай бұрын
Спасибо за полезный урок, Денис. Однозначно подписка. А что там по деньгам получилось? во сколько обошлось тебе обучить эту модель писать в стиле Нориса?
@Singularity_is_Coming
@Singularity_is_Coming 4 ай бұрын
Поскольку база небольшая, вышло недорого, что-то около 1$
@DizroAI
@DizroAI 6 ай бұрын
У меня есть небольшая база данных, и я пытаюсь разработать процесс обработки больших новостных текстов. Какую модель лучше всего использовать в этом случае, и как ее правильно настроить? На вход модели будет подаваться обширный новостной контент, а требуется получить отформатированный и сокращенный вариант текста.
@Singularity_is_Coming
@Singularity_is_Coming 6 ай бұрын
лучше всего конечно GPT-4, но нужно смотреть насколько существенная разница в качестве, т.к. разница в цене существенная - ~5-10 раз
@wmsl3944
@wmsl3944 4 ай бұрын
Привет, какой у тебя Git?
@user-xo1yo6hi3u
@user-xo1yo6hi3u 8 ай бұрын
+
@MrStepanok
@MrStepanok 3 күн бұрын
Привет! Подскажи пожалуйста, что это может быть. Я сделал файнтюнинг модели, причем прям на сайте, там сейчас появились для этого инструменты (возможно они были и раньше) но моя модель не отображается в playground. Что это может быть?
@Singularity_is_Coming
@Singularity_is_Coming 3 күн бұрын
Должна появиться через время. А по API она доступна? В любом случае это скорее вопрос в поддержку, похоже на баг.
@MrStepanok
@MrStepanok 3 күн бұрын
@@Singularity_is_Coming Разобрался! Я тренировал через организацию, и в ней вообще ничего кроме gpt3.5turbo выбрать было нельзя. Перетренил в обычном аккаунте и сразу все ок ок. Спасибо!!!
@mr.grixakrushkas5667
@mr.grixakrushkas5667 7 ай бұрын
Это лора чтоль, или есть отличия?
@IlyaPanfilov
@IlyaPanfilov 7 ай бұрын
Зачем спалил ключ на 12:29) или это пасхалка?
@Singularity_is_Coming
@Singularity_is_Coming 7 ай бұрын
пасхалка, а вообще то тестовый ключ был для видео)
"okay, but I want Llama 3 for my specific use case" - Here's how
24:20
Increíble final 😱
00:37
Juan De Dios Pantoja 2
Рет қаралды 78 МЛН
Please be kind🙏
00:34
ISSEI / いっせい
Рет қаралды 61 МЛН
Fine-tuning Large Language Models (LLMs) | w/ Example Code
28:18
Shaw Talebi
Рет қаралды 251 М.
Интервью с промпт инженером
21:38
Singularity is Coming
Рет қаралды 886
Введение в большие языковые модели (LLM)
45:27
Prompt Engineering Tutorial - Master ChatGPT and LLM Responses
41:36
freeCodeCamp.org
Рет қаралды 1,3 МЛН