DPO: Reward Model없이 사람선호를 학습할 수 있을까?| NeurIPS 2023 | 이승현

  Рет қаралды 575

거꾸로 읽는 AI 이야기

거꾸로 읽는 AI 이야기

Ай бұрын

NLP+AI 분야 커리어 컨설팅/논문 함께 읽기 멘토링
- inf.run/BFSu
발표자: 이승현
발표자료: drive.google.com/file/d/1iXjq...

Пікірлер
LLAMA2: 오픈소스 위한 LLM 레시피 - Pre-training | Meta 2023 |  김보섭
21:49
거꾸로 읽는 AI 이야기
Рет қаралды 881
Final muy inesperado 🥹
00:48
Juan De Dios Pantoja
Рет қаралды 15 МЛН
小女孩把路人当成离世的妈妈,太感人了.#short #angel #clown
00:53
When someone reclines their seat ✈️
00:21
Adam W
Рет қаралды 29 МЛН
LLM 학습 데이터가 고갈될까? | ArXiv 2022 | 이인규
40:14
거꾸로 읽는 AI 이야기
Рет қаралды 555
PR-453: Direct Preference Optimization
37:12
JoonHo LEE
Рет қаралды 3,4 М.
GPT4로 특이점 실험을 해봤다는데 결과가 충격임
6:59
Symmetry and Universality - Dr Sophia Sanborn (Science)
26:07
Thinking About Thinking
Рет қаралды 2,1 М.
LLM 역사를 함께 거꾸로 읽어보시죠 ! | 강재욱
46:03
거꾸로 읽는 AI 이야기
Рет қаралды 1,9 М.
Joseph Suarez Thesis Defense - Neural MMO
1:00:06
Neural MMO
Рет қаралды 104 М.
Direct Preference Optimization:  Forget RLHF (PPO)
9:10
code_your_own_AI
Рет қаралды 12 М.
The Most Important Algorithm in Machine Learning
40:08
Artem Kirsanov
Рет қаралды 269 М.
[Paper Review] LLM2Vec: Large Language Models Are Secretly PowerfulText Encoders
40:44
고려대학교 산업경영공학부 DSBA 연구실
Рет қаралды 639
Final muy inesperado 🥹
00:48
Juan De Dios Pantoja
Рет қаралды 15 МЛН