No video

데이터과학자의 좌절편! 데이터과학자는 대부분의 시간을 OOO 으로 보낸다? 데이터과학자의 일상 2부! (한국과학기술정보연구원 김영진 박사)

  Рет қаралды 35,373

안될과학 Unrealscience

안될과학 Unrealscience

Күн бұрын

정보화시대로 데이터의 중요성이 늘어난 요즘,
과연 데이터를 가지고 있으면 어떤 것을 연구할 수 있을까?
정작 데이터 분석에는 얼마 시간을 못쓴다는데?!
데이터과학자의 좌절편!
한국과학기술정보연구원 김영진 연구원님과 함께 알아보시죠!
◆ 2024 신상 굿즈 블록 피규어 키링 + 포스터 출시
모어사이언스 스토어에서 만나볼 수 있습니다!
smartstore.nav...
#데이터 #데이터사이언스 #한국과학기술정보연구원 #김영진
◆ Thanks to
편집 : 노재은
Studio : 서울스트리밍스테이션
Guest : 한국과학기술정보연구원 김영진
◆ 안될과학-모어사이언스 스마트스토어 (과학굿즈)
smartstore.nav...
◆ 안될과학 인스타그램
/ unreal.science
◆ 안될과학 커뮤니티
cafe.naver.com...
◆ 안될과학 문의
E-MAIL : MoreScience2018@gmail.com

Пікірлер: 58
@Unrealscience
@Unrealscience Ай бұрын
과연 무슨일을 하는것일까? : kzfaq.info/get/bejne/mbyZaMV9ps24oZ8.html (1부) 데이터과학자의 좌절편 : kzfaq.info/get/bejne/gbx7msV61p-7pac.html (2부 - 본편)
@OnSe-MiRo
@OnSe-MiRo 2 ай бұрын
12:49데이터 분석 업무를 하고 있는데 저건 현실입니다. ㅋㅋㅋㅋ 매일 회사 출근해서 데이터 분석 보다는 데이터 정리하고 오류 있는 데이터 검토하고 있네요
@kji1875
@kji1875 2 ай бұрын
아무리 찾고 찾고 또 찾아도 또 어딘가에선 이상한 값이 튀어나오는게 일상인것같아요😢
@xjxmfakfzh
@xjxmfakfzh 2 ай бұрын
마치 화학분석할 때 실제로 기기분석하는 시간보다는 sample preparation하는 시간이 훨씬 큰 거랑 비슷한 느낌이려나요 ㅋㅋ
@jl_0725
@jl_0725 2 ай бұрын
엣지케이스랑 에러가 너무 많아요 😂
@cooki3monst3r
@cooki3monst3r 2 ай бұрын
저는 절망편에서 LLM, 특히 chatGPT의 Advanced Data Analysis 를 언급하실 줄 알았습니다 ㅋㅋ 가장 힘들고 노력이 많이 필요한, 데이터 전처리 또는 시각화 과정 등 많은 귀찮은 것들을 아주 쉽게 해결해주기 때문에 지금은 석사급 이상만 되도 API로 많이들 사용하시는 걸로 압니다. 저도 연구 목적이 아니라 아이디어만 있는 일반인인데도 재미있게 많이 사용하고 있고요 :D
@woojinlee5144
@woojinlee5144 2 ай бұрын
이게 절망이죠. MIT 나 스탠포드 가면 이쪽 공부하는 애들이 얼마나 많은데, 앞으로 이쪽 계열에서 필요한 사람들은 수학 천재 + 통계학 천재 + 데이타 셋업 + 컴퓨터 + 코딩/인문학 기본.. 코딩/통계/컴퓨터 지식만 가지고는 5-10년 안에 할일 없어질 가능성이 높음
@user-zr1ex8hq6c
@user-zr1ex8hq6c 2 ай бұрын
@@woojinlee5144 동감합니다. 끌로드 같은 LLM이 데이타사이언스 마저 잠식해버릴수 있다는걸 이런데 나와서 떠들어버린다면 ... 그거야 말로 절망이죠. 물론 머지않아 그게 현실화 되겠지만 말이죠.
@user-tq2kp5pd7z
@user-tq2kp5pd7z 2 ай бұрын
그치... 컴퓨터가 뭘 먹을지 얼마나 먹을지 어느정도 크기로 먹을만하게 잘라줘야 되는지 다 정해야 되니까 ㅋㅋㅋㅋㅋ AI: 어? 밥씹는데 돌이 있어? 밥상엎을게 사람: 아니... 그게 왜 거기... AI: 그런건 난 잘 모르겠고 와장창
@jl_0725
@jl_0725 2 ай бұрын
서비스 나갈때는 말도 안하고 와장창😅 어젯밤도 AI님이 뭐가 맘에안드셔서 엎으셨는지 파악하느라 새벽1시 퇴근했네요😂
@ksjksjgg
@ksjksjgg 2 ай бұрын
찰떡 비유^^
@hyelimy
@hyelimy 2 ай бұрын
좌절편 아니고 현실편입니당!
@sint-eo2vd
@sint-eo2vd Ай бұрын
@brandlee5089
@brandlee5089 2 ай бұрын
솔직히 스타트업에서도 클렌징 하거나 콜렉터하면 사람 없는데 분석은 많음... 그리고 막상 시키면 생각보다 유의미한 결과를 못뽑음.. 나도 뭐 분석하고 싶어서 왔지만 클렌징이나 콜렉터하면서 보다 효율적이고 좋은 방법등 찾아볼 수 있어서 좋았음 작은거부터 시작해서 몸값 키우는게 정석이라고 봄
@woojinlee5144
@woojinlee5144 2 ай бұрын
걍 github 에서 활동만 해도 최근 이쪽 천재들이 하는거 보일듯. 한국 자료는 솔찍히 몇년 늦는거 같아요.
@jl_0725
@jl_0725 2 ай бұрын
매우 동의합니다. 저는 파견직 라벨링부터 시작해서 지금은 해외 프로젝트 데이터랑 서비스 운영 총괄하게 되었네요. 작은것부터 탁월하게!
@kibumxx
@kibumxx 2 ай бұрын
현업인데... 데이터만 매일 보고 있어요. 제조 회사인데 데이터만 보다가 은퇴할 듯 ㅠㅠ 제조 데이터는 돈이 핵심인데 돈 안쓰고, 문제를 해결하라고하니 답이 없어요.
@JaehaWoo
@JaehaWoo 2 ай бұрын
중간에 데이터 분석에 들어가는 돈 얘기를 하는 와중에 하야오 감독님이 마치 넷플릭스에서 제시한 너무 큰 돈이 욕심나서 판권을 넘긴 것처럼 묘사되어 있는데 작년에 개봉한 영화 제작에 예상보다 훨씬 많은 시간과 인력이 들어가는 바람에 너무 많은 비용이 들어서 그 제작비를 충당하기 위해서 어쩔 수 없이 넷플릭스에 판권을 팔았다고 하네요. 그냥 그렇다구요..
@orangeblue9141
@orangeblue9141 2 ай бұрын
데이터 클랜징 매우매우 중요함, 건물 만드는데 기초공사 안하고 건물 올리면 무조건 사고가 나는 것처럼, 데이터의 전처리가 정말 중요함.
@mohikenatogengacetroneight9278
@mohikenatogengacetroneight9278 2 ай бұрын
궁금한건 데이터 클린징 하는 과정에서 본인의 목적에 맞게 데이터 값을 편향되게 만드는 조작의 여지도 발생할 수 있는 거 아닌가요?
@kji1875
@kji1875 2 ай бұрын
그쵸.. 그래서 분석가는 분석과정을 최대한 투명하게 오픈해야하고, 본인 스스로가 높은 윤리의식으로 스스로를 감시해야합니다.. 학계에서 가끔 터지는 연구부정 같은거니까요
@hjpark87
@hjpark87 2 ай бұрын
그래서 더 높은 수준의 연구는 클렌징에 사람 손타는 부분은 3명이상 둬서 합니다.
@user-fy8wz3vf6d
@user-fy8wz3vf6d 2 ай бұрын
내가 봤을 때 데싸들의 문제는 그들의 저질스러운 코딩능력임. 코딩능력부터 쌓아야할 데싸러들이 너무 많음.
@jonathan_blackburn
@jonathan_blackburn 2 ай бұрын
ㅇㅈ..
@ricebarbie
@ricebarbie Ай бұрын
데이터사이언티스트는 코딩을 하는게아니라 모델링을통해서 통계학적으로 다음값을 예측하는것입니다. 개발자와는 큰차이가 있습니다
@user-py8zl4dg1c
@user-py8zl4dg1c Ай бұрын
전처리를 코딩으로 해야되는데 님은 먼소리 하고있는거;​@@ricebarbie
@ricebarbie
@ricebarbie Ай бұрын
@@user-py8zl4dg1c 시키는일만해봤으니 뭘알겠니
@dlsrksguadhX
@dlsrksguadhX Ай бұрын
AI가 발전함에 따라..효율성과 최대 퍼포먼스 모두 AI가 경쟁우위를 가져가서 데이터 긁어모으는 잡일도 일꾼 AI가 하고 파인튜닝, 분석, 결론도 다른 슈퍼바이져 AI가 하고 AI들끼리 다 하는 방향으로 갈거 같은데...
@ct0323
@ct0323 2 ай бұрын
ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ 현 데이터 분석 업무 하고 있어요 ~ 쉽게 말해 데이터 준비하는 과정이 거의 70% 이상이지 않을까 분석은 요즘 전부 프로그램 자동화로 5%~ 10% 정도 나머지 20%는 보고서 쓰는데 ㅠㅠ
@user-fn5uf2yo9c
@user-fn5uf2yo9c 2 ай бұрын
재밌당...ㅠ
@ironchessman
@ironchessman Ай бұрын
삼각측량은 기지국이랑 2개만 연결되어있으면 가능한거 아닌가?
@thanksalot392
@thanksalot392 2 ай бұрын
미국에서는 저걸 (캡챠) 고소를 하면 배상을 받을 수 있지 않을까?
@user-nw1be9yj2j
@user-nw1be9yj2j 2 ай бұрын
짤 선정이 재밌네 ㅋㅋㅋㅋ
@user-ry1sx3cr6d
@user-ry1sx3cr6d 2 ай бұрын
👏👏👏👏👏🙏🙏👍👍
@___bumki
@___bumki 2 ай бұрын
@유느1017
@유느1017 2 ай бұрын
성공이네
@minsupwon8302
@minsupwon8302 2 ай бұрын
데이터 전처리만 의뢰하고 처리하는 플랫폼이 혹시 있나요?? 데이터 사이언티스트들이 전처리하는데 너무 많은 시간과 에너지를 쓰는건 기업입장에서도 인력낭비일거 같은데... 거꾸로 데이터 분석쪽을 희망하는 분들은 데이터 전처리를 부업으로 시작해서 기술을 확장해 나갈 수도 있을 것 같고...
@polarfox_y
@polarfox_y 2 ай бұрын
셀렉트스타
@minsupwon8302
@minsupwon8302 2 ай бұрын
@@polarfox_y 오 감사합니다. 저는 뭐랄까 예를 들자면 데이터 라벨링을 SETI프로젝트처럼 하나의 고객 기업과 다수의 개인 프리랜서간의 매칭 플랫폼이나 데이터계의 당근마켓처럼 이미 어떠한 데이터를 수집한 기관 혹은 업체가 제3자에게 판매하는 그런 서비스를 염두에 두고 말씀드린건데 셀렉트스타는 약간 후자와 가까운 기업이네요!
@user-ro4bs5mu4t
@user-ro4bs5mu4t 2 ай бұрын
​@@minsupwon8302그런 플랫폼이 존재하나요? 정보 보안 문제는 어떻게 할까요?
@minsupwon8302
@minsupwon8302 2 ай бұрын
@@user-ro4bs5mu4t 말씀 듣고보니 보안 유지 측면에서 제약사항이 많겠네요... 새로운 시장을 캐치한다는게 쉽지 않군요 🥲
@user-qy3kr1pv3l
@user-qy3kr1pv3l 2 ай бұрын
클라우드웍스 ? 가 예전부터 라벨링 부업으로 인기있을때 부터 했을거에요
@skynet5271
@skynet5271 2 ай бұрын
디버깅
@woojinlee5144
@woojinlee5144 2 ай бұрын
Co pilot 은 디버깅 이상을 벌써 보여줌.
@skynet5271
@skynet5271 2 ай бұрын
@@woojinlee5144 ㅋㅋㅋ 상업용 코드 업로드를 못할 뿐더러 올린다고 해도 수십만 라인 되는걸 업로드 할 수 있는지도 모르겠고 현존하는 정적분석기 동적분석기 수준의 반의 반도 못따라 갈거 같습니다. 최근 발표한 copilot pc+가 보안 문제를 해결해도 결국엔 성능이 안되요 지금 보여주는건 내부에 RAG pipe line구성해서 다른 특화된 agent로 넘겨주는건데 결국엔 그럴게 해도 분석기를 돌리는 툴로 넘겨주겠죠 ㅋㅋ
@유느1017
@유느1017 2 ай бұрын
다른 사람 댓글 없네
@user-iv8xh1mz6y
@user-iv8xh1mz6y 2 ай бұрын
대한민국 싸이언스 1호 박사님 장재언이 부정선거 데이터분석 했다고하던데요?
@flyingboyjo6713
@flyingboyjo6713 2 ай бұрын
인천이 제주도와 붙어있는건 이해가 좀,, 안됩니더, 제주 비행은 김포에서,, 인천에서 제주가는 건 거의 없는 편인데,,, 왜 붙어있는건지 잘 모르겠어요,, 같은 섬이라서 그런건가,, 아! 태클은 전혀아닙니다~ 데이터분석을 취미삼아해보려고 공부중입니다 ㅎㅎ
@jl_0725
@jl_0725 2 ай бұрын
어 정말 그렇네요? 분석적 사고를 아주 잘 활용하셨군요
@MOONSHINE0308
@MOONSHINE0308 2 ай бұрын
가장 먼저 사라질 직종중 하나
@user-fy8wz3vf6d
@user-fy8wz3vf6d 2 ай бұрын
데싸는 AI의 근간인데 이게 어떻게 사라짐?? 진짜 무식하다.
Please Help Barry Choose His Real Son
00:23
Garri Creative
Рет қаралды 21 МЛН
침착맨과 삼국지 속 무기의 과학! 1편 [안될과학 - 랩미팅]
45:48
안될과학 Unrealscience
Рет қаралды 555 М.
[궤도X김상욱] 우주와 물리학 기막힌 콜라보
19:35
스페이스 허브 TV (Space Hub TV)
Рет қаралды 1,2 МЛН
[원본풀버전 특별공개] 침착맨, 삼국지, 과학!
3:56:10
안될과학 Unrealscience
Рет қаралды 4,3 МЛН