No video

[데이터분석] 분식이의 Python Pandas 실무 데이터 분석 3탄 (행 추출하기 / 정렬하기 / 필터링 / 저장)

  Рет қаралды 17,946

데이터 스테이션

데이터 스테이션

Күн бұрын

Jupyter Notebook 을 이용한 Python Pandas 실무 데이터 분석 영상입니다.
파이썬 판다스 라이브러리를 이용한 정형데이터 분석에 대한 내용입니다.
오늘 내용은 아래와 같습니다.
1. 데이터 행 추출하기 (Row)
2. 데이터 정렬하기 (오름차순 / 내림차순)
3. 데이터 필터링
4. 데이터 저장
영상에 사용된 스크립트 파일은 아래 링크로 들어가 시면 다운로드 받으 실 수 있습니다.
blog.naver.com... ==============================================
클래스101에서 Python 데이터 분석 강좌가 오픈되었습니다!
* Python 데이터 분석에 관한 자세한 강의를 더 들으시려면, 아래 클래스101 강의를 확인해보세요.
* 클래스 101 데이터 분석강의
Python활용 데이터 분석 기초 : class101.page....
Python Pandas 활용 실무 데이터 전처리 : class101.page....
Python활용 실무 통계 분석 : class101.page....
Python을 이용한 실무 머신러닝 : class101.page....
Python으로 제조/공정 데이터 분석 하기 : class101.page....
* 비즈니스 및 기업 강의 문의
0001jmp@gmail.com

Пікірлер: 45
@dbsgustlr0204
@dbsgustlr0204 3 жыл бұрын
강의 너무 쉽게 풀어주시고 잘 들었습니다!
@data_station
@data_station 3 жыл бұрын
감사합니다!
@user-vr7kj1it5u
@user-vr7kj1it5u 3 жыл бұрын
설명 너무 좋네요 감사합니다
@data_station
@data_station 3 жыл бұрын
감사합니다! 😊
@thehybe
@thehybe 3 жыл бұрын
얼른 돌아오세요~ 복습중입니다!! :)
@data_station
@data_station 3 жыл бұрын
프로젝트 일정이 많아져서 ㅠㅠ 토요일에 바로 복귀하겠습니다!!!!
@josephahn1706
@josephahn1706 3 жыл бұрын
선생님 강의 오늘 강의도 정말 좋아요~~~ 고마워요 :) 마지막 실전 비슷한 연습까지 좋은 것 같습니다 좋아요 누르고 갑니다~~
@data_station
@data_station 3 жыл бұрын
감사합니다!!! ☺️
@coki9075
@coki9075 3 жыл бұрын
연령대가 4,50대인 데이터를 필터로 추출하고싶다면 영상의 코드인 cond1= (df1['연령대']=='40대, 50대') 이런식으로 하면 되는건가요 ??
@data_station
@data_station 3 жыл бұрын
그런 경우에는 아래와 같이 추출 할 수 있습니다. 1. 두 조건을 따로 선언해 보는경우 cond1 = df1['연령대'] =='40대' cond2 = df1['연령대'] =='50대' df1.loc[cond1 | cond2] 2. 하나의 조건식을 변수로 만들어 선언 cond1 = (df1['연령대']=='40대') | (df1['연령대']=='50대') df1.loc[cond1] or 조건인 |기호 (엔터기 위에 있습니다)를 이용해 두 조건중 하나라도 만족하는 조건에 대한 데이터를 추출 할 수 있습니다.
@user-cf8yu5mv5y
@user-cf8yu5mv5y 3 жыл бұрын
너무 감사합니다
@data_station
@data_station 3 жыл бұрын
감사합니다. 부족하지만 더 좋은 콘텐츠로 찾아뵙겠습니다!
@user-mb2km5wn2u
@user-mb2km5wn2u 3 жыл бұрын
안녕하세요 !! 영상 너무 잘보고 있습니다. 영상 보고 궁금한 점 있어서 댓글 남깁니다. column에 해당하는 variable의 value를 볼 수 있는 방법은 없을까요? 예를 들어 성별의 value인 남성,여성을 바로 확인할 수 있는 코드가 있는지 궁금합니다.
@data_station
@data_station 3 жыл бұрын
df1['성별'].unique( ) 함수 또는 df1['성별'].value_counts( ) 함수를 사용하면, 범주형 변수에 대한 항목을 확인할 수 있습니다.
@user-sf8mp8qo7h
@user-sf8mp8qo7h 2 жыл бұрын
개념이 이해가 잘 안되서 헤메고 있었는데, 강의가 많은 도움이 되었습니다. 다음강의는 어디에서 볼 수 있을까요? 감사합니다. ^^
@user-no7vm4ii9p
@user-no7vm4ii9p 2 жыл бұрын
데이터프레임의 값을 시리즈로 가져왔습니다 값이 0.000000 인경우 이전 값을 가져오고 싶은데 어떻게하면 좋을까요? 2021-12-18 0.000000 2021-12-19 0.000000 2021-12-20 18.906908 --> 18.906908 2021-12-21 0.000000 --> 18.906908 2021-12-22 0.000000 --> 18.906908 (예를 들어서 이렇게 데이터프레임의 새 칼럼으로 저장하고 싶습니다) 2021-12-23 58.635356 --> 58.635356 2021-12-24 0.000000 --> 58.635356 2021-12-25 0.000000 --> 58.635356 2021-12-26 77.803903 2021-12-27 0.000000 2021-12-28 0.000000 2021-12-29 0.000000 2021-12-30 15.208987 2021-12-31 0.000000 2022-01-01 10.882362 2022-01-02 0.000000 2022-01-03 0.000000 2022-01-04 0.000000 2022-01-05 5.039617 2022-01-06 0.00000
@data_station
@data_station 2 жыл бұрын
답변늦어 죄송합니다. 근래 컨설팅일정이 많아 이제 확인했네요. 작년부터 온라인 및 오프라인 교육관련 메일이 많아 회신이 늦었습니다. ㅠㅠ 그런 경우엔 0.000000값을 먼저 Missing Value로 결측값으로 바꾸신 뒤, 앞에 있는 값을 fillna( ) 함수로 대치할 수 있습니다. cond1 = (df1['Amount'] == 0) df1.loc[cond1, 'Amount'] = np.nan df1['Amount'].fillna(method='filll')
@user-vg5sm3iw8m
@user-vg5sm3iw8m 3 жыл бұрын
매우 매우 유용하게 공부하고 있습니다. 비전공자라서 이해가 느리지만 반복만이 길이다는 생각으로 반복 학습 하고 있습니다. 질문이 있습니다. cond1등 조건을 만들고 추출할때, loc대신에 iloc를 사용하면 안되나요? 안된다면 그 이유 설명을 좀 부탁 드리겠습니다. 언제나 좋은 일만 생기시기를 기원 합니다. 감사 합니다.
@data_station
@data_station 3 жыл бұрын
안녕하세요. 데이터스테이션입니다. loc함수는 location 의 약자로, 특정 데이터의 위치를 찾아 데이터를 출력하는 함수입니다. 그리고 이를 index 번호로 쉽게 표현하여 데이터를 추출하기 위해 만든 함수가 iloc (index location)입니다. iloc함수의 경우, 특정 위치(index)에 데이터를 추출하게끔 설계된 함수입니다. 따라서 index(행의 번호)에 대해서만 데이터를 추출 해 올수 있습니다.
@user-vg5sm3iw8m
@user-vg5sm3iw8m 3 жыл бұрын
@@data_station 빠른 답글 감사 드려요~~즉,iloc는 인덱스가 기반 되어야 사용가능하고, loc처럼 조건을 적용 시킬수 없다라고 이해 하면 될까요?
@data_station
@data_station 3 жыл бұрын
@@user-vg5sm3iw8m 네 맞습니다 ㅎㅎㅎㅎㅎ
@user-vg5sm3iw8m
@user-vg5sm3iw8m 3 жыл бұрын
@@data_station 감사 합니다~~
@stkang0507
@stkang0507 11 ай бұрын
df3.to_excel('result.xlsx', encoding= 'utf-8-sig') 이렇게 해서 엑셀 파일로 저장하려는데 화일은 생성되는데 아무 데이터가 없는데, 무엇이 문제인가요? csv 는 잘 저장 됩니다
@johnjeong5044
@johnjeong5044 3 жыл бұрын
loc는 써도 되고 안써도 되나요? df.loc[cond1]이랑 df[cond1]이랑 같은건가요?
@data_station
@data_station 3 жыл бұрын
출력은 같게 나오나, 다르게 작동합니다 조건에 따라 파생변수를 새로 생성하려면 loc 함수를 반드시 사용해야 하기 때문에, 가급적 loc함수를 이용해 데이터를 추출하는 것이 좋습니다
@heomax7682
@heomax7682 3 жыл бұрын
붆식님 좋은 영상 너무X100 감사합니다. 질문이 있는데요... 1. 일정한 형식의 데이터를 제가 원하는 데이터로 추출이 가능하게끔 코드를 작성해 놓고 그냥 로우 파일을 드래그 & 드랍해서 파일이 추출되게 하려면 어떻게 해야 될까요? (프로그램 작성) 매번 주피터 프로그램을 열어서 똑같은 일을 반복하지 않는다면 더 좋을거 같아서요
@enie5831
@enie5831 3 жыл бұрын
tkinter 활용 추천드립니다 !
@tspark1071
@tspark1071 3 жыл бұрын
설명 큰 도움이 됩니다. 감사합니다. 발음은 수정했으면... Sort. False
@data_station
@data_station 3 жыл бұрын
감사합니다
@kyoun0206
@kyoun0206 3 жыл бұрын
요거 다음 피벗테이블 강의는 어떤거 보면 되죠?
@data_station
@data_station 3 жыл бұрын
kzfaq.info/get/bejne/lcioedZl1rqrgYU.html
@data_station
@data_station 3 жыл бұрын
이것을 시청하시면 되겠습니다!
@user-ed1ez6qh7z
@user-ed1ez6qh7z 2 жыл бұрын
13:40 데이터 추출
@data_station
@data_station 2 жыл бұрын
👍👍
@thinker---
@thinker--- 2 жыл бұрын
@data_station
@data_station 2 жыл бұрын
고생하셨습니다!
@user-uc9ih2ho4f
@user-uc9ih2ho4f 3 жыл бұрын
😝
@data_station
@data_station 3 жыл бұрын
😁
@loveminmore
@loveminmore 2 жыл бұрын
> dfm1 과 > df1 의 차이점이 무엇인지 알수 있을까요???
@data_station
@data_station 2 жыл бұрын
dfm1 이면 오타인듯합니다. df1 은 변수 이름입니다. 해당 데이터 분석에서 df1이름으로 데이터를 선언해 준 것입니다
@JunC-sx3jq
@JunC-sx3jq 3 жыл бұрын
인코딩을 해도 깨져서 나오는데 어떻게 해야할까요?
@data_station
@data_station 3 жыл бұрын
작성하신 코드와 오류메시지를 드래그 후 복사. 하셔서 올려주시면 확인해드리겠습니다
@JunC-sx3jq
@JunC-sx3jq 3 жыл бұрын
찾아보니까 utf-8-sig로 하니까 저장해도 깨지지않네요 전 ㅠㅠ
@data_station
@data_station 3 жыл бұрын
@@JunC-sx3jq 아마 파일을 다운로드 받을 때, OS 문제가 발생해서 그럴듯합니다. 번거롭겠지만, 데이터 파일을 엑셀로 직접 여셔서 다시 저장하신 뒤, 파일을 한번 열어보세요! 그래도 안되시면 아래 메일로 화면 캡쳐해서 보내주세요 0001jmp@gmil.com
@JunC-sx3jq
@JunC-sx3jq 3 жыл бұрын
@@data_station 넵 감사합니다!
If Barbie came to life! 💝
00:37
Meow-some! Reacts
Рет қаралды 69 МЛН
managed to catch #tiktok
00:16
Анастасия Тарасова
Рет қаралды 41 МЛН
파이썬 배워야 하는 이유, 할 수 있는 것 2가지
4:50
파이썬Master
Рет қаралды 31 М.
26살 웹 프론트엔드 개발자의 삶
19:34
인생기록부
Рет қаралды 212 М.