No video

Manipulando Dataframe do Pandas | Análise de dados #5

  Рет қаралды 28,391

Programação Dinâmica

Programação Dinâmica

Күн бұрын

Nesse vídeo, Kizzy avança na análise exploratória dos microdados do #ENEM olhando para as primeiras duas questões do questionário socioeconômico respondido pelos candidatos do ENEM de 2018. O resultado ficou incrível!
Para fazer isso, utilizamos Python, claro, jupyter notebook, o pacote pandas e um dicionário Python.
O que você vai aprender de novo no quinto vídeo da série de análise de dados?
- Dicionário Python
- Como inserir uma nova coluna em um DataFrame pandas
- Como criar essa coluna a partir da informação de uma coluna existente e um dicionário correspondente
- Aprofundar no uso do groupby
Link mencionado no vídeo:
*O que é esse tal de NAN? Saiba mais em: pandas.pydata....
📚 Livros recomendados de Data Science: amzn.to/2XZyxUr
📚 Livros de Algoritmos e Estruturas de Dados: amzn.to/3d5wK4m
SetUp - Equipamentos: amzn.to/37Cg3N2
Cortes do Programação Dinâmica: / @alforriah
🟣 Canal na Twitch para lives: / pgdinamica
🟦 Canal do Telegram para receber todos os vídeos: t.me/pgdinamica
🥰 Se você gosta do nosso trabalho e acha relevante a nossa atuação no KZfaq, considere nos apoiar se tornando membro do canal: www.youtube.co...
✉️ E-mails:
- Propostas comerciais: pgdinamica@brunch.ag
- Demais assuntos: contato@programacaodinamica.com.br
👩🏾‍💻👨🏾‍💻 Confira mais conteúdo em nosso blog: / programacaodinamica
🔥 Faça parte da comunidade gratuita Programação Mais Dinâmica: bit.ly/pgsparkle (baixe o app e entre na comunidade)
TikTok: @pgdinamica
📸 Nos siga no Instagram: / pgdinamica
📸 @kizzy_terra @hallpaz
🐦 Nos siga no Twitter: / pgdinamica
🐦 @kizzy_terra @hallpaz
* Curta a Programação Dinâmica no facebook: pgdinamica
* Nosso repositório no Github: github.com/programacaodinamica
* Confira os artigos no Python Café: pythoncafe.com.br

Пікірлер: 155
@nalufuchs6483
@nalufuchs6483 5 ай бұрын
Esse canal é maravilhoso! A didática boa, pausada, mostrando tudo que é feito e ensinando muito mais que muito curso. Ganhou uma inscrita!
@viniantunes5944
@viniantunes5944 4 жыл бұрын
Só tenho uma dúvida: Pq eu não conhecia esse canal antes? Conheci somente hj e já sou um fã. Continuem com o excelente trabalho.
@pgdinamica
@pgdinamica 4 жыл бұрын
😍😍
@Andre-sn7fz
@Andre-sn7fz 3 жыл бұрын
Para quem precisar do dicionário de dados (porque no memomento que estou vendo 20/09/2020), parece não ter mais no arquivo do ENEM 2018, porém tem na nova versão do ENEM 2019. Caso queira facilitar vou deixar o dicionário aqui: q001e002Dicionario = { 'A': 'Nunca estudou', 'B': 'Não completou a 4° série/5° ano do Ensino Fundamental.', 'C': 'Completou a 4° série/5° ano, mas não completou a 8° série/9° ano do Ensino Fundamental.', 'D': 'Completou a 8ª série/9º ano do Ensino Fundamental, mas não completou o Ensino Médio.', 'E': 'Completou o Ensino Médio, mas não completou a Faculdade.', 'F': 'Completou a Faculdade, mas não completou a Pós-graduação.', 'G': 'Completou a Pós-graduação.', 'H': 'Não sei' }
@pgdinamica
@pgdinamica 3 жыл бұрын
👍
@aneniny
@aneniny Жыл бұрын
Obrigada, me salvou
@alexpalomino8947
@alexpalomino8947 3 жыл бұрын
Eu to apaixonado por este canal. É muito maravilhoso ver, pela primeira vez para mim, uma ferramenta poderosa como o Pandas ser usada para falar de um dado extremamente necessário. Eu gostaria de deixar não só os meus parabéns aqui, mas dizer também que é graças a pessoas como você que eu acredito que o ser humano pode ser bom. Continue este excelente trabalho, usando a cultura analítica de forma precisamente crítica e política. Muito amor.
@pgdinamica
@pgdinamica 3 жыл бұрын
Muito obrigada!
@Leozinho222333
@Leozinho222333 4 жыл бұрын
Kizzy, meus parabéns. Você de fato tem domínio do assunto e ministra suas aulas de forma muito segura.
@pgdinamica
@pgdinamica 4 жыл бұрын
Valeu Leonardo!
@gabrielalbrechtfitarelli5938
@gabrielalbrechtfitarelli5938 3 жыл бұрын
Esse canal é perfeito!! Introduzindo ciência de dados didaticamente e com conjuntos de dados que já estimulam o pensamento crítico e engajamento socioeconômico! Parabéns pela iniciativa e pelas aulas! 😁
@pgdinamica
@pgdinamica 3 жыл бұрын
😊 obrigada!
@poroutroangulo9606
@poroutroangulo9606 2 жыл бұрын
Meu Deus Kizzy isso me ajuda de mais! Continue com esse trabalho incrível!!!
@pgdinamica
@pgdinamica 2 жыл бұрын
Bons estudos!
2 ай бұрын
Parabéns Kizzy! Que aula fantástica! Interessante que em 2023 ao analisar a escolaridade pela nota de matemática temos o mesmo comportamento que em 2021 com uma pequena baixa na média de notas nos para inscritos que tem pais com menores níveis de escolaridade ou que marcaram "não sei" (do pai e da mãe). Porém em redação a média de notas aumentou em todas os níveis de escolaridades (do pai e da mãe).
@pgdinamica
@pgdinamica 2 ай бұрын
Legal! Obrigada por compartilhar 😉
@emersonsilvadeoliveira26
@emersonsilvadeoliveira26 3 жыл бұрын
Só te digo uma coisa. Você é sensacional!!!!! Mulher maravilhosa
@pgdinamica
@pgdinamica 3 жыл бұрын
Obrigada!
@ramonmendes_bi
@ramonmendes_bi 3 жыл бұрын
Menina tu manja d+! Obg pelo conteúdo
@pgdinamica
@pgdinamica 3 жыл бұрын
De nada! 🙌🏾
@beatrizdasilvaoliveira1642
@beatrizdasilvaoliveira1642 5 ай бұрын
Mds, que coisa incrível. Fiquei triste pela análise comprovar como a desigualdade social é horrível, mas achei incrível demais o método pra chegar nesses resultados. Tô viciada nessa playlist kkkkkkkkk
@pgdinamica
@pgdinamica 2 ай бұрын
👏🏾👏🏾
@isclaraferreira
@isclaraferreira 4 жыл бұрын
Muito obrigada, Kizzy
@pgdinamica
@pgdinamica 4 жыл бұрын
Oii, que demais, obrigada!
@lesthaat
@lesthaat 3 жыл бұрын
Que trabalho top, Kizzy. Descobri o canal faz pouco tempo, mas olha, tem me ajudado muito. Vocês estão de parabéns mesmo pelo conteúdo e didática! :)
@pgdinamica
@pgdinamica 3 жыл бұрын
Nós que agradecemos!
@AndrePereira-ol1gq
@AndrePereira-ol1gq 3 жыл бұрын
Melhor canal pra aprender Pandas que eu achei, parabens pelo trabalho!!
@pgdinamica
@pgdinamica 3 жыл бұрын
Obrigada!
@alexandreFerreira-fb2gs
@alexandreFerreira-fb2gs 5 жыл бұрын
DEMAAAAAiiiiiiissss!!!! muito obrigado mesmo pela paciência de poder explicar passo a passo o processo... e o melhor, diferencial, nota 1000, é q vc discuti a interpretação dos dados. valeu, linda!!!! tmj.
@pgdinamica
@pgdinamica 5 жыл бұрын
Vamo q vamo! 💪🏾 a ideia é trazer conteúdo da melhor qualidade para vocês 😉
@fabiologos
@fabiologos 4 жыл бұрын
Maaanoooo, isso não foi uma aula. Foi um show de ciência de dados. Obrigado por isso. Muito grato
@pgdinamica
@pgdinamica 4 жыл бұрын
🤩🤩 obrigadaa!
@SuperLuisrubilar
@SuperLuisrubilar Жыл бұрын
Hola, Kizzy muito bom teu trabalho aqui agradecido!
@pgdinamica
@pgdinamica Жыл бұрын
valeu!
@raniel0511
@raniel0511 3 жыл бұрын
Assistido ✔️ Muito top Kizzy. Acho fantástico que só algumas linhas de código fazem tudo isso, realmente muito bom analisar dados.
@daianeucceli1
@daianeucceli1 3 жыл бұрын
Que vídeo PERFEITO!!!!! Obrigada Kizzy por compartilhar todos esses conhecimentos. Já segui pelo linkedin, agora vou devorar o canal do YT! Entendam: vcs são maravilhosos!!!
@pgdinamica
@pgdinamica 3 жыл бұрын
Muito obrigada!
@seltonmelo20
@seltonmelo20 3 жыл бұрын
o áudio desse vídeo esta bem melhor q os anteriores, esta mais alto!!!
@pgdinamica
@pgdinamica 3 жыл бұрын
Valeu 🤙🏾
@marciolima748
@marciolima748 3 жыл бұрын
esse canal é excfelente manda berm demais
@adrianopassos7051
@adrianopassos7051 3 жыл бұрын
Amando esse projeto! Aprendendo demais! Obrigado!
@marcusviniciussilvanascime387
@marcusviniciussilvanascime387 3 жыл бұрын
INCRIVEL!!!! A aula a discussão social!!!! Parabéns.
@pgdinamica
@pgdinamica 3 жыл бұрын
Muito obrigada!
@ericpeterman1575
@ericpeterman1575 3 жыл бұрын
Provando com números uma realidade que nem todos querem ver. Mas está aí desenhado. Parabéns!
@pgdinamica
@pgdinamica 3 жыл бұрын
😉😉
@josielpatriciopereiradeoli238
@josielpatriciopereiradeoli238 4 жыл бұрын
Parabéns!!! ótimo teu vídeo!!! estou estudando esse assunto e exatamente esse conjunto de dados... Maravilhoso teu vídeo!
@kalfa509
@kalfa509 2 жыл бұрын
Essa série é animal!! Estou amando 😍
@pgdinamica
@pgdinamica 2 жыл бұрын
Que legal! Bons estudos!
@wallacevieiradasilva567
@wallacevieiradasilva567 3 жыл бұрын
muito bom o conhecimento passado nesse video
@pgdinamica
@pgdinamica 3 жыл бұрын
Obrigada!
@diegowenceslau4763
@diegowenceslau4763 4 жыл бұрын
Parabéns, explica bem de forma simples e clara. Vai longe esse canal.
@pgdinamica
@pgdinamica 4 жыл бұрын
Valeu!!
@lomuscko
@lomuscko 3 жыл бұрын
Aula show! Programação e sociologia tudo junto
@pgdinamica
@pgdinamica 3 жыл бұрын
Valeeeu!
@lucasmendes4697
@lucasmendes4697 3 жыл бұрын
Mds como só conheci este canal agora. Excelente!
@pgdinamica
@pgdinamica 3 жыл бұрын
Seja bem vindo! Obrigada!
@brunoconde8614
@brunoconde8614 4 жыл бұрын
Essa série de vídeos é sensacional!
@pgdinamica
@pgdinamica 4 жыл бұрын
:))))
@rraul
@rraul 3 жыл бұрын
Muito show a aula, parabéns. Continue com esse conteúdo! Parabéns
@washingtonsilva1024
@washingtonsilva1024 3 жыл бұрын
Adoro todos os vídeos. Vcs são demais!!!
@pgdinamica
@pgdinamica 3 жыл бұрын
Obrigada!
@RogerioCabral
@RogerioCabral 2 жыл бұрын
Ah velho vc é perfeita! Muito boa mesmo sua didática!
@BruceFonseca1
@BruceFonseca1 2 жыл бұрын
Sensacional 👏👏👏👏👏
@pgdinamica
@pgdinamica 2 жыл бұрын
Valeu!
@marcioalexandre7610
@marcioalexandre7610 4 жыл бұрын
Primeiro, obrigado e parabéns por mais uma aula maravilhosa!! Notadamente, aula feita com paixão, inteligência, habilidade e conhecimento! A tua explanação a partir dos dados dos pais foi magnífica, contudo são apenas suposições às quais somos levados a fazer racionalmente e também intuitivamente. Não correspondem à realidade. Dados preenchidos sem validação e tratados por governos nunca são confiáveis rsrs. Uma grande parte dos candidatos fornecem esses dados por achismo, vergonha, ou o que eles acham que é melhor de informar. Dei aula pro ensino técnico por 20 anos: conheço isso de trás pra frente. Se pais graduados tivessem filhos graduados, em centenas de milhares, seria outro Brasil!! E não é. Talvez tenha faltado uma análise de interseção: pai e mãe, de um mesmo candidato, graduados.
@miguelalcoforado3524
@miguelalcoforado3524 4 жыл бұрын
Excelente!!!
@MattheusMatos
@MattheusMatos 4 жыл бұрын
Olá, Kizzy! Que aula show! Estou adorando. Me ajuda com algo: Como faço para conseguir plotar duas variáveis no mesmo gráfico, por exemplo q001redacao e q002redacao? Para conseguir analisar a linearidade entre os dois. Um forte abraço
@petadoblegeografia6328
@petadoblegeografia6328 3 жыл бұрын
Muito grato, metodologia excelente.
@marcosoliveira8731
@marcosoliveira8731 3 жыл бұрын
Achei inspiradora sua análise. Gostei muito das inferências que fez com base nas informações extraídas destes dados. Fico imaginando se faixa etária dos pais ( caso exista no dataset ) poderia identificar ( por exemplo ) qual(is) a(s) década(s) onde os pais "tiveram mais acesso ao estudo", por conseguinte refletindo nesta notória influência no resultados dos candidatos, como você mostrou.
@abdiasoliveirarocha5528
@abdiasoliveirarocha5528 3 жыл бұрын
Muito bom os vídeos dessa playlist, fiz as mesma e mais outras analises usando a linguagem R para um relatório valendo a nota da matéria de introdução ao software R, e quero saber como faço a referência devida. Você me ajudou muito, e essa foi minha primeira análise de um banco de dados e estou muito feliz, gratidão
@pgdinamica
@pgdinamica 3 жыл бұрын
Legal demais, citação: dos Reis, Kizzy. Programação Dinâmica. Manipulando Dataframe do Pandas. 2019. Disponível em: . Acesso em: .
@projetoalfa9161
@projetoalfa9161 4 жыл бұрын
esse video foi simplesmente lindo! muito obrigado. Tenho interesse na área e voce está me ajudando muito. de verdade, muito obrigado!!!!
@pgdinamica
@pgdinamica 4 жыл бұрын
Obrigada ☺️
@professorjairrodriguesdean226
@professorjairrodriguesdean226 2 жыл бұрын
Boa tarde ! como criar um dataframe com as linhas referente aos estados de MG e SP com as colunas 'SG_UF_RESIDENCIA','TP_ESCOLA','NU_NOTA_MT'
@Graffitiaprendiz
@Graffitiaprendiz 5 жыл бұрын
Vocês são demais!!! Podiam fazer uma série sobre o R tb!!
@pgdinamica
@pgdinamica 5 жыл бұрын
Fala Arthur, obrigada! Ainda temos muito a explorar do Python, R fica de dever de casa :D
@WiltonCabral
@WiltonCabral 3 жыл бұрын
Muito Bom ! Porem muito corrido, algumas informações surgiram, e não ficou claro por exemplo: o método .mean () aos 15"42 e. q002Redação.plot() aos 18':15 ''
@mariomcfly7
@mariomcfly7 3 жыл бұрын
Boa tarde, Wilton! To aprendendo ainda, mas vou tomar a liberdade de tentar ajudar. rs rs Esses dois itens foram explicados melhor em outros vídeos. Mas deixa ver se eu consigo clarificar: No caso do mean(), se refere à média e pode ser usado com todas as info numéricas. Basta acrescentar o .mean() no final da linha (as vezes, quando você usa mais um método, o mean() termina ficando no meio do código, como no exemplo da Kizzy): O código completo usado no vídeo é esse abaixo onde ela usa 5 métodos concatenados (filter(), groupby(), mean(), sort_values() e plot(): ```microdadosEnemSelecionado.filter(items = ['NO_Q002','NU_NOTA_MT']).groupby('NO_Q002').mean().sort_values(by='NU_NOTA_MT', ascending=False).plot()``` Detalhando: 1. microdadosEnemSelecionado.filter(items = ['NO_Q002','NU_NOTA_MT']) ==> aqui selecionamos as colunas com as quais queremos trabalhar. 2. '.groupby('NO_Q002').mean()' ==> aqui informamos que vamos agrupar pela coluna NO_Q002 e na sequencia, vamos querer a média (você poderia usar o max(), min(), sum() etc no lugar do mean(). .3. '.sort_values(by='NU_NOTA_MT', ascending=False).plot()' ==> aqui informamos que queremos listar pela coluna NU_NOTA_MT de forma decrescente e por último, informamos que queremos usar um gráfico do PANDAS. Ele está contido por exemplo no método describe(), que apresenta também informações como máximo (que tambem pode ser obtido usando 'max()' ) e mínimo (que também pode ser obtido usando 'min()' ), por exemplo. Da uma olhada nesses links: pandas.pydata.org/pandas-docs/stable/reference/api/pandas.core.groupby.GroupBy.mean.html?highlight=mean#pandas.core.groupby.GroupBy.mean pandas.pydata.org/pandas-docs/stable/reference/api/pandas.core.groupby.DataFrameGroupBy.plot.html?highlight=plot#pandas.core.groupby.DataFrameGroupBy.plot Espero ter ajudado. Abs.,
@WiltonCabral
@WiltonCabral 3 жыл бұрын
Grato pela ajuda !
@diegov.5126
@diegov.5126 4 жыл бұрын
Baita conteúdo, parabéns Izzy!!
@pgdinamica
@pgdinamica 4 жыл бұрын
é Kizzy 😅
@diegov.5126
@diegov.5126 4 жыл бұрын
@@pgdinamica Isso! foi o corretor kkkkk
@rodrigoleira9234
@rodrigoleira9234 3 жыл бұрын
Serie maravilhosa!
@pgdinamica
@pgdinamica 3 жыл бұрын
Valeu!
@rodrigomelges3604
@rodrigomelges3604 4 жыл бұрын
Alguns métodos do pandas permitem que se passe o parâmetro inplace=True. Desta forma vc não precisa atribuir o resultado à variável existente. O método dropna é um deles. São duas formas de fazer a mesma coisa, aí cabe a cada um escolher qual prefere. Muito legal seu canal
@pgdinamica
@pgdinamica 4 жыл бұрын
😉😉 sim, é verdade! Inclusive já ensinei isso em alguns vídeo aqui no canal
@braiandeivid
@braiandeivid 3 жыл бұрын
Muito bom!! Tive trabalhos nesse estilo
@pgdinamica
@pgdinamica 3 жыл бұрын
😊👏🏾👏🏾
@lucasdscavalcante
@lucasdscavalcante 5 жыл бұрын
Agora o meu domingo ficou mais interessante!!
@pgdinamica
@pgdinamica 5 жыл бұрын
😂😂 boa Lucas!
@Twister15X
@Twister15X 3 жыл бұрын
Essa aula poderia ser muito bem o TCC de um curso de pedagogia, ou qualquer area de licenciatura
@pgdinamica
@pgdinamica 3 жыл бұрын
Muito obrigada 😊
@fredericoapuleio9583
@fredericoapuleio9583 4 жыл бұрын
Estou muito feliz com essa aula. Eu voltei a me dedicar ao data science, e você me ajuda muito. Vc tem algum material de pandas, numpy e matplotlib em pt para recomendar?
@pgdinamica
@pgdinamica 4 жыл бұрын
Sobre Pandas e Matplotlib tem aqui no canal :)
@helviorezende758
@helviorezende758 2 жыл бұрын
Kizzy e Alisson, gostaria de saber, para selecionar os dados de obitos novos na base do covid por mes, e selecionar os dados de obitos novos, quando na coluna estado está valores ausentes, desde ja agradeço demais as ajudas.
@pgdinamica
@pgdinamica 2 жыл бұрын
oi Helvio, para selecionar os obitovos novos por mês, você pode transformar o tipo da coluna data para datetime, criar uma coluna com mes-ano e depois agrupas os obitos novos por essa nova coluna usando group by. Em relação a selecionar as colunas em que o valor de estado está ausente, você pode usar o isna passando a coluna estado, veja aqu formas de filtra dados com pandasi: pandas.pydata.org/docs/getting_started/intro_tutorials/03_subset_data.html
@marcosoliveira8731
@marcosoliveira8731 3 жыл бұрын
"... não cai em argumentos falaciosos...". De fato. Somente com dados de qualidade, podemos ter ciência da real face da realidade. Como disse antes: Inspirador.
@slark131
@slark131 2 жыл бұрын
Queria pedir uma ajuda. Na hora de criar um data frame, gostaria de alinhar todas as informações das colunas a esquerda. Procurei pela internet mas não consegui solucionar até hoje, alguma boa alma pode me ajudar?
@pgdinamica
@pgdinamica 2 жыл бұрын
stackoverflow.com/questions/17232013/how-to-set-the-pandas-dataframe-data-left-right-alignment
@lualmeidasouza
@lualmeidasouza 4 жыл бұрын
Hi, Kizzy! Help-me, please... How do I merge df1 and df2 by two columns (fiels) at clausula on? For example: dfUltStatus = pd.merge(dfUltStatus, dfDescStatus, on=['CODIGO_STATUS','SUB_CODIGO_STATUS'], how = 'left') The object is merge the two data frames through these two fields to bring the description field. Tks by your help. God bless you.
@pgdinamica
@pgdinamica 4 жыл бұрын
conseguiu resolver?
@kleniaalves3256
@kleniaalves3256 2 жыл бұрын
Parabens Kizzy, eu preciso extrair alguns dados do enem.....Será que consigo??? . Tenho noções de programção.....
@pgdinamica
@pgdinamica 2 жыл бұрын
consegue sim 😉
@felwolf1
@felwolf1 3 жыл бұрын
Como eu consigo fazer um filtro baseado em uma string : ex: filtrar a linhas diferente de "TESTE" onde o teste ele vem na string XXXXX(TESTE), (TESTE) XXXXX,XXXX(TESTE)XXXX
@pgdinamica
@pgdinamica 3 жыл бұрын
Procura pelo metódo str.contains( ) 👍
@felwolf1
@felwolf1 3 жыл бұрын
@@pgdinamica passei assim .. df[df['LOGRADOURO'].str.contains("TESTE",regex=True)] não filtrou .
@Moduki1
@Moduki1 2 жыл бұрын
Boa noite, poderia me ajudar em uma questão sobre o replace? df['modelo'] = df['modelo'].replace('\','', regex=False) df eu tenho a coluna modelo cujo a qual inseri uma \ no meio da string e eu estou tentando remover essa barra porém parece que quando eu uso o replace da forma que coloquei ele utiliza a \ como um operador e não como um caracter. Qual seria o macete para alterar esse tipo de caracter?
@pgdinamica
@pgdinamica 2 жыл бұрын
A barra "\" é o caractere de escape em Python. Isto significa que ela é usada como um símbolo para atribuir um significado especial ao caractere que a sucede. Por exemplo " " significa "quebra de linha" (pular linha) ao invés de uma barra e a letra *n*. Para usar a "\" com o significado de um caractere, você precisa usar 2 barras seguidas: "\\". A primeira funciona como escape para mudar o significado da segunda, que será lida como um caractere comum.
@Moduki1
@Moduki1 2 жыл бұрын
@@pgdinamica Obrigado
@Kleber_Moreira
@Kleber_Moreira 4 жыл бұрын
Sensacional.
@pgdinamica
@pgdinamica 4 жыл бұрын
Obrigada!
@gersntos
@gersntos 3 жыл бұрын
O áudio desse vídeo ficou melhor, mais alto.
@pgdinamica
@pgdinamica 3 жыл бұрын
😁
@demiraldo1
@demiraldo1 2 жыл бұрын
Esse vídeo foi o único que esclareceu minhas dúvidas sobre como resolver um problema no meu trabalho. Só que estou com dificuldades no erro que está ocorrendo. Criei o dicionário de acordo com o que vou procurar na planilha Excel. O dicionário só tem 8 pares "chave/valor". Preciso buscar somente esses valores e jogar na nova coluna. Só que na primeira comparação que não está no dicionário, já dá um erro. Como posso corrigir isso?
@pgdinamica
@pgdinamica 2 жыл бұрын
1. Você pode tratar a exceção com try…catch; 2. Você pode usar o método get e passar um valor padrão quando a chave não estiver presente. Exemplo: x = dicio[chave] #erro se chave não estiver em dicio. x = dicio.get(chave, 0) # se chave não estiver em dicio, x recebe o valor 0 (pode usar qualquer valor de qualquer tipo como padrão).
@demiraldo1
@demiraldo1 2 жыл бұрын
@@pgdinamica MUITO OBRIGADO! Salvou a lavoura! rsrsrsrsrs Deu tudo certo aqui com suas dicas! Achei um canal bacana que tem uma pessoa muito simpática e sabe ensinar, que é você Kizzy! PARABÉNS pela disposição de ajudar e sucesso para o seu canal!
@projetoalfa9161
@projetoalfa9161 4 жыл бұрын
não estou conseguindo fazer essa parte do [q001e002Dicionario[resp] for resp in microdadosEnemSelecionados.Q001] aparece key error '*'
@joseedmario1446
@joseedmario1446 4 жыл бұрын
Verifique os valores do dicionário. Eu chuto que você acabo colocando as alternativas em minúsculo xD
@pgdinamica
@pgdinamica 4 жыл бұрын
Segue a dica do Jose :)
@marirufino147
@marirufino147 3 жыл бұрын
Oi Kizzy, tudo bem ? To com uma dúvida por aqui. Queria criar uma coluna pra inserir a média das notas 'NU_NOTA_MT','NU_NOTA_REDACAO', 'NU_NOTA_CN', 'NU_NOTA_CH', 'NU_NOTA_LC'. Assim como você criou uma coluna pra inserir a resposta da Q001 e Q002 queria criar uma coluna que recebesse a média das notas obtidas. É possível?
@pgdinamica
@pgdinamica 3 жыл бұрын
É possível sim. É bem simples inclusive. Dá uma olhada: stackoverflow.com/questions/48366506/calculate-new-column-as-the-mean-of-other-columns-pandas/48366525
@marirufino147
@marirufino147 3 жыл бұрын
@@pgdinamica Putz, tentei aqui e nada. microdados[media] = microdados[['NU_NOTA_LC', 'NU_NOTA_CH', 'NU_NOTA_CN', 'NU_NOTA_REDACAO', 'NU_NOTA_MT']].mean(axis=1) Esse comando pede pra criar uma coluna com a média das colunas listadas, não?
@50edai32
@50edai32 5 жыл бұрын
Adorei, Kizzy. Me passa esses dados inbox?
@lualmeidasouza
@lualmeidasouza 4 жыл бұрын
Olá Kizzy! Ajuda-me, por favor ... Como mesclar df1 e df2 por duas colunas (campos) na clausula? Por exemplo: dfUltStatus = pd.merge (dfUltStatus, dfDescStatus, on = ['CODIGO_STATUS', 'SUB_CODIGO_STATUS'], como = 'esquerda') O objeto é mesclar os dois quadros de dados através desses dois campos para trazer o campo de descrição. Tks por sua ajuda. Deus te abençoê.
@pgdinamica
@pgdinamica 4 жыл бұрын
Oi Luciana, está quase certo, no seu exemplo seria assim: dfUltStatus = dfUltStatus.merge(dfDescStatus, on=['CODIGO_STATUS','SUB_CODIGO_STATUS'], how = 'left')
@lualmeidasouza
@lualmeidasouza 4 жыл бұрын
@@pgdinamica Muito obrigada!!! ;-)
@oficialdabliu
@oficialdabliu 4 жыл бұрын
Você poderia disponibilizar os notebooks que você usa nos vídeos?
@pgdinamica
@pgdinamica 4 жыл бұрын
Oii, poderia sim, estou disponibilizando aos poucos lá no github :)
@oficialdabliu
@oficialdabliu 4 жыл бұрын
@@pgdinamica como eu acesso o seu github?
@rayfarron6268
@rayfarron6268 3 жыл бұрын
Kizzy, tenho uma dúvida: É possível criar uma nova coluna no dataframe com a média da nota de cada aluno nas 4 provas objetivas? Como faço isso? Obrigado pelo excelente vídeo!
@pgdinamica
@pgdinamica 3 жыл бұрын
Oi, é sim. Você consegue fazer operações entre colunas, por exemplo: df[col3] = df[col1]/df[col2]. Sendo assim vc pode criar uma nova coluna de média: somando as outras e dividindo pelo número de colunas.
@rayfarron6268
@rayfarron6268 3 жыл бұрын
@@pgdinamica Perfeito, consegui! Muito obrigado!
@mariomcfly7
@mariomcfly7 3 жыл бұрын
@@pgdinamica Boa essa dica. Nao conhecia. Valeu!
@richard74215
@richard74215 4 жыл бұрын
Ótimo vídeo!! Uma dúvida, quando o nome da coluna é separado, ele diz que a sintax é invalida, sabe como resolver?
@pgdinamica
@pgdinamica 4 жыл бұрын
Nesse caso, vc tem que usar a notação seu-dataframe[‘nome da coluna’]
@HerminioSabino
@HerminioSabino 3 жыл бұрын
Muito massa o vídeo Queria saber como poderia ser criado um novo dataframe com o resultado de filtros EX: Criar um dataframe com a contagem de todos as pessoas que possuem sobrenome Cavalcante, Albuquerque, Oliveira ..... etc Sobrenome; Cont Albuquerque; 100 Cavalcante; 200 Oliveira; 300 etc
@pgdinamica
@pgdinamica 3 жыл бұрын
legal a sugestão.
@HerminioSabino
@HerminioSabino 3 жыл бұрын
@@pgdinamica Eu acabei conseguindo fazer com os nomes dos candidatos a vereadores no RN
@wagnersantos7818
@wagnersantos7818 4 жыл бұрын
Nossa. Gostei do pandas, é meio que um SQL com umas coisinhas a mais kkk... muito firme
@pgdinamica
@pgdinamica 4 жыл бұрын
😊😊😊 são bem diferentes, mas entendi onde você encontrou semelhanças 😅
@joaoalexandrebonindemello7894
@joaoalexandrebonindemello7894 3 жыл бұрын
Cruzei a nota geral do ENADE 2018 com a formação dos pais e encontrei uma distribuição é muito parecida. Obs: no ENADE não há a resposta "não sei" , apenas a "nenhuma", mas o que me chamou a atenção é que acadêmicos em que o pai ou mãe não tem formação, obtém a segunda menor nota. pai nota_geral Ensino Fundamental: 1º ao 5º ano (1ª a 4ª série). 39.454535 Ensino Fundamental: 6º ao 9º ano (5ª a 8ª série). 41.101529 Ensino Médio. 42.387544 Ensino Superior - Graduação. 45.040738 Nenhuma. 39.494762 Pós-graduação. 48.567807 mae nota_geral Ensino Fundamental: 1º ao 5º ano (1ª a 4ª série). 39.179260 Ensino Fundamental: 6º ao 9º ano (5ª a 8ª série). 40.688031 Ensino Médio. 42.074204 Ensino Superior - Graduação. 44.973254 Nenhuma. 39.408247 Pós-graduação. 46.730050
@rockinriobrazil
@rockinriobrazil 4 жыл бұрын
Boa noite Kizzy. Excelente vídeo, como sempre. Mas eu tenho uma dúvida: Você menciona que escolheu algumas colunas de interesse para analisá-las. Mas como se dá a escolha dessas colunas? Por exemplo, se eu tiver um dataset com inúmeras colunas das mais variadas informações, em que eu quero analisar as chances do preço do Bitcoin aumentar. A minha coluna alvo é o preço do Bitcoin. Como eu defino as minhas colunas de interesse, haja vista que eu tenho inúmeras colunas completamente inúteis para essa análise? É no feeling mesmo? Ou existe alguma técnica específica para isso? Utilizar a técnica da biblioteca sk-learn chamada "corr" para verificar a correlação entre as colunas de interesse e a variável alvo, poderia ser uma tática que você utilizaria para descobrir isso ( mesmo sendo uma técnica muito lenta)? Acho que fui extenso demais, mas toda a pergunta se resume na maneira que você escolhe as variáveis de interesse mesmo. Obrigado pela paciência.
@pgdinamica
@pgdinamica 4 жыл бұрын
Oi! Isso é algo sobre o qual ainda vou falar em vídeo agora que comecei os tópicos de machinho learning. Não é chute, mas investigação. Tem como usar por exemplo o Select K Best do sklearn, corr, também como vc mencionou... tem alguns recursos que podem nortear essa escolha sim 😉
@rockinriobrazil
@rockinriobrazil 4 жыл бұрын
@@pgdinamica Opa. Excelente. E obrigado por responder. Ficarei no aguardo do vídeo. Abraços.
@danielcastagna1299
@danielcastagna1299 4 жыл бұрын
@@rockinriobrazil na economia existe uma disciplina chamada "econometria" que estuda a relação entre variáveis, é um bom jeito de começar buscando informação
@riquelmepereira332
@riquelmepereira332 2 жыл бұрын
Python não tem fatores como na linguagem R, né?
@pgdinamica
@pgdinamica 2 жыл бұрын
Não tem… mas é possível trabalhar com dados categóricos no Pandas.
@karinnecristina3167
@karinnecristina3167 5 жыл бұрын
Very good!
@pgdinamica
@pgdinamica 5 жыл бұрын
Obrigada Karinne!
@cleybsonsilva130
@cleybsonsilva130 6 ай бұрын
Acho que preciso conhecer bastante Python antes, embora esteja compreendendo toda lógica.
@pgdinamica
@pgdinamica 6 ай бұрын
Sim, é importante já conhecer a linguagem para fluir melhor nos estudos. Uma opção é estudar esta playlist: kzfaq.info/sun/PL5TJqBvpXQv6AEfVymby32MinHdxZA-8J&si=o5I6lvNHfyl79Nro
@MrCochico01
@MrCochico01 2 жыл бұрын
Acho o canal muito legal, mas queria passar um feedback e espero que não se ofenda, Kizzy. Acho que vc podia se preocupar com os detalhes quando estiver ensinando. Por exemplo, vc acelera o video quando está escrevendo os códigos e força quem vê tentar entender de forma acelerada, e isso, na prática, traz é confusão. Eu me sinto confuso vendo os seus videos e acho e, somente acho, que vc poderia pensar para quem é feito o video: para pessoas que já dominam o processo ou para quem está aprendendo. Se for para quem está aprendendo, acho que vc está pecando um pouco no que eu comentei. Vejo que aprendo mais com outros modelos de ensino de outros influenciadores...mas claro, isso é apenas a minha opinião...
@pgdinamica
@pgdinamica 2 жыл бұрын
Oi, Chico, entendo e agradeço o feedback! Depois, dá uma olhadinha nos vídeos mais recentes do canal pra ver se a sensação se mantém a mesma, porque este é um dos meus primeiros vídeos (agosto/2019) e aprendi muitas coisas nesses últimos dois anos.
Real World Data Cleaning in Python Pandas (Step By Step)
40:01
Ryan & Matt Data Science
Рет қаралды 66 М.
Doing This Instead Of Studying.. 😳
00:12
Jojo Sim
Рет қаралды 30 МЛН
WHO CAN RUN FASTER?
00:23
Zhong
Рет қаралды 24 МЛН
Look at two different videos 😁 @karina-kola
00:11
Andrey Grechka
Рет қаралды 8 МЛН
Fast and Furious: New Zealand 🚗
00:29
How Ridiculous
Рет қаралды 48 МЛН
Introdução ao Matplotlib | Gráficos em Python | Análise de dados #7
14:10
Programação Dinâmica
Рет қаралды 25 М.
Python: Aprenda a concatenar DATAFRAMES com o CONCAT!
9:19
Data Driven School
Рет қаралды 531
Data Analyst Portfolio Project (Exploratory Data Analysis With Python Pandas)
57:55
Ryan & Matt Data Science
Рет қаралды 42 М.
Como Juntar Informação de 2 Tabelas em Python
27:05
Hashtag Programação
Рет қаралды 30 М.
Como combinar dois conjuntos de dados? | Análise de dados #10
15:31
Programação Dinâmica
Рет қаралды 4,9 М.
Pandas do ZERO a ANÁLISE de DADOS | Dica de Pandas Python para Análise de Dados
1:54:01
Exploratory Data Analysis with Pandas Python
40:22
Rob Mulla
Рет қаралды 454 М.
Data Cleaning Tutorial | Cleaning Data With Python and Pandas
15:38
Doing This Instead Of Studying.. 😳
00:12
Jojo Sim
Рет қаралды 30 МЛН