No video

Como classificar dados e remover valores duplicados | Automatize Excel com Python

  Рет қаралды 2,224

All Dados

All Dados

Күн бұрын

Neste vídeo, iremos aprender maneiras de se realizar a ordenação de coluna(ou colunas) através do SORT_VALUES( ) e da remoção de valores duplicados a partir do DROP_DUPLICATES( ), ambos disponíveis na estrutura do Pandas. A estrutura do SORT_VALUES( ) permite passar as colunas que desejamos realizar a ordenação e a sequência desses dados, seja crescente ou decrescente. A estrutura do DROP_DUPLICATES( ) permite conferir qual coluna ou quais colunas desejamos verificar duplicidade e se iremos querer permanecer o primeiro valor encontrado (duplicado) ou o último.
Ambiente do ANACONDA:www.anaconda.c....
COMPARTILHE esse vídeo: • Como classificar dados...
00:01 - Se inscreva aí !
#OrdenarDados #PandasSortValues #PandasDropDuplicates #AnaliseDados #PythonExcel

Пікірлер: 16
@guilhermesilva-kp9gw
@guilhermesilva-kp9gw Жыл бұрын
Obrigado irmão! Salvou muito!
@eulerbelfortt8839
@eulerbelfortt8839 2 жыл бұрын
Parabéns pelo conteúdo , muito bom 👏🏼👏🏼👏🏼
@dariogoismarques1242
@dariogoismarques1242 8 ай бұрын
muito bom
@alldados
@alldados 3 жыл бұрын
Não deixe de dar aquela força para o nosso canal: kzfaq.info/get/bejne/aZ5mq6aGnrSwhoU.html
@lucasavelino3327
@lucasavelino3327 Жыл бұрын
Muito bom!! Ajudou d++
@Esseeoclassico
@Esseeoclassico 2 жыл бұрын
Oi boa noite, eu tenho um trabalho pra fazer.. Eu tenho uma tabela com as colunas Nome, Contatos, Atividades e Status. Eu preciso remover certas linhas da minha tabela, só que eu só posso remover as linhas que tem o valor "Oportunidades" da coluna "Status", sendo que a coluna "Status" tem os valores.. Oportunidades, Ativos, Inativos e Suspenso, agradeceria demais se pudesse me ajudar, Obrigado.
@alldados
@alldados 2 жыл бұрын
Olá Nicolas. Pelo que entendi voce poderia fazer um filtro de exclusão da seguinte maneira: df = df.loc[df["Status"] != "Oportunidades"]. Esse seria o jeito mais fácil de realizar isso. Faça um teste e veja se resolve esse impedimento.
@tatianacavalcantedossantos4342
@tatianacavalcantedossantos4342 7 ай бұрын
Oi professor , tudo bem? no meu Df eu já fiz o quartil e ja tenho o resultado do limite superior, porem cada produto tem a sua quantidade e o seu limite superior vai ser diferente , como faço para calcular o limite superior de cada produto de uma vez ???? Por favor me ajude !
@alldados
@alldados 6 ай бұрын
Olá Tati. Se bem entendi, você teria um df com as colunas: PRODUTO, QTDE, e sua terceira seria o quartil, certo? Nesse caso acredito que voce possa usar o groupby() e usar dentro do agg() do groupby o np.quantle(). Dessa forma, voce conseguiria agrupar o PRODUTO, QUARTIL. Agora caso você precise carimbar repetidamente o quartil para cada PRODUTO e QTDE, talvez um loop for ( ou df.iterrows() ) ajude.
@tatianacavalcantedossantos4342
@tatianacavalcantedossantos4342 2 жыл бұрын
Amigo como faço para excluir linhas com valores específicos , ex: na minha tabela tem o nome código e eu preciso excluir todas as linhas que contém esse nome.
@alldados
@alldados 2 жыл бұрын
Tatiana, você pode usar condições com .loc e filtrá-las. Exemplo: df = df.loc[~df['colunaA'] == condicao] ou df = df.loc[df['colunaA'] != condicao] Isso já eliminará as linhas com essas condições.
@danilodantas1426
@danilodantas1426 2 жыл бұрын
No caso, nesse exemplo, usando todas as colunas para identificar duplicatas, como manter somente a mais recente (data/hora)? Existe uma maneira de exportar o resultado para xml ou json?
@alldados
@alldados 2 жыл бұрын
Oi Danilo. No caso de datas, o que você pode fazer é ordená-las da mais recente pra mais antiga, ou vice-versa, e usar o drop_duplicates( ). Agora caso você precise de uma data específica (intermediária), sugiro criar uma coluna a mais como fator de "ordenação", atribuindo 0 ou 1 e por aí vai. E sim, é possível exportar para xml ou json. Se não me engano, o próprio pandas já possui um pd.to_json( ) embutido.
@danilodantas1426
@danilodantas1426 2 жыл бұрын
@@alldados E como o drop_duplicates() identificará qual é a mais recente? Tem algum parâmetro? Por padrão, qual o critério para ele excluir a duplicata? Porque se eu der um drop_duplicates() fazendo apenas o que me indicou, provavelmente ele vai excluir sem critério!
@alldados
@alldados 2 жыл бұрын
@@danilodantas1426 o dro_duplicates( ) possui um parâmetro chamado 'keep_first' que por padrão vem setado como 'TRUE'. Então, na sua tabela, sempre o primeiro parâmetro será mantido, mas é o primeiro parâmetro que aparece n sua tabela, independente de ordenação ou não. Caso queira permanecer com o último, basta colocar o keep_first = False, que aí somente o último será deletado. Aí com isso você deverá verificar como ordenará sua tabela. No caso de data, você ordenaria com o sort_values( ) passando sua coluna de DATA e se ele deve ser ascendente (ascending = True) ou descendente (ascending = False). A partir disso, você dropa usando o drop_duplicates( ) a partir da data que deseja eliminar (a mais recente ou a mais antiga)
@danilodantas1426
@danilodantas1426 2 жыл бұрын
@@alldados Ótimo! Vou procurar estudar mais as funções! Obrigado pelo esclarecimento e parabéns! Ótimo conteúdo!
How do I find and remove duplicate rows in pandas?
9:48
Data School
Рет қаралды 106 М.
Fast and Furious: New Zealand 🚗
00:29
How Ridiculous
Рет қаралды 48 МЛН
لااا! هذه البرتقالة مزعجة جدًا #قصير
00:15
One More Arabic
Рет қаралды 50 МЛН
Limpeza e Tratamento de Dados Ausentes e Duplicados com Pandas em Python
22:04
Bóson Treinamentos
Рет қаралды 4,7 М.
Como Ler Arquivo em Excel com Várias Abas no Python [Pandas]
27:33
Hashtag Programação
Рет қаралды 31 М.
Como iterar pelas linhas no DataFrame do Pandas
7:48
Filtros e Seleções no Pandas
16:04
Universidade dos Dados
Рет қаралды 6 М.
How to Convert CSV to Excel with Python and Pandas?
10:43
AllTech
Рет қаралды 12 М.
Remove Duplicate Columns from a Pandas DataFrame Automatically
13:28
Elimine valores duplicados no Excel com a Função Único
0:35
Professora Aline Elias
Рет қаралды 401 М.
Como Tratar Valores Vazios em uma Base de Dados com Python
31:40
Hashtag Programação
Рет қаралды 16 М.
Fast and Furious: New Zealand 🚗
00:29
How Ridiculous
Рет қаралды 48 МЛН