Como adicionar novas colunas a um DataFrame Pandas?
Adicionar uma nova coluna a um DataFrame no Pandas é uma tarefa comum e bastante simples. Neste tutorial, vamos explorar diferentes métodos para realizar essa operação e entender como podemos manipular dados de forma eficaz. Vamos começar!
Método 1: Adicionando uma coluna diretamente
Uma das maneiras mais fáceis de adicionar uma nova coluna a um DataFrame é atribuindo um valor a uma nova chave. Vamos ver um exemplo:
import pandas as pd
dados = {
'Nome': ['Alice', 'Bob', 'Charlie'],
'Idade': [25, 30, 35]
}
df = pd.DataFrame(dados)
df['Cidade'] = ['São Paulo', 'Rio de Janeiro', 'Belo Horizonte']
print(df)
O código acima cria um DataFrame com informações sobre pessoas e, em seguida, adiciona uma nova coluna chamada 'Cidade'. O resultado será:
Nome Idade Cidade
0 Alice 25 São Paulo
1 Bob 30 Rio de Janeiro
2 Charlie 35 Belo Horizonte
No código, criamos um dicionário com os dados e, em seguida, usamos o construtor pd.DataFrame
para criar o DataFrame. A nova coluna 'Cidade' foi adicionada simplesmente atribuindo uma lista de cidades a ela.
Método 2: Usando a função assign()
Outra forma de adicionar colunas é utilizando a função assign()
. Essa função pode ser útil quando queremos encadear várias operações. Veja como:
df = df.assign(Pais=['Brasil', 'Brasil', 'Brasil'])
print(df)
Esse código adiciona a coluna 'Pais' ao DataFrame existente. O resultado será:
Nome Idade Cidade Pais
0 Alice 25 São Paulo Brasil
1 Bob 30 Rio de Janeiro Brasil
2 Charlie 35 Belo Horizonte Brasil
A função assign()
é uma maneira elegante de adicionar colunas, especialmente quando você está manipulando vários DataFrames e deseja manter a legibilidade do seu código.
Método 3: Condicionalmente
É possível adicionar colunas com base em condições. Por exemplo, se quisermos adicionar uma coluna que indica se a pessoa é maior de idade:
df['Maior de Idade'] = df['Idade'] >= 18
print(df)
O resultado será:
Nome Idade Cidade Pais Maior de Idade
0 Alice 25 São Paulo Brasil True
1 Bob 30 Rio de Janeiro Brasil True
2 Charlie 35 Belo Horizonte Brasil True
Neste caso, estamos usando uma expressão booleana para determinar se a idade é maior ou igual a 18, resultando em uma nova coluna que indica se a pessoa é maior de idade.
Método 4: Usando o método insert()
O método insert()
permite que você adicione uma coluna em uma posição específica do DataFrame. Vamos adicionar a coluna 'Idade' na segunda posição:
df.insert(1, 'Salário', [3000, 4000, 5000])
print(df)
Após executar esse código, teremos:
Nome Salário Idade Cidade Pais Maior de Idade
0 Alice 3000 25 São Paulo Brasil True
1 Bob 4000 30 Rio de Janeiro Brasil True
2 Charlie 5000 35 Belo Horizonte Brasil True
O método insert()
é perfeito quando você precisa manter uma ordem específica das colunas em seu DataFrame.
Conclusão
Neste tutorial, cobrimos diversas maneiras de adicionar novas colunas a um DataFrame do Pandas, desde métodos diretos até funções que permitem manipulações mais complexas. Com o conhecimento adquirido, você está mais preparado para trabalhar com dados de maneira eficiente e organizada em Python!
Entenda a Importância de Manipular Dados com Pandas
Trabalhar com pandas é uma habilidade essencial para qualquer analista de dados ou cientista de dados. O Pandas permite que você manipule dados de forma eficiente e intuitiva, facilitando a análise de grandes volumes de informações. Com o conhecimento de como adicionar colunas a um DataFrame, você pode enriquecer seus conjuntos de dados e extrair insights valiosos, tornando-se mais competitivo no mercado de trabalho.
Algumas aplicações:
- Análise de dados financeiros
- Processamento de dados científicos
- Criação de dashboards interativos
Dicas para quem está começando
- Pratique frequentemente com pequenos projetos.
- Consulte a documentação oficial do Pandas.
- Participe de comunidades online para trocar experiências.
Contribuições de Lucas Martins