Pandas é uma biblioteca Python de código aberto usada principalmente para manipulação e análise de dados. Ele é construído com base na biblioteca NumPy e fornece estruturas de dados de alto desempenho e fáceis de usar e ferramentas de análise de dados para a linguagem de programação Python.

Neste artigo, você aprenderá a realizar 6 operações básicas usando o Pandas.

Usando exemplos de pandas

Você pode executar os exemplos neste artigo usando notebooks computacionais como Notebook Jupyter, Google Colabetc. Você também pode executar os exemplos inserindo o código diretamente no interpretador Python no modo interativo.

Se você quiser dar uma olhada no código-fonte completo usado neste artigo, você pode acessar o arquivo Python Notebook a partir deste Repositório GitHub.

1. Como importar o Pandas como pd e imprimir o número da versão

Você precisa usar o importar palavra-chave para importar qualquer biblioteca em Python. Pandas é normalmente importado sob o pd alias. Com esta abordagem, você pode se referir ao pacote Pandas como pd ao invés de pandas.

importar pandas como pd
imprimir (pd .__ versão__)

Saída:

1.2.4

2. Como criar uma série em pandas

Pandas Series é uma matriz unidimensional que contém dados de qualquer tipo. É como uma coluna em uma tabela. Você pode criar uma série usando matrizes numpy, funções numpy, listas, dicionários, valores escalares, etc.

Os valores da série são rotulados com seu número de índice. Por padrão, o primeiro valor tem índice 0, o segundo valor tem índice 1 e assim por diante. Para nomear seus próprios rótulos, você precisa usar o índice argumento.

Como criar uma série vazia

s = pd. Série (dtype = 'float64')
s

Saída:

Série ([], dtipo: float64)

No exemplo acima, uma série vazia com o flutuador tipo de dados é criado.

Como Criar uma Série Usando Matriz NumPy

importar pandas como pd
importar numpy como np
d = np.matriz ([1, 2, 3, 4, 5])
s = pd. Série (d)
s

Saída:

0 1
1 2
2 3
3 4
4 5
dtype: int32

Relacionado: Operações NumPy para iniciantes

Como criar uma série usando uma lista

d = [1, 2, 3, 4, 5]
s = pd. Série (d)
s

Saída:

0 1
1 2
2 3
3 4
4 5
dtype: int64

Como criar uma série com índice

Para criar uma série com um índice, você precisa usar o índice argumento. O número de índices deve ser igual ao número de elementos da série.

d = [1, 2, 3, 4, 5]
s = pd. Série (d, índice = ["um", "dois", "três", "quatro", "cinco"])
s

Saída:

Um 1
dois 2
três 3
quatro 4
cinco 5
dtype: int64

Como criar uma série usando um dicionário

As chaves do dicionário tornam-se os rótulos da série.

d = {"um": 1,
"dois": 2,
"três": 3,
"quatro": 4,
"cinco": 5}
s = pd. Série (d)
s

Saída:

Um 1
dois 2
três 3
quatro 4
cinco 5
dtype: int64

Como Criar uma Série Usando Valor Escalar

Se você deseja criar uma série usando um valor escalar, você deve fornecer o índice argumento.

s = pd. Série (1, índice = ["a", "b", "c", "d"])
s

Saída:

a 1
b 1
c 1
d 1
dtype: int64

3. Como criar um Dataframe em Pandas

Um DataFrame é uma estrutura de dados bidimensional em que os dados são alinhados na forma de linhas e colunas. Um DataFrame pode ser criado usando dicionários, listas, uma lista de dicionários, matrizes numpy, etc. No mundo real, os DataFrames são criados usando o armazenamento existente, como arquivos CSV, arquivos Excel, bancos de dados SQL, etc.

O objeto DataFrame oferece suporte a vários atributos e métodos. Se você quiser saber mais sobre eles, pode verificar a documentação oficial do dataframe do pandas.

Como criar um DataFrame vazio

df = pd. Quadro de dados()
imprimir (df)

Saída:

DataFrame vazio
Colunas: []
Índice: []

Como criar um DataFrame usando uma lista

listObj = ["MUO", "tecnologia", "simplificado"]
df = pd. DataFrame (listObj)
imprimir (df)

Saída:

 0
0 MUO
1 tecnologia
2 simplificado

Como Criar um DataFrame Usando Dicionário de ndarray / Listas

batmanData = {'Nome do filme': ['Batman Begins', 'The Dark Knight', 'The Dark Knight Rises'],
'Ano de lançamento': [2005, 2008, 2012]}
df = pd. DataFrame (batmanData)
imprimir (df)

Saída:

 Ano de lançamento do nome do filme
0 Batman Begins 2005
1 The Dark Knight 2008
2 The Dark Knight Rises 2012

Como criar um DataFrame usando uma lista de listas

dados = [['Alex', 601], ['Bob', 602], ['Cataline', 603]]
df = pd. DataFrame (dados, colunas = ['Nome', 'Roll No.'])
imprimir (df)

Saída:

 Nº da lista de nomes
0 Alex 601
1 Bob 602
2 Cataline 603

Como criar um DataFrame usando uma lista de dicionários

dados = [{'Nome': 'Alex', 'Roll No.': 601},
{'Nome': 'Bob', 'Roll No.': 602},
{'Nome': 'Cataline', 'Roll No.': 603}]
df = pd. DataFrame (dados)
imprimir (df)

Saída:

 Nº da lista de nomes
0 Alex 601
1 Bob 602
2 Cataline 603

Relacionado: Como converter uma lista em um dicionário em Python

Como criar um DataFrame usando a função zip ()

Use o fecho eclair() função para mesclar listas em Python.

Nome = ['Alex', 'Bob', 'Cataline']
RollNo = [601, 602, 603]
listOfTuples = list (zip (Name, RollNo))
df = pd. DataFrame (listOfTuples, colunas = ['Nome', 'Roll No.'])
imprimir (df)

Saída:

 Nº da lista de nomes
0 Alex 601
1 Bob 602
2 Cataline 603

4. Como ler dados CSV em pandas

Um arquivo de "valores separados por vírgula" (CSV) é um arquivo de texto delimitado que usa uma vírgula para separar os valores. Você pode ler um arquivo CSV usando o read_csv () método em pandas. Se você quiser imprimir todo o DataFrame, use o para sequenciar() método.

Neste e nos próximos exemplos, este Arquivo CSV será usado para realizar as operações.

df = pd.read_csv (' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
imprimir (df.to_string ())

Saída:

5. Como analisar DataFrames usando os métodos head (), tail () e info ()

Como visualizar dados usando o método head ()

o cabeça() método é uma das melhores maneiras de obter uma visão geral rápida do DataFrame. Este método retorna o cabeçalho e o número especificado de linhas, começando do topo.

df = pd.read_csv (' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
imprimir (df.head (10))

Saída:

Se você não especificar o número de linhas, as primeiras 5 linhas serão retornadas.

df = pd.read_csv (' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
imprimir (df.head ())

Saída:

Como visualizar dados usando o método tail ()

o cauda() método retorna o cabeçalho e o número especificado de linhas, começando da parte inferior.

df = pd.read_csv (' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
imprimir (df.tail (10))

Saída:

Se você não especificar o número de linhas, as últimas 5 linhas serão retornadas.

df = pd.read_csv (' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
imprimir (df.tail ())

Saída:

Como obter informações sobre os dados

o info () métodos retornam um breve resumo de um DataFrame incluindo o índice dtype e coluna dtypes, valores não nulos e uso de memória.

df = pd.read_csv (' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
imprimir (df.info ())

Saída:

6. Como ler dados JSON em pandas

JSON (JavaScript Objeto Notação) é um formato de intercâmbio de dados leve. Você pode ler um arquivo JSON usando o read_json () método em pandas. Se você quiser imprimir todo o DataFrame, use o para sequenciar() método.

No exemplo abaixo, este Arquivo JSON é usado para realizar as operações.

Relacionado: O que é JSON? Visão geral de um leigo

df = pd.read_json (' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/google_markers.json')
imprimir (df.to_string ())

Saída:

Atualize seu conhecimento de Python com funções e métodos integrados

Funções ajudam a encurtar seu código e melhorar sua eficiência. Funções e métodos como reduzir(), dividir(), enumerar(), eval (), volta()etc. pode tornar seu código robusto e fácil de entender. É sempre bom saber sobre funções e métodos integrados, pois eles podem simplificar em grande medida suas tarefas de programação.

CompartilhadoTweetO email
20 funções Python que você deve conhecer

A biblioteca padrão do Python contém muitas funções para ajudar em suas tarefas de programação. Aprenda sobre os mais úteis e crie códigos mais robustos.

Leia a seguir

Tópicos relacionados
  • Programação
  • Pitão
  • Desenvolvimento web
  • Programação
  • Análise de dados
Sobre o autor
Yuvraj Chandra (69 artigos publicados)

Yuvraj é estudante de graduação em Ciência da Computação na Universidade de Delhi, na Índia. Ele é apaixonado por Full Stack Web Development. Quando ele não está escrevendo, ele está explorando a profundidade de diferentes tecnologias.

Mais de Yuvraj Chandra

Assine a nossa newsletter

Junte-se ao nosso boletim informativo para dicas de tecnologia, análises, e-books grátis e ofertas exclusivas!

Clique aqui para se inscrever