Pandas é uma biblioteca Python de código aberto usada principalmente para manipulação e análise de dados. Ele é construído com base na biblioteca NumPy e fornece estruturas de dados de alto desempenho e fáceis de usar e ferramentas de análise de dados para a linguagem de programação Python.
Neste artigo, você aprenderá a realizar 6 operações básicas usando o Pandas.
Usando exemplos de pandas
Você pode executar os exemplos neste artigo usando notebooks computacionais como Notebook Jupyter, Google Colabetc. Você também pode executar os exemplos inserindo o código diretamente no interpretador Python no modo interativo.
Se você quiser dar uma olhada no código-fonte completo usado neste artigo, você pode acessar o arquivo Python Notebook a partir deste Repositório GitHub.
1. Como importar o Pandas como pd e imprimir o número da versão
Você precisa usar o importar palavra-chave para importar qualquer biblioteca em Python. Pandas é normalmente importado sob o pd alias. Com esta abordagem, você pode se referir ao pacote Pandas como pd ao invés de pandas.
importar pandas como pd
imprimir (pd .__ versão__)
Saída:
1.2.4
2. Como criar uma série em pandas
Pandas Series é uma matriz unidimensional que contém dados de qualquer tipo. É como uma coluna em uma tabela. Você pode criar uma série usando matrizes numpy, funções numpy, listas, dicionários, valores escalares, etc.
Os valores da série são rotulados com seu número de índice. Por padrão, o primeiro valor tem índice 0, o segundo valor tem índice 1 e assim por diante. Para nomear seus próprios rótulos, você precisa usar o índice argumento.
Como criar uma série vazia
s = pd. Série (dtype = 'float64')
s
Saída:
Série ([], dtipo: float64)
No exemplo acima, uma série vazia com o flutuador tipo de dados é criado.
Como Criar uma Série Usando Matriz NumPy
importar pandas como pd
importar numpy como np
d = np.matriz ([1, 2, 3, 4, 5])
s = pd. Série (d)
s
Saída:
0 1
1 2
2 3
3 4
4 5
dtype: int32
Relacionado: Operações NumPy para iniciantes
Como criar uma série usando uma lista
d = [1, 2, 3, 4, 5]
s = pd. Série (d)
s
Saída:
0 1
1 2
2 3
3 4
4 5
dtype: int64
Como criar uma série com índice
Para criar uma série com um índice, você precisa usar o índice argumento. O número de índices deve ser igual ao número de elementos da série.
d = [1, 2, 3, 4, 5]
s = pd. Série (d, índice = ["um", "dois", "três", "quatro", "cinco"])
s
Saída:
Um 1
dois 2
três 3
quatro 4
cinco 5
dtype: int64
Como criar uma série usando um dicionário
As chaves do dicionário tornam-se os rótulos da série.
d = {"um": 1,
"dois": 2,
"três": 3,
"quatro": 4,
"cinco": 5}
s = pd. Série (d)
s
Saída:
Um 1
dois 2
três 3
quatro 4
cinco 5
dtype: int64
Como Criar uma Série Usando Valor Escalar
Se você deseja criar uma série usando um valor escalar, você deve fornecer o índice argumento.
s = pd. Série (1, índice = ["a", "b", "c", "d"])
s
Saída:
a 1
b 1
c 1
d 1
dtype: int64
3. Como criar um Dataframe em Pandas
Um DataFrame é uma estrutura de dados bidimensional em que os dados são alinhados na forma de linhas e colunas. Um DataFrame pode ser criado usando dicionários, listas, uma lista de dicionários, matrizes numpy, etc. No mundo real, os DataFrames são criados usando o armazenamento existente, como arquivos CSV, arquivos Excel, bancos de dados SQL, etc.
O objeto DataFrame oferece suporte a vários atributos e métodos. Se você quiser saber mais sobre eles, pode verificar a documentação oficial do dataframe do pandas.
Como criar um DataFrame vazio
df = pd. Quadro de dados()
imprimir (df)
Saída:
DataFrame vazio
Colunas: []
Índice: []
Como criar um DataFrame usando uma lista
listObj = ["MUO", "tecnologia", "simplificado"]
df = pd. DataFrame (listObj)
imprimir (df)
Saída:
0
0 MUO
1 tecnologia
2 simplificado
Como Criar um DataFrame Usando Dicionário de ndarray / Listas
batmanData = {'Nome do filme': ['Batman Begins', 'The Dark Knight', 'The Dark Knight Rises'],
'Ano de lançamento': [2005, 2008, 2012]}
df = pd. DataFrame (batmanData)
imprimir (df)
Saída:
Ano de lançamento do nome do filme
0 Batman Begins 2005
1 The Dark Knight 2008
2 The Dark Knight Rises 2012
Como criar um DataFrame usando uma lista de listas
dados = [['Alex', 601], ['Bob', 602], ['Cataline', 603]]
df = pd. DataFrame (dados, colunas = ['Nome', 'Roll No.'])
imprimir (df)
Saída:
Nº da lista de nomes
0 Alex 601
1 Bob 602
2 Cataline 603
Como criar um DataFrame usando uma lista de dicionários
dados = [{'Nome': 'Alex', 'Roll No.': 601},
{'Nome': 'Bob', 'Roll No.': 602},
{'Nome': 'Cataline', 'Roll No.': 603}]
df = pd. DataFrame (dados)
imprimir (df)
Saída:
Nº da lista de nomes
0 Alex 601
1 Bob 602
2 Cataline 603
Relacionado: Como converter uma lista em um dicionário em Python
Como criar um DataFrame usando a função zip ()
Use o fecho eclair() função para mesclar listas em Python.
Nome = ['Alex', 'Bob', 'Cataline']
RollNo = [601, 602, 603]
listOfTuples = list (zip (Name, RollNo))
df = pd. DataFrame (listOfTuples, colunas = ['Nome', 'Roll No.'])
imprimir (df)
Saída:
Nº da lista de nomes
0 Alex 601
1 Bob 602
2 Cataline 603
4. Como ler dados CSV em pandas
Um arquivo de "valores separados por vírgula" (CSV) é um arquivo de texto delimitado que usa uma vírgula para separar os valores. Você pode ler um arquivo CSV usando o read_csv () método em pandas. Se você quiser imprimir todo o DataFrame, use o para sequenciar() método.
Neste e nos próximos exemplos, este Arquivo CSV será usado para realizar as operações.
df = pd.read_csv (' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
imprimir (df.to_string ())
Saída:
5. Como analisar DataFrames usando os métodos head (), tail () e info ()
Como visualizar dados usando o método head ()
o cabeça() método é uma das melhores maneiras de obter uma visão geral rápida do DataFrame. Este método retorna o cabeçalho e o número especificado de linhas, começando do topo.
df = pd.read_csv (' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
imprimir (df.head (10))
Saída:
Se você não especificar o número de linhas, as primeiras 5 linhas serão retornadas.
df = pd.read_csv (' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
imprimir (df.head ())
Saída:
Como visualizar dados usando o método tail ()
o cauda() método retorna o cabeçalho e o número especificado de linhas, começando da parte inferior.
df = pd.read_csv (' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
imprimir (df.tail (10))
Saída:
Se você não especificar o número de linhas, as últimas 5 linhas serão retornadas.
df = pd.read_csv (' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
imprimir (df.tail ())
Saída:
Como obter informações sobre os dados
o info () métodos retornam um breve resumo de um DataFrame incluindo o índice dtype e coluna dtypes, valores não nulos e uso de memória.
df = pd.read_csv (' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
imprimir (df.info ())
Saída:
6. Como ler dados JSON em pandas
JSON (JavaScript Objeto Notação) é um formato de intercâmbio de dados leve. Você pode ler um arquivo JSON usando o read_json () método em pandas. Se você quiser imprimir todo o DataFrame, use o para sequenciar() método.
No exemplo abaixo, este Arquivo JSON é usado para realizar as operações.
Relacionado: O que é JSON? Visão geral de um leigo
df = pd.read_json (' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/google_markers.json')
imprimir (df.to_string ())
Saída:
Atualize seu conhecimento de Python com funções e métodos integrados
Funções ajudam a encurtar seu código e melhorar sua eficiência. Funções e métodos como reduzir(), dividir(), enumerar(), eval (), volta()etc. pode tornar seu código robusto e fácil de entender. É sempre bom saber sobre funções e métodos integrados, pois eles podem simplificar em grande medida suas tarefas de programação.
A biblioteca padrão do Python contém muitas funções para ajudar em suas tarefas de programação. Aprenda sobre os mais úteis e crie códigos mais robustos.
Leia a seguir
- Programação
- Pitão
- Desenvolvimento web
- Programação
- Análise de dados
Yuvraj é estudante de graduação em Ciência da Computação na Universidade de Delhi, na Índia. Ele é apaixonado por Full Stack Web Development. Quando ele não está escrevendo, ele está explorando a profundidade de diferentes tecnologias.
Assine a nossa newsletter
Junte-se ao nosso boletim informativo para dicas de tecnologia, análises, e-books grátis e ofertas exclusivas!
Clique aqui para se inscrever