Python, como linguagem, é valioso além da medida, especialmente quando você deseja trabalhar com dados estruturados. Como as pessoas armazenam muitos dados em arquivos do Excel, é imperativo consolidar vários arquivos para economizar tempo e esforço.

Python permite que você faça exatamente isso; não importa quantos arquivos do Excel você queira combinar, você pode fazer isso com relativa facilidade. Dada a variedade de bibliotecas e recursos de terceiros, você pode importar e usar as ferramentas multifacetadas do Python para fazer seus lances.

Neste guia, você precisará instalar e usar as bibliotecas Pandas para importar dados para o Python antes de consolidá-los.

Instalar bibliotecas Pandas em Python

Pandas é uma biblioteca de terceiros que você pode instalar em Python. Alguns IDEs já possuem Pandas instalados neles.

Se você estiver usando um Versão IDE que não vem com o Pandas pré-instalado, fique tranquilo, você pode instalá-lo diretamente no Python.

Veja como instalar o Pandas:

pip instalar pandas

Se você estiver usando o Jupyter Notebook, poderá instalar o Pandas diretamente com o Comando PIP. Principalmente, quando você instalou o Jupyter com o Anaconda, há grandes chances de já ter o Pandas disponível para uso direto.

Se você não puder chamar o Pandas, poderá usar o comando acima para instalá-los diretamente.

Combinando arquivos do Excel com Python

Primeiro, você precisa criar uma pasta em seu local preferido com todos os arquivos do Excel. Assim que a pasta estiver pronta, você pode começar a escrever o código para importar as bibliotecas.

Você usará duas variáveis ​​neste código:

  1. Pandas: A biblioteca Pandas fornece os quadros de dados para armazenar arquivos do Excel.
  2. SO: A biblioteca é útil para ler dados da pasta da sua máquina

Para importar essas bibliotecas, use estes comandos:

Importar Pandas como pd
Importar SO
  • Importar: Sintaxe Python usada para importar as bibliotecas em Python
  • Pandas: Nome da biblioteca
  • pd: Alias ​​dado à biblioteca
  • SO: Uma biblioteca para acessar a pasta do sistema

Depois de importar as bibliotecas, crie duas variáveis ​​para armazenar o caminho do arquivo de entrada e saída. O caminho do arquivo de entrada é necessário para acessar a pasta dos arquivos. O caminho do arquivo de saída é necessário, pois o arquivo combinado será exportado para lá.

Se você estiver usando Python, certifique-se de alterar a barra invertida para barra (\ para /)

input_file_path = "C:/Users/gaurav/OneDrive/Desktop/Excel files/"
output_file_path = "C:/Users/gaurav/OneDrive/Desktop/"

Anexar o / no final também para completar os caminhos.

Os arquivos da pasta estão disponíveis em uma lista. Crie uma lista para armazenar todas as referências de arquivo da pasta de entrada usando o listadir função do SO biblioteca.

Se você não tiver certeza das funções disponíveis em uma biblioteca, poderá usar o diretório função com o nome da biblioteca. Por exemplo, para verificar a versão exata da função listdir, você pode usar o comando da seguinte forma:

diretório (SO)

A saída consistirá em todas as funções associadas disponíveis na biblioteca do SO. A função listdir é uma das muitas funções disponíveis nesta biblioteca.

Crie uma nova variável para armazenar os arquivos de entrada da pasta.

excel_file_list = os.listdir (input_file_path)

Imprima esta variável para ver os nomes dos arquivos armazenados na pasta. Todos os arquivos armazenados na pasta são exibidos quando você usa a função de impressão.

imprimir (excel_file_list)

Em seguida, você precisa adicionar um novo quadro de dados para armazenar cada arquivo do Excel. Imagine um quadro de dados como um contêiner para armazenar dados. Aqui está o comando para criar um quadro de dados.

df = pd. Quadro de dados()
  • df: Variável para armazenar o valor do DataFrame
  • pd: Alias ​​para o Biblioteca de pandas
  • Quadro de dados: Sintaxe padrão para adicionar um quadro de dados

A pasta de entrada tem três .xlsx arquivos neste exemplo. Os nomes dos arquivos são:

Arquivo1_excel.xlsx
Arquivo2_excel.xlsx
Arquivo3_excel.xlsx

Para abrir cada arquivo desta pasta, você precisa executar um loop. O loop será executado para cada um dos arquivos na lista criada acima.

Veja como você pode fazer isso:

para excel_files em excel_file_list:

Em seguida, é necessário verificar as extensões dos arquivos, pois o código abrirá apenas arquivos XLSX. Para verificar esses arquivos, você pode usar um Se declaração.

Use o termina com função para este fim, como segue:

para excel_files em excel_file_list:

if excel_files.endswith(".xlsx"):

  • excel_files: Lista com todos os valores do arquivo
  • termina com: Função para verificar a extensão dos arquivos
  • (".xlsx"): Este valor de string pode mudar, dependendo do que você deseja pesquisar

Agora que você identificou os arquivos do Excel, você pode criar um novo quadro de dados para ler e armazenar os arquivos individualmente.

para excel_files em excel_file_list:

if excel_files.endswith(".xlsx"):

df1 = pd.read_excel (input_file_path+excel_files)

  • df1: Novo quadro de dados
  • pd: Biblioteca de pandas
  • leia_excel: Função para ler arquivos do Excel dentro da biblioteca Pandas
  • input_file_path: Caminho da pasta onde os arquivos estão armazenados
  • excel_files: Qualquer variável que é usada no loop for

Para começar a anexar os arquivos, você precisa usar o acrescentar função.

para excel_files em excel_file_list:

if excel_files.endswith(".xlsx"):

df1 = pd.read_excel (input_file_path+excel_files)
df = df.append (df1)

Finalmente, agora que o quadro de dados consolidado está pronto, você pode exportá-lo para o local de saída. Nesse caso, você está exportando o quadro de dados para um arquivo XLSX.

df.to_excel (output_file_path+"Consolidated_file.xlsx")
  • df: Dataframe para exportar
  • para se destacar: Comando usado para exportar os dados
  • output_file_path: Caminho definido para armazenar a saída
  • Consolidated_file.xlsx: Nome do arquivo consolidado

Agora vamos ver o código final:

#Pandas é usado como um dataframe para lidar com arquivos do Excel
importar pandas como pd
importar SO

# altere a barra de “\” para “/”, se você estiver usando dispositivos Windows

input_file_path = "C:/Users/gaurav/OneDrive/Desktop/Excel files/"
output_file_path = "C:/Users/gaurav/OneDrive/Desktop/"

#cria uma lista para armazenar todas as referências de arquivo da pasta de entrada usando a função listdir da biblioteca os.
#Para ver o conteúdo de uma biblioteca (como a função listdir, você pode usar a função dir no nome da biblioteca).
#Use dir (library_name) para listar o conteúdo

excel_file_list = os.listdir (input_file_path)

#imprime todos os arquivos armazenados na pasta, após definir a lista
lista_arquivo_excel

#Uma vez que cada arquivo é aberto, use a função append para começar a consolidar os dados armazenados em vários arquivos

#crie um novo dataframe em branco para lidar com as importações de arquivos do Excel
df = pd. Quadro de dados()

#Executa um loop for para percorrer cada arquivo na lista
para excel_files em excel_file_list:
#verificar somente arquivos de sufixo .xlsx
if excel_files.endswith(".xlsx"):
#crie um novo dataframe para ler/abrir cada arquivo Excel da lista de arquivos criada acima
df1 = pd.read_excel (input_file_path+excel_files)
#anexe cada arquivo no dataframe vazio original
df = df.append (df1)

#transferir a saída final para um arquivo Excel (xlsx) no caminho de saída
df.to_excel (output_file_path+"Consolidated_file.xlsx")

Usando Python para combinar várias pastas de trabalho do Excel

O Python's Pandas é uma excelente ferramenta para iniciantes e usuários avançados. A biblioteca é usada extensivamente por desenvolvedores que desejam dominar o Python.

Mesmo se você for um iniciante, você pode se beneficiar imensamente aprendendo as nuances do Pandas e como a biblioteca é usada dentro do Python.

6 operações de pandas para iniciantes

Pegue o jeito dos Pandas com essas operações para iniciantes.

Leia a seguir

ParticipaçãoTweetE-mail
Tópicos relacionados
  • Programação
  • Pitão
  • Microsoft Excel
  • Planilha
Sobre o autor
Gaurav Siyal (59 Artigos Publicados)

Gaurav Siyal tem dois anos de experiência em redação, escrevendo para uma série de empresas de marketing digital e documentos de ciclo de vida de software.

Mais de Gaurav Siyal

Assine a nossa newsletter

Junte-se à nossa newsletter para dicas de tecnologia, análises, e-books gratuitos e ofertas exclusivas!

Clique aqui para assinar