O Internet Movie Database (IMDb) é o maior banco de dados online que contém informações relacionadas a filmes, séries de televisão, vídeos caseiros, videogames e conteúdo de streaming. O banco de dados online contém milhões de registros precisos que você pode usar para realizar a análise de dados.

Cinemagoer (anteriormente conhecido como IMDbPY) é uma biblioteca Python para gerenciar e recuperar os dados do banco de dados de filmes IMDb. Você pode acessar dados sobre filmes, pessoas e empresas, que podem ser usados ​​posteriormente para análise.

Instalando as Bibliotecas Necessárias

Você precisa instalar o cinéfilo biblioteca Python para acessar o IMDb base de dados. Execute o seguinte comando no prompt de comando para instalar a biblioteca:

pip instalar cinéfilo

Você deve ter pip instalado em seu sistema para instalar bibliotecas Python externas.

O código utilizado neste projeto está disponível em um Repositório GitHub e é gratuito para você usar sob a licença do MIT.

Extraindo dados do IMDb usando Python

Você precisa importar a biblioteca cinemagoer antes de usá-la em seu código.

de imdb importar cinéfilo
ia = Cinemagoer()

O código acima importa a biblioteca cinemagoer e cria uma instância da classe cinemagoer.

Pesquisando filmes

Você pode pesquisar filmes com um determinado título (ou semelhante) usando o busca_filme() método. Por exemplo, se você deseja pesquisar filmes com o título "rock", você precisa executar o seguinte código:

de imdb importar cinéfilo

# Criando uma instância da classe Cinemagoer
ia = Cinemagoer()

# Procurando filmes que tenham rock no nome
filmes = ia.search_movie('pedra')
imprimir(filmes[0])

Isso deve imprimir o primeiro filme que encontrar, por exemplo:

Você pode obter um filme por seu IMDb ID. Você pode extrair mais informações, como nomes de diretores e gêneros. Você precisa percorrer a lista para obter informações individuais.

de imdb importar cinéfilo

# Criando uma instância da classe Cinemagoer
ia = Cinemagoer()

# Obtendo filme por IMDb ID
filme = ia.get_movie('0468569')
imprimir(filme)

# Imprimindo os nomes dos diretores do filme
imprimir('Diretores:')

para diretor em filme ['diretores']:
imprimir (diretor['nome'])

# imprimindo os gêneros do filme
imprimir('Gêneros:')

para gênero no filme ['gêneros']:
imprimir(gênero)

Na saída, você deve ver o nome do filme fornecido, seu(s) diretor(es) e seu(s) gênero(s):

Procurando por uma pessoa

Você pode procurar pessoas usando o pesquisar_pessoa() método. Por exemplo, se você quiser pesquisar "Heath", precisará executar o seguinte código:

de imdb importar cinéfilo

# Criando uma instância da classe Cinemagoer
ia = Cinemagoer()

# Procurando por pessoas com Heath em seus nomes
pessoas = ia.search_person('charneca')
imprimir(pessoas[0])

Você verá o nome da primeira pessoa correspondente que a pesquisa encontrar:

Buscando Empresas

Você pode procurar empresas usando o busca_empresa() método. Por exemplo, se você quiser pesquisar "Universal", precisará executar o seguinte código:

de imdb importar cinéfilo

# Criando uma instância da classe Cinemagoer
ia = Cinemagoer()

# Procurando por empresas que tenham Universal em seus nomes
empresas = ia.search_company('Universal')
imprimir(empresas)

Você obterá a lista de todas as empresas que possuem Universal em seu nome.

Você também pode recuperar os dados de uma pessoa e empresa usando seu ID.

de imdb importar cinéfilo

# Criando uma instância da classe Cinemagoer
ia = Cinemagoer()

# Obtendo dados pessoais por ID
pessoa = ia.get_person('0005132')
imprimir (pessoa['nome'])
imprimir (pessoa['data de nascimento'])

# Obtendo dados da empresa por ID
empresa = ia.get_company('0005073')
imprimir (empresa['nome'])

A saída mostrará detalhes da pessoa e o nome de uma empresa:

Encontrar filmes superiores e inferiores

Você pode recuperar os dados dos 250 melhores e dos 100 últimos filmes usando o get_top250_movies() e get_bottom100_movies() métodos, respectivamente:

de imdb importar cinéfilo

# Criando uma instância da classe Cinemagoer
ia = Cinemagoer()

# Encontrando os 250 melhores filmes
top = ia.get_top250_movies()
imprimir(principal[0])

# Encontrando os 100 últimos filmes
bottom = ia.get_bottom100_movies()
imprimir(fundo[0])

Em resposta, você verá o nome do melhor filme e o nome do pior:

A biblioteca cinemagoer também fornece alguns outros métodos como get_top250_tv(), get_popular100_movies(), e get_top250_indian_movies().

A análise de dados é a avaliação de dados usando ferramentas analíticas ou estatísticas para extrair informações. A popularidade da análise de dados está crescendo a cada dia. Agora é usado por empresas, empresas de marketing e equipes esportivas. O processo completo de análise de dados inclui a definição de objetivos, formulação de perguntas, coleta de dados, depuração de dados, análise de dados e conclusão dos resultados.

Você pode obter conjuntos de dados para seus projetos usando bibliotecas Python como Cinemagoer ou por meio de plataformas online como Kaggle. Juntamente com linguagens completas como Python e R, você pode usar outras ferramentas como Microsoft Excel, Tableau e Stata para realizar a análise de dados.