Veja como usar as ferramentas internas do Excel para facilitar a análise estatística.

Os gráficos de resíduos desempenham um papel essencial na análise de regressão. Eles informam com que precisão sua linha de regressão representa a relação entre duas variáveis. O guia a seguir explica como calcular e plotar os resíduos do Excel usando dois métodos.

Mas antes de chegarmos ao que interessa, vamos entender brevemente os resíduos e sua importância em uma análise de regressão.

O que são resíduos e por que são importantes?

Um resíduo é uma diferença entre o valor observado (real) e o valor previsto. Em termos mais simples, um resíduo é um erro. Por exemplo, se o valor observado for 10 e seu modelo der um valor 8, o valor residual será 2.

Por outro lado, um gráfico residual é um gráfico de dispersão no qual a variável independente (idade) é plotada no eixo horizontal e os resíduos (erros) são plotados no eixo vertical.

Ok, você sabe o que são resíduos, mas por que eles são importantes? Para entender isso, considere o seguinte caso:

instagram viewer

Queremos entender a relação entre idade e taxas de poupança. Para isso, traçaremos uma linha de regressão. No entanto, não temos certeza se a linha de regressão representa com precisão a relação entre as duas variáveis. É aí que entram os resíduos. Usamos um gráfico residual para verificar a precisão da linha de regressão.

Agora que você sabe o que são resíduos, vamos aprender como criar um gráfico de resíduos no Excel:

Como criar um gráfico residual usando a equação de linha de tendência

O primeiro método de traçar resíduos no Excel usa uma equação de linha de tendência para calcular os valores previstos para nossos dados. Assim que tivermos isso, podemos calcular os resíduos subtraindo os valores previstos dos valores observados. Por fim, criamos um gráfico de dispersão com os preditores no eixo horizontal e os resíduos no eixo vertical.

Embora esse método exija mais etapas do que o segundo método, é uma ótima maneira de entender o conceito. Depois de ter um entendimento decente, você pode usar o segundo método, que requer menos tempo e esforço.

Vamos orientá-lo através do processo, um passo de cada vez:

Etapa 1: insira os dados

Começamos inserindo os valores para o preditor (sob o x coluna) e os valores observados (sob a Y coluna):

Etapa 2: criar um gráfico de dispersão dos dados

Agora criamos um gráfico de dispersão dos dados seguindo as etapas abaixo:

Se você não estiver familiarizado com gráficos de dispersão, aqui está um artigo abrangente sobre criando um gráfico de dispersão no Excel e apresentando seus dados. Você também pode aprender a usar um gráfico de dispersão no Excel para prever o comportamento dos dados.

  1. Selecione os dados (em x e Y colunas).
  2. Vou ao Faixa de opções do Excel e clique Inserir.
  3. No Gráficos seção, clique na seta sob a gráfico de dispersão opção.
  4. Selecione o primeiro gráfico de dispersão (Dispersão apenas com marcadores).
  5. Você obterá um gráfico de dispersão semelhante ao gráfico a seguir:

Etapa 3: adicionar uma linha de tendência e exibir a equação da linha de tendência no gráfico de dispersão

Siga as etapas abaixo para adicionar uma linha de tendência ao gráfico de dispersão:

  1. Clique no gráfico de dispersão.
  2. Vou ao Faixa de opções do Excel e clique Disposição.
  3. No Fundo seção, clique na seta abaixo da Linha de tendência ícone.
  4. Selecione os Linha de Tendência Linear opção.

Agora você verá uma linha (linha de tendência) cruzando os pontos em seu gráfico de dispersão. Para exibir a equação da linha de tendência no gráfico de dispersão, siga as etapas abaixo:

  1. Vá novamente para o Linha de tendência ícone e clique na seta abaixo dele.
  2. Clique Mais opções de linha de tendência.
  3. A Linha de tendência do formato caixa de diálogo aparecerá.
  4. Verifica a Exibir equação no gráfico opção na parte inferior do Linha de tendência do formato caixa de diálogo. A equação da linha de tendência será exibida no gráfico.

Etapa 4: Calcular os valores previstos

Para calcular os valores previstos, crie outra coluna (Z) ao lado de seus dados e siga os passos abaixo:

  1. Insira a fórmula da linha de tendência mostrada no gráfico e cole-a na coluna Z (célula C2). Mudar o x na fórmula com valores na coluna X.
  2. Assim, para o primeiro valor previsto, a fórmula seria dada da seguinte forma:
    =1,5115*A2+23,133
  3. Substituir A2 com A3 na fórmula de linha de tendência para o segundo valor predicado.
  4. Para o terceiro valor previsto, substitua A3 com A4, e assim por diante, até obter todos os valores predicados para seus preditores correspondentes.

Etapa 5: encontre os valores residuais

Agora que temos os valores previstos, podemos encontrar os valores residuais subtraindo os valores previstos dos valores observados (reais) na coluna Y. A fórmula para o primeiro valor residual seria =B2-C2. Para o segundo, a fórmula seria =B3-C3, e assim por diante.

Etapa 6: criar o gráfico residual

Para criar um gráfico residual, precisamos do preditor e dos valores residuais. Agora que temos os dois, siga os passos abaixo:

  1. Selecionar colunas Y e Z.
  2. Clique com o botão direito e selecione Esconder.
  3. Agora selecione o x e resíduos colunas.
  4. Vou ao Inserir guia na faixa de opções do Excel.
  5. Clique na seta abaixo do dispersão ícone.
  6. Selecione os Dispersão apenas com marcadores opção.
  7. Você obterá sua plotagem residual, conforme mostrado abaixo.

Para o segundo método, tudo o que você precisa fazer é fornecer os dados ao Excel e ele fará todo o trabalho. Você pode criar um gráfico residual com apenas alguns cliques. Mas para isso, você precisará carregar o Analysis Toolpak do Excel. Vamos começar:

  1. Vou ao Arquivo aba e clique Opções.
  2. O Opções do Excel caixa de diálogo aparecerá.
  3. Vou ao Gerenciar caixa (na parte inferior), selecione Suplementos do Excel, e clique Ir.
  4. Um Suplementos caixa de diálogo aparecerá.
  5. Verifica a Pacote de ferramentas de análise caixa e clique OK.
  6. Agora vá para o Faixa de opções do Excel e clique Dados.
  7. Você encontrará o Análise de dados ícone no Análise seção.

Etapa 2: insira os dados

  1. Selecionar colunas A e D, e clique com o botão direito do mouse. Clique Mostrar.
  2. Agora copie o x e Y colunas.

    Você notará que o gráfico mudou depois de exibir as colunas. Para alterá-lo de volta ao gráfico residual original, precisaremos ocultar o Y e Z colunas (selecionando o Y e Z colunas, clicando com o botão direito do mouse e selecionando Esconder).

  3. Abra uma nova planilha do Excel e cole o x e Y colunas.
  4. Clique no recém-aparecido Análise de dados opção no Análise seção do Dados aba.
  5. A Análise de dados caixa de diálogo aparecerá.
  6. Localizar e selecionar Regressão sob Ferramentas de análise.
  7. Clique OK. O Regressão caixa de diálogo aparecerá.
  8. Insira os valores no Y coluna (os preditores, B2:B11) no Intervalo Y de entrada campo.
  9. Digite o intervalo de células no x coluna (as variáveis ​​independentes, A2:A11) no Inserir Faixa X campo.

Etapa 3: criar o gráfico residual

No Regressão caixa de diálogo, sob o Opções de saída, verificar Nova Folha de Planilha, e clique OK.

O Excel criará automaticamente o gráfico residual junto com as seguintes saídas que você pode usar para verificar a confiabilidade do seu modelo de regressão:

  • Estatísticas de regressão
  • Tabela ANOVA
  • Tabela de Coeficientes
  • Saída residual

O Analysis ToolPak do Excel oferece uma variedade de funcionalidades estatísticas valiosas que você pode usar para analisar seus conjuntos de dados. Depois de criar o gráfico residual por meio do Analysis ToolPak do Excel, você pode começar a coçar a cabeça enquanto olha para todas as tabelas complicadas. Mas depois que você aprende a fazer análises de dados fundamentais no Excel, os números não parecem tão assustadores.