Leitores como você ajudam a apoiar o MUO. Quando você faz uma compra usando links em nosso site, podemos ganhar uma comissão de afiliado. Consulte Mais informação.

Todos nós já passamos por isso: você digita o nome de um site na barra de endereço do seu navegador favorito ou talvez clique no resultado de uma pesquisa no Google. Então, de repente, uma sequência de palavras e símbolos aparentemente aleatórios aparece no final da URL do site. Claro, você não tem ideia de por que está lá, mas está feliz em ver com segurança as listagens da Amazon, os resultados de pesquisa do Google ou qualquer site que você escolher.

Pode parecer sem sentido para o olho destreinado, mas cada caractere em uma URL serve a um propósito. Vamos detalhar a anatomia do URL de um site, do protocolo à string de consulta.

Os 5 principais componentes de uma URL

Uma URL pode ser dividida em três partes principais: o protocolo, o nome de domínio e o caminho. Você pode adicionar uma string de consulta ou usar uma tag âncora.

1. Protocolo

O primeiro componente de uma URL é o protocolo. É o método usado para acessar um recurso na internet. O protocolo mais comum para navegação na web é o HTTP (Hypertext Transfer Protocol). Ele envia uma solicitação do navegador do usuário para o servidor que hospeda o site e o servidor envia de volta o recurso solicitado como resposta.

HTTP tem uma versão segura chamada HTTPS (HTTP Secure), que usa criptografia para adicionar uma camada extra de segurança. O HTTPS é usado quando dados confidenciais, como senhas ou informações de cartão de crédito, são transmitidos pela Internet. Seu site precisa de um certificado SSL para usar o protocolo HTTPS em suas URLs.

2. Nome do domínio

O nome de domínio é o identificador único de um site na internet. Compreende duas partes: o domínio de nível superior (TLD) e o domínio de segundo nível. O TLD indica a categoria do site, como .com para sites comerciais, .edu para instituições educacionais e .org para organizações sem fins lucrativos. O domínio de segundo nível é o nome exclusivo escolhido pelo proprietário do site.

Por exemplo, no nome de domínio www.makeuseof.com, "makeuseof" é o domínio de segundo nível e '.com" é o TLD. Os nomes de domínio são registrados com registradores de domínio e podem ser adquiridos por um período definido, geralmente um ano, mas às vezes mais.

3. Caminho

O caminho da URL especifica a localização de um recurso em um site. Normalmente vem depois do nome de domínio e começa com uma barra (/). O caminho é usado para organizar o conteúdo em um site e facilitar a navegação dos usuários.

Por exemplo, no URL www.example.com/blog/post1, "blog" é o diretório que contém as postagens do blog e "post1" é a postagem específica do blog. O caminho também pode ser usado para otimização de mecanismo de busca (SEO), incluindo palavras-chave relevantes.

4. Cadeia de consulta

A string de consulta faz parte da URL que começa com um ponto de interrogação (?) e contém pares chave-valor separados por um e comercial (&). Ele é usado para passar dados entre páginas da web e pode conter informações como termos de pesquisa ou preferências do usuário.

Por exemplo, no URL www.example.com/search? q=example&category=books, a string de consulta contém dois pares chave-valor: "q=example" indica que o termo de pesquisa é "example" e "category=books" indica que a pesquisa é para livros. Você normalmente verá strings de consulta contendo uma pilha de parâmetros de pesquisa ao navegar em sites que permitem filtrar seus resultados de pesquisa ou sites que desejam capturar dados de rastreamento.

5. Marca de Âncora

Uma marca de âncora é um identificador de fragmento que vem depois da URL e começa com um símbolo de cerquilha (#). Ele é vinculado a uma parte específica de uma página da Web e pode ser usado para criar um sumário ou para vincular a uma seção específica de um artigo longo.

Por exemplo, em um guia de 5.000 palavras, o autor pode incluir um menu de navegação para dividir o conteúdo:

  • Definições
  • História
  • Desafios da indústria
  • perguntas frequentes

Se você passar o mouse sobre um desses links, o URL pode conter uma marca de âncora, como "#definitions", que sinaliza ao navegador para rolar para baixo até a seção com esse ID no HTML.

O que é codificação de URL?

URLs compreendem caracteres do conjunto de caracteres ASCII, um subconjunto do conjunto de caracteres Unicode. Unicode é um padrão de codificação internacional para caracteres em diferentes idiomas e alfabetos. Quando um caractere fora do conjunto de caracteres ASCII é usado em uma URL, ele deve ser codificado para garantir que o navegador o entenda corretamente.

A codificação de URL é o processo de conversão de caracteres fora do conjunto de caracteres ASCII em seu equivalente ASCII. Por exemplo, o caractere Unicode 'é' seria codificado como '%e9'. A codificação de URL também é usada para caracteres especiais, como espaços, que são codificados como '+' ou '%20'.

Não se preocupe em memorizar todas as combinações de codificação possíveis. O Referência de codificação de URL do W3Schools guia é um recurso útil para este assunto.

O que são redirecionamentos de URL?

Às vezes, quando você insere um URL na barra de endereços do navegador, a página da Web redireciona para outra página da Web. Isso ocorre porque existem várias maneiras de estruturar URLs e algumas delas podem não funcionar conforme o esperado. Quando isso acontece, o servidor responde com um código de status HTTP indicando que deve redirecionar para outra URL (geralmente 301 ou 302). O novo local pode então ser especificado no cabeçalho de resposta.

Os códigos de status e seus significados incluem:

  • 200 - OK: A solicitação foi bem-sucedida.
  • 301 mudou-se permanentemente: O recurso solicitado foi movido permanentemente para um novo local e deve ser recuperado de lá em solicitações futuras.
  • 302 - Encontrado (redirecionamento temporário): Isso indica que a página está temporariamente localizada em um URL diferente e não deve ser armazenada em cache pelos mecanismos de pesquisa ou usada como fonte autorizada de informações sobre seu conteúdo. Também pode indicar a manutenção do servidor, onde as páginas são redirecionadas enquanto as atualizações estão sendo realizadas ou quando as páginas de destino precisam fornecer URLs alternativos para fins de rastreamento, como teste A/B ou divisão testes.

Os códigos de status acima são específicos para a validade do próprio URL, e você provavelmente nem saberá que eles existem enquanto visualiza casualmente um site funcional.

No entanto, quando surgirem problemas com o URL, o site ou a hospedagem subjacente, você verá um de um conjunto diferente de códigos:

  • 403 - Proibido: Isso indica que você não está autorizado a visualizar a página da web. Isso pode ocorrer devido a permissões incorretas ou falta de credenciais de autenticação.
  • 404 não encontrado: Isso indica que o recurso solicitado não existe no servidor e deve ser removido de todos os favoritos ou páginas de resultados do mecanismo de pesquisa (SERPs).
  • 500+ - Erros do servidor: Isso indica que ocorreu um erro ao processar sua solicitação e geralmente é causado por um problema com a configuração do servidor, como erros de codificação em scripts, problemas de banco de dados etc.

Os erros do site podem ser irritantes, mas não são o fim do mundo. Primeiro, tente uma atualização forçada da página da web. Em seguida, verifique se há erros cometidos pelo homem na barra de endereço. Você adicionou uma letra? A marca soletra uma das palavras de maneira não convencional? Seu gato atravessou o teclado? Se nenhuma das opções acima funcionar e o site for seu, entre em contato com seu host. Infelizmente, se o site pertencer a outra pessoa, você terá que esperar.

Compreendendo URLs de protocolos a caminhos

Uma URL é composta de muitos componentes, cada um com uma finalidade. Ao entender a anatomia de uma URL, você pode navegar em sites com mais facilidade e aproveitar ao máximo os recursos disponíveis. Seja procurando informações ou fazendo compras on-line, entender os URLs pode ajudá-lo a aproveitar ao máximo a web.