Como o Google funciona

Não perca nenhuma novidade!

Explore as Categorias

Posts Relacionados

Milhares e milhares de bots, humanos e a mais simples e complexa estrutura de pesquisa

Você pega o seu celular, abre o Google e faz uma busca. Em questão de milésimos de segundos a resposta está na sua cara, na tela, com uma infinidade de possibilidades. Mas, como será que essas respostas chegam tão rápido? Como o Google funciona? 

Não tem bicho de 7 cabeças. É bem simples na verdade. E eu vou te explicar agorinha. 

Como funciona o Google? 

De acordo com o próprio Google, o mecanismo de pesquisa é automatizado e usa os famosos “bots”para explorar o mundo da web em busca das nossas pesquisas. Regularmente os bots saem atrás de novas páginas para que elas sejam indexadas. Basicamente é assim que o Google funciona. Mas, vamos entender mais a fundo.

Afinal, quanto mais conteúdo mais possibilidades de resposta para uma “query”. E quanto mais conteúdo relevante, mais o Google tem a certeza de que vai dominar o mundo. E alguém duvida? 

Aliás, à nível de curiosidade, o Google tem como um dos seus objetivos oferecer a resposta antes mesmo que a gente faça a busca. Pensou, achou. Belo slogan, né? 

Veja nesse vídeo como o Google funciona

Voltando… 

Mas, como o Google consegue fazer tudo isso?

Se os bots vão atrás de páginas para indexar, fique ciente que é apenas nesse momento que elas passam a existir à vida. Se não estiver indexado, não existe. 

Ainda de acordo com o buscador, não há garantia de que a página vai ser rastreada, indexada ou exibida, mesmo que ela siga os fundamentos da pesquisa. 

Pois bem, avisos dados, vamos aos fatos: existem 3 estágios da pesquisa do Google. São eles:

  • Rastreamento:  O Google faz o download de textos, imagens, vídeos, conteúdo… tudo o que for encontrado dentro de uma página. Ele realiza esse mapeamento com os rastreadores; 
  • Indexação: Depois que essa página foi rastreada é hora de indexar. Ou seja, o buscador vai registrar a página nos seus servidores. 
  • Classificação e Exibição

Rastreamento

O primeiro passo é encontrar quais são as páginas que existem dentro da internet. Megalomaníaco isso, né? 

Não existe um registro central delas e por isso o Google sempre está em busca de páginas novas e atualizadas. São elas que ele vai adicionando à sua lista de páginas já conhecidas. 

O Google chama esse processo de “descoberta da URL”. E aí, essa descoberta acontece de 2 maneiras: A primeira é quando ele já sabe que aquela página existe e atualiza. A segunda é quando ele segue um link de uma página já conhecida para uma página nova que ele nunca viu antes. 

Link Building? Simmmmm! Internos e externos. O Link building é a premissa primordial para que o Google consiga dar esse show de tecnologia. Ai que emoçaum… 

Vamos a um exemplo? Se você tem uma página principal, como uma página de categoria e ela tem link para novos posts do seu blog… o Google vai visitar aquela página nova. 

Aí, depois que o Google acha aquele URL ele verifica o conteúdo. Existe um conjunto de computadores prontos para rastrear bilhões de páginas.

O tal do Bot, mais conhecido como Google Bot. É esse carinha que faz a indexação da página (vamos ver ja sobre indexação). 

Para fazer esse rastreamento os bots usam os algoritmos e são eles que determinam quais sites rastrear, a frequência desse rastreamento, quantidade de páginas buscadas em um site… e por aí vai. 

Os bots do Google são automaticamente preparados para rastrear um site com cautela, parcimônia e sem alvoroço. E aí, ele vai se baseando nas respostas que o site dá. Por exemplo: se o site devolve um erro de HTTP 500, significa que tá lento… aí el Google se vai para outro site! Time is money, né? 

Por isso, o SEO é primordial para corrigir questões técnicas e que ajudam os bots a rastrear melhor o site.

Existem ainda aquelas páginas que são bloqueadas pelo próprio desenvolvedor por meio do arquivo Robots.txt. 

Durante este processo de rastreamento, o Google renderiza a página e executa qualquer JavaScript encontrado e para isso, usa uma versão recente do Chrome. Esse processo é igual ao nosso processo de busca e navegação mesmo. 

Se não houver essa renderização, não há como o Google ler o conteúdo, por exemplo. 

Agora, é preciso muito cuidado, pois é a partir desse processo de rastreamento que o Google vai entender o seu site e posicioná-lo na SERP (página do Google). Por isso, quaisquer erros técnicos ou de otimização técnica, podem colocar seu lindo site atrás da fila. 

Veja alguns problemas que impedem o rastreamento dos sites pelo Google:

  • Problemas com servidores
  • Problemas na rede
  • Regras do Robots.txt que impedem o acesso dos bots à página 

Indexação

Depois que o Google termina o trabalho dele de rastrear a página é a hora de identificar esse conteúdo. 

É o momento de indexação. Neste processo há a inclusão da análise de conteúdo textual e das principais tags e atributos do conteúdo.

Principalmente os elementos <title> e os alternativos como imagens, vídeos, elementos… 

É neste processo que o Google identifica se essa é uma página canônica (a principal), ou se ela é uma cópia de outra página na internet. 

No momento em que ele sabe qual a canônica (página principal), organiza as páginas em um processo que se chama “clustering”. É quando ele divide a página em grupos… editorias, podemos dizer. 

Uma vez que ele sabe qual a página principal, sobre o que ela fala, qual sua editoria (cluster) e para que ela serve, ele registra essa página em seu banco de dados.

É neste exato momento que ela passa a existir para o mundo. Antes, era só um sonho.

 Com a indexação, vira uma realidade que pode ser acessada por todo mundo que procurar por uma palavra-chave para qual ela esteja otimizada. 

Mas, atenção a alguns problemas que podem dificultar a indexação:

  • Baixa qualidade do conteúdo na página
  • Regras do Robots (meta) que bloqueiam a indexação
  • O design do site pode dificultar a indexação

Classificação e exibição de resultados

Agora que ela está indexada, ela é classificada de acordo com as exigências do Google para uma página de qualidade.

Quanto mais atender a estas exigências, melhor posicionada ela fica para uma determinada busca. 

A relevância dessa página é determinada por centenas de milhares de fatores. Os famosos e temidos algoritmos.

Os algoritmos, são, na verdade, atualizações destas exigências que acontecem de acordo com o comportamento do usuário e a mudança dele. 

E tudo, tem a ver com o motivo da busca também. O que chamamos de intenção de busca. 

Veja, se eu procuro por “chaveiro” eu posso estar em busca de um chaveiro que conserta chaves ou um chaveiro para colocar na chave do meu carro.

Se eu procuro por “chaveiro 24 horas” ao invés de me oferecer imagens lindas para eu comprar de chaveiros cringe, o Google vai me dar uma resposta geolocalizada de acordo com minha localização porque ele sabe que eu estou em apuros, e provavelmente de noite. 

Agora, se eu procuro por “chaveiro 24 horas no Butantã” Ele sabe que eu tô na rua, de madrugada e desesperada. Logo, vai me dar em questões de instantes uma página cheia de informações relevantes e pertinho de mim. 

Ah, mas agora que você aprendeu tudo isso, onde ver se sua página está indexada? O google Search Console é a ferramenta ideal para isso. E por lá, você pode ver os erros de indexação e como resolver, se existir. 

E como ajudar o Google a fazer essa mágica? Basta aplicar o SEO e deixar que o buscador dê um show de alquimia tecnológica!

Post Tags :

Share :

2 respostas

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *