El pasado día 13 de marzo, una automatización interna de Google hizo que se publicaran accidentalmente en GitHub, documentos antiguos sobre la API del Content Warehouse de Google. Esta API, diseñada para un uso interno, proporciona información sobre el funcionamiento interno del buscador. El error se corrigió el 7 de mayo pero, para entonces, la información ya había sido detectada por expertos en SEO como Erfan Azimi, Rand Fishkin y Michael King, y se había difundido por la red.
Antes de continuar, aclarar que dichos documentos son parciales e incompletos, además de que pueden estar anticuados, reflejando una visión parcial y sesgada de cómo funciona actualmente el algoritmo del buscador, aunque su análisis puede ser de cierta utilidad para entender cómo trabaja Google a nivel interno y, por lo tanto, cruzado con otros datos, proporcionar información y conclusiones de interés para mejorar el posicionamiento de páginas y sitios web.
En estos documentos no se encuentra ningún código fuente, aunque contienen detalles del API interno y revelan más de 14.000 atributos utilizados por Google, aunque no se especifica su peso en el algoritmo de clasificación.
Esta información que revela la filtración, contrasta con las declaraciones públicas realizadas desde Google sobre sus criterios de clasificación, cuestionando la veracidad de afirmaciones previas sobre señales de usuario y otros factores de relevancia. Rand Fishkin y Michael King destacaron estas contradicciones entre los documentos, y las declaraciones públicas de Google.
Un ejemplo es la importancia de las métricas de clics y la consideración de la autoridad de un sitio, factores que Google ha negado utilizar, pero que los documentos sugieren que sí son evaluados.
Además, los documentos mencionan el uso de datos de Chrome para evaluar la calidad de los sitios, la frescura del contenido, la autoría, y otros factores detallados como el tamaño de la fuente de los términos en el cuerpo del documento.
Este incidente subraya la complejidad y opacidad de los algoritmos de Google, y genera preguntas sobre la transparencia y consistencia en las prácticas de clasificación de los resultados de búsqueda.
Desde Google, y en declaraciones a The Register, se ha llamado a la calma entre la comunidad dedicada al SEO, y a tener en cuenta que a la información filtrada le falta contexto, que puede ser vital para entenderla, aunque dichas palabras parecen ser más un subterfugio para cubrirse de las consecuencias de la filtración, que un argumento real.