Ir al contenido principal

Un algoritmo para gobernarlos a todos


Cuando José María Aznar llega a ser presidente del gobierno, Google acababa de nacer, pero aún ni se llamaba Google (por poner un antecedente que muchos tendremos en la cabeza seguramente por traumático). Durante un tiempo su partido aspiraba a aglutinar a toda la derecha, a ser el anillo de poder del liberalismo en España. El tiempo ha desgajado en varios partidos la derecha (porque la izquierda era difícil partirla en más facciones), pero los poderes de sus anillos siguen unidos de alguna forma. Y ahora vamos a relacionar Google con poder y el señor de los anillos. 

La referencia a Aznar la he usado porque debería hacernos pensar el poco tiempo que hace que existe este buscador y es bueno que sepamos que no es el único. Que hoy día se usan otros y que antes que Google, había más. 
Para que nos hagamos una idea, por aquí os dejo un listado de los buscadores que han existido y en verde los que siguen activos. 



La World Wide Web existía antes pero fue en 1989 cuando Tim Berners-Lee se dio cuenta de que los enlaces entre documentos podrían resultar útiles para distribuir y compartir información. Sin embargo hasta 1993, el contenido de la web se indexaba a mano. En Junio de ese año el investigador del MIT Matthew Gray escribió en lenguaje Perl el código Wanderer, el primer bot capaz de indexar de forma automática. Ese mismo verano el profesor Oscar Marius Nierstrasz escribió también en Perl un conjunto de script que copiaba periódicamente los índices de la web. Comenzaba así la automatización de la WWW. Poco después aparecen Lycos, Yahoo y el gigante Google. 

El factor diferenciador de Google, aunque no sólo, sería el algoritmo PageRank y es que realmente funciona muy bien. Hay pocos sitios del mundo donde google no se haya impuesto (Rusia, que usa Yandex, China que usa Baidu, Japón y Taiwan con Yahoo, surcoreanos con Naver y en República Checa Seznam). 

Los creadores de Google fueron Larry Page (Ingeniero informático por la U. de Michigan y Dr. en informática en Stanford) y Serguéi Brin (Graduado en informática y matemáticas por la U. de Maryland y Dr. en informática en Stanford). Se conocieron en Stanford. 

Las matemáticas han tenido mucho que decir en la creación de Google. Brin tenía una habilidad innata para las matemáticas y es hijo de dos matemáticos. Page, al poco de llegar a Stanford, asistió a una conferencia que le daría la idea de explorar las propiedades matemáticas de la WWW asemejando su estructura de hiperenlaces a un enorme grafo de relaciones binarias. 
No en vano el propio nombre de Google hace referencia a un juego de palabras “googol” que representa al 1 seguido de 100 ceros. 

Page se dió cuenta de que los hiperenlaces de las páginas de internet eran lo mismo que las citas de las publicaciones científicas, una forma de medir su relevancia. Así que escribió un rastreador al que llamó BackRub que le permitía explorar e indexar las páginas web de aquella estructura. Brin se unió en esta tarea, pero aún les faltaba algo más. Un algoritmo capaz de recoger los datos devueltos por su indexador para transformarlos en una medida de “impacto” o relevancia de la página. Y este sería el germen de PageRank. 

Básicamente se trata de localizar todos los enlaces que dirigen a una página, darles un valor proporcional a la importancia y ordenar las páginas en función de este valor. Si una página es referenciada muchas veces será porque tiene más importancia y/o valor y por tanto la pongo arriba del ranking intuyendo que será la que mejor se ajuste a una búsqueda determinada. 

BackRub y PageRank fueron puestos a prueba en 1996 en la red de Stanford y un años después se convirtió en una empresa al detectar la potencia comercial de la herramienta. 

Como la filosofía del algoritmo es fácil de intuir y actuar en consecuencia, muchas páginas no tardaron en hacer trampas para posicionarse mejor y los mejoradores de posicionamiento SEO no tardaron en llegar. En la actualidad Google cambia su algoritmo unas 500 veces al año y resulta difícil seguirles la pista. El peso que se da a cada hiperenlace va variando en función de varios criterios. Por destacar algunos que se han puesto en marcha: 

  • PANDA es una actualización lanzada en 2011 que penaliza el contenido de baja calidad por ser corto, contener información poco relevante o por estar mal redactado. 
  • PENGUIN se lanzó en 2012 e incluía una mejor detección de enlaces de poco valor, comprados, redes de artículos, directorios y básicamente cualquier dinámica de modificación de links de tu web. 
  • HUMMINGBIRD salió en 2013 y se centra en búsquedas semánticas y knowledge graph para buscar conexiones entre conceptos. 

Se trata en definitiva de que las páginas se posicionen por la calidad de su contenido y no por estrategias de conocimiento del algoritmo que falsean los datos pero no aportan nada. Pero no pensemos en Google como un gran benefactor. Es cierto que cuánto más útil nos sea el buscador, más lo vamos a usar, pero además el peso e importancia de un enlace se puede modificar también con la cantidad adecuada de dinero. 

Esto nos lleva a un problema. Si solamente usamos este buscador para encontrar información en la web nos estamos perdiendo toda la información en páginas mal posicionadas, las que no están posicionadas de ninguna forma en este buscador. En definitiva, estamos usando el anillo (buscador y algoritmo) único para buscar el resto de anillos de poner… pero igual nos estamos dejando muchos anillos preciosos por el camino que sin tener tanto poder pueden contener ideas e historias dignas de ser tenidas en cuenta.

Comentarios

  1. Fabuloso, Óscar. Hasta me ha temblado la barbilla con la frase final.

    Enhorabuena.

    ResponderEliminar

Publicar un comentario

Trazas de Comentarios

Entradas populares de este blog

Disección de cerebro

En la asignatura de introducción a la Neurociencia nos han invitado a hacer uno de estos dos ejercicios: Diseñar una camiseta de la asignatura Diseccionar un cerebro El primer ejercicio la verdad es que me mola mucho. Es un acto creativo de crear algo que nos identifique con la asignatura y estoy deseando ver los diseños de mis compañeros.  PEEERO, PERO, pero… el segundo ejercicio dice que nos pongamos manos a la masa (encefálica) y no quería dejar pasar esta oportunidad. Lo que nos pedía en realidad es lo siguiente:  Vamos a ponernos directamente con las manos en la masa. Tenéis que ir a vuestra carnicería de confianza y pedir un cerebro de cordero. Puede ser normal tener que encargarlo o rogar al carnicero que se lo más fresco posible. La consistencia del tejido nervioso es muy blanda y se maneja con dificultad. Para que se maneje mejor el consejo es cocerlo. Si alguno es un manitas del bricolaje le diría que pidiera una cabeza de cordero entera, la cociera e...

Inauguración de la XIX Edición del Carnaval de Química

Bienvenidos todos a la XIX Edición del Carnaval de Química. Y como toda buena inauguración, tenemos sonido de marcha triunfal (Con escuchar los 15 primeros segundos es suficiente sino queréis perder un oído) Sé que no suenan del todo bien... pero que queréis, tienen más de 3300 años de antigüedad y aún suenan Es un verdadero honor recoger el testigo de este Carnaval de Química en su decimonovena edición de las manos de  XdCiencia . Vilvoh me ha hecho el tremendo honor de hacerme partícipe de esta iniciativa que allá por Enero de 2011 albergara Daniel Torregrosa en su blog  Ese Punto Azul Pálido  como parte de todas las actividades que se desarrollaron para celebrar el año Internacional de la QUÍMICA. Por aquel entonces participaron hasta 20 entradas en lo que se puede considerar todo un logro (las expectativas era bajas... pero el resultado fue genial). Desde entonces el carnaval ha sido organizado por algunos de los mejores divulgadores de este país, ver...

Desgranando Ciencia. La responsabilidad de que algo salga bien

AVISO 1 - Esta entrada es larga de cojones... tómate tu tiempo y no te pongas a verla si solo tienes 3 minutos.  AVISO 2 - Es posible que me haya dejado en el tintero mencionar a mucha gente y desde ya pido perdón por ello. AVISO 3 - De los sí mencionados... es posible que de los 300 enlaces puestos me haya equivocado en no menos de 10. Por tanto avísadme si detectáis fallos para que los corrija rápido y no se de cuenta nadie mas porfa.  El año pasado resumía mi experiencia en Desgranando con esta entrada:    - Desgranando  Ciencia "My way"   (Que por cierto me acabo de dar cuenta que el vídeo no funciona y voy a cambiarlo jaja) Y terminaba mi texto recogiendo una crítica, la de Gerardo Sanz . Durante semanas le dí mil vueltas en la cabeza y otras tantas en el estómago. Recordé otras críticas y fui anotando los correos que me llegaban, leyendo las crónicas de otra gente que vino al evento, rememorando situaciones y visualizando las ch...