Ir al contenido principal

Un algoritmo para gobernarlos a todos


Cuando José María Aznar llega a ser presidente del gobierno, Google acababa de nacer, pero aún ni se llamaba Google (por poner un antecedente que muchos tendremos en la cabeza seguramente por traumático). Durante un tiempo su partido aspiraba a aglutinar a toda la derecha, a ser el anillo de poder del liberalismo en España. El tiempo ha desgajado en varios partidos la derecha (porque la izquierda era difícil partirla en más facciones), pero los poderes de sus anillos siguen unidos de alguna forma. Y ahora vamos a relacionar Google con poder y el señor de los anillos. 

La referencia a Aznar la he usado porque debería hacernos pensar el poco tiempo que hace que existe este buscador y es bueno que sepamos que no es el único. Que hoy día se usan otros y que antes que Google, había más. 
Para que nos hagamos una idea, por aquí os dejo un listado de los buscadores que han existido y en verde los que siguen activos. 



La World Wide Web existía antes pero fue en 1989 cuando Tim Berners-Lee se dio cuenta de que los enlaces entre documentos podrían resultar útiles para distribuir y compartir información. Sin embargo hasta 1993, el contenido de la web se indexaba a mano. En Junio de ese año el investigador del MIT Matthew Gray escribió en lenguaje Perl el código Wanderer, el primer bot capaz de indexar de forma automática. Ese mismo verano el profesor Oscar Marius Nierstrasz escribió también en Perl un conjunto de script que copiaba periódicamente los índices de la web. Comenzaba así la automatización de la WWW. Poco después aparecen Lycos, Yahoo y el gigante Google. 

El factor diferenciador de Google, aunque no sólo, sería el algoritmo PageRank y es que realmente funciona muy bien. Hay pocos sitios del mundo donde google no se haya impuesto (Rusia, que usa Yandex, China que usa Baidu, Japón y Taiwan con Yahoo, surcoreanos con Naver y en República Checa Seznam). 

Los creadores de Google fueron Larry Page (Ingeniero informático por la U. de Michigan y Dr. en informática en Stanford) y Serguéi Brin (Graduado en informática y matemáticas por la U. de Maryland y Dr. en informática en Stanford). Se conocieron en Stanford. 

Las matemáticas han tenido mucho que decir en la creación de Google. Brin tenía una habilidad innata para las matemáticas y es hijo de dos matemáticos. Page, al poco de llegar a Stanford, asistió a una conferencia que le daría la idea de explorar las propiedades matemáticas de la WWW asemejando su estructura de hiperenlaces a un enorme grafo de relaciones binarias. 
No en vano el propio nombre de Google hace referencia a un juego de palabras “googol” que representa al 1 seguido de 100 ceros. 

Page se dió cuenta de que los hiperenlaces de las páginas de internet eran lo mismo que las citas de las publicaciones científicas, una forma de medir su relevancia. Así que escribió un rastreador al que llamó BackRub que le permitía explorar e indexar las páginas web de aquella estructura. Brin se unió en esta tarea, pero aún les faltaba algo más. Un algoritmo capaz de recoger los datos devueltos por su indexador para transformarlos en una medida de “impacto” o relevancia de la página. Y este sería el germen de PageRank. 

Básicamente se trata de localizar todos los enlaces que dirigen a una página, darles un valor proporcional a la importancia y ordenar las páginas en función de este valor. Si una página es referenciada muchas veces será porque tiene más importancia y/o valor y por tanto la pongo arriba del ranking intuyendo que será la que mejor se ajuste a una búsqueda determinada. 

BackRub y PageRank fueron puestos a prueba en 1996 en la red de Stanford y un años después se convirtió en una empresa al detectar la potencia comercial de la herramienta. 

Como la filosofía del algoritmo es fácil de intuir y actuar en consecuencia, muchas páginas no tardaron en hacer trampas para posicionarse mejor y los mejoradores de posicionamiento SEO no tardaron en llegar. En la actualidad Google cambia su algoritmo unas 500 veces al año y resulta difícil seguirles la pista. El peso que se da a cada hiperenlace va variando en función de varios criterios. Por destacar algunos que se han puesto en marcha: 

  • PANDA es una actualización lanzada en 2011 que penaliza el contenido de baja calidad por ser corto, contener información poco relevante o por estar mal redactado. 
  • PENGUIN se lanzó en 2012 e incluía una mejor detección de enlaces de poco valor, comprados, redes de artículos, directorios y básicamente cualquier dinámica de modificación de links de tu web. 
  • HUMMINGBIRD salió en 2013 y se centra en búsquedas semánticas y knowledge graph para buscar conexiones entre conceptos. 

Se trata en definitiva de que las páginas se posicionen por la calidad de su contenido y no por estrategias de conocimiento del algoritmo que falsean los datos pero no aportan nada. Pero no pensemos en Google como un gran benefactor. Es cierto que cuánto más útil nos sea el buscador, más lo vamos a usar, pero además el peso e importancia de un enlace se puede modificar también con la cantidad adecuada de dinero. 

Esto nos lleva a un problema. Si solamente usamos este buscador para encontrar información en la web nos estamos perdiendo toda la información en páginas mal posicionadas, las que no están posicionadas de ninguna forma en este buscador. En definitiva, estamos usando el anillo (buscador y algoritmo) único para buscar el resto de anillos de poner… pero igual nos estamos dejando muchos anillos preciosos por el camino que sin tener tanto poder pueden contener ideas e historias dignas de ser tenidas en cuenta.

Comentarios

  1. Fabuloso, Óscar. Hasta me ha temblado la barbilla con la frase final.

    Enhorabuena.

    ResponderEliminar

Publicar un comentario

Trazas de Comentarios

Entradas populares de este blog

Jerga de Laboratorio

La gente que trabaja en el laboratorio somos especialmente dados a abusar de la jerga de nuestra profesión (y no me refiero a un trozo de tela gruesa y tosca). El tipo de lenguaje que en el laboratorio nos puede llegar a ser familiar pero que saca de sus casillas al resto del mundo porque en ocasiones más que jerga se convierte en jerigonza. Así por ejemplo si decimos que estamos haciendo un pase para mañana hacer la corrida… no hablamos de toros. Y si dejamos algo a RT durante O/N… ahí ya te pierdes del todo. Bueno pues me he propuesto sacar una nueva sección que se va a llamar Jerga de Laboratorio. Intentaré que cada semana o dos semana (depende de lo ocupado que esté) salga una entrada explicando algunos de los conceptos y palabrotas que usamos por el mundo de las poyatas (anda, otra palabreja), Comencemos precisamente por ahí. Poyata El  @DrLitos  ya nos habló en su momento del arte de poyata en sus ediciones I y II ( Arte de poyata I ,  Arte de ...

Algo más de un año de divulgación

Como bien indica el título, hoy se cumple un añito desde que hice la primera entrada de esta humilde casa de la divulgación. (Y lo primero, obviamente, es que os fijéis en la nueva imagen del blog. No es gran cosa, pero a mi me mola, Y como es mio... pues eso). Las explicaciones en la página de  Acerca del blog @scariosHR Pero no era la primera vez que me dedicaba a esto. Quien me conoce sabe que me motiva y gusta la divulgación desde hace mucho tiempo. Trabajé en el Parque de las Ciencias de Granada para la subcontrata que lleva los educadores de museo “Los amarillos” (Primero Sedicult y después Queronea) desde el 2009 hasta 2011 y ante de eso hice una beca de animador científico en el mismo sitio “Los verdes”. (El nombre es por el color del atuendo, no piensen mal). Mis amigos Kini y Helena bajo agua en la playa del Cañuelo En el  verano de 2011, mientras disfrutábamos de unos días de playa en la casa de nuestra amiga Helena, mi amigo Kini me enseñó u...

Disección de cerebro

En la asignatura de introducción a la Neurociencia nos han invitado a hacer uno de estos dos ejercicios: Diseñar una camiseta de la asignatura Diseccionar un cerebro El primer ejercicio la verdad es que me mola mucho. Es un acto creativo de crear algo que nos identifique con la asignatura y estoy deseando ver los diseños de mis compañeros.  PEEERO, PERO, pero… el segundo ejercicio dice que nos pongamos manos a la masa (encefálica) y no quería dejar pasar esta oportunidad. Lo que nos pedía en realidad es lo siguiente:  Vamos a ponernos directamente con las manos en la masa. Tenéis que ir a vuestra carnicería de confianza y pedir un cerebro de cordero. Puede ser normal tener que encargarlo o rogar al carnicero que se lo más fresco posible. La consistencia del tejido nervioso es muy blanda y se maneja con dificultad. Para que se maneje mejor el consejo es cocerlo. Si alguno es un manitas del bricolaje le diría que pidiera una cabeza de cordero entera, la cociera e...