La Fundación Wikimedia, la organización sin fines de lucro detrás de Wikipedia, en la actualidad está pensando cómo hacer que su web sea una pieza clave de la Web 3.0, conocida como la web semántica.

En la conferencia “2010 Semantic Technology” llevada a cabo en San Francisco, el director en funciones de la fundación, Erik Möller, y su colega Trevor Parscal, desarrollador de experiencias de usuario en Wikimedia, mostraron algunos primeros pasos llevados a cabo por la fundación para estudiar la forma en que podría añadirse una mayor estructura semántica a Wikipedia. También se dirigieron a la comunidad de la web semántica, para desarrollar formas de hacer que el conocimiento de Wikipedia sea más accesible a los ordenadores y el software.

Esto significa hacer que algunos de los datos de los 15 millones de artículos de Wikipedia sean comprensibles para los ordenadores, así como para los seres humanos.

Algo así permitiría que los programas supieran, por ejemplo, que los números mostrados en una de las columnas de esta tabla de presidentes de los Estados Unidos. son fechas. Esto podría, a su vez, crear aplicaciones que tomasen datos de Wikipedia para generar automáticamente líneas históricas, o para responder a preguntas sobre conocimientos generales que, normalmente, implicarían que el usuario tuviese que encontrar y leer datos relevantes en internet.

"La información semántica ya existe en Wikipedia, y hay gente que ya está trabajando sobre esa base," afirma Möller. "Desafortunadamente, no estamos siendo realmente de ayuda, y estas personas tienen que recurrir a extensos procesos para llevar a cabo esta tarea".

Un ejemplo es DBpedia, una base de datos semántica construida utilizando un software de recopilación de datos de páginas de Wikipedia, y administrada por la Universidad Libre de Berlín y la Universidad de Leipzig, ambas en Alemania. Otro ejemplo es Freebase, una base de datos con fines de lucro, cuyos conocimientos provienen en gran medida de Wikipedia. Freebase es la fuente de datos utilizada por el motor de búsqueda de preguntas-respuestas PowerSet, que fue adquirido por Microsoft para que fuera parte de su motor de búsqueda Bing.

Los primeros objetivos de Möller y Parscal son las "infoboxes" (cajas de información) que aparecen como resúmenes en muchas páginas de Wikipedia, así como las tablas de los grupos de datos, como esta que muestra el producto nacional bruto de todos los países del mundo.

"Sólo el hecho de poder reutilizar los datos de Wikipedia sería algo muy importante", señala Yaron Koren, director de una consultora especializada en Semantic MediaWiki, una extensión del software MediaWiki utilizada para construir Wikipedia. "El trabajo manual empleado en el mantenimiento de muchas tablas y listas hoy día podría ser eliminado", añade. En cambio, las listas podrían ser generadas automáticamente desde las infoboxes de otras páginas. También sería posible generar mapas, utilizando las coordenadas de localización encontradas en algunas páginas, o generar automáticamente líneas de tiempo para resumir períodos de la historia cubiertos por muchas otras páginas, afirma Möller.

Fuente: Technology Review – MIT