Investigadores del Grupo de Ingeniería Ontológica de la Facultad de Informática de la Universidad Politécnica de Madrid (FIUPM) están trabajando con el Instituto Geográfico Nacional de España (IGN) y el Centro Nacional de Información Geográfica (CNIG) para relacionar las bases de datos de este Instituto con la red mundial de datos abiertos y conectados conocida como Linked Open Data.
Linked Open Data (LOD - Datos Abiertos Enlazados) es una red mundial de datos que acumula en la actualidad más de cuatro millones y medio de referencias organizadas por burbujas temáticas relacionadas entre sí a través de Internet. Esta red mundial de datos constituye uno de los pilares de la futura Web Semántica.
La inmensa mayoría de los datos contenidos en Linked Open Data están en inglés y hasta hoy existen muy pocos antecedentes de datos geográficos, por lo que el trabajo de los investigadores de la FIUPM es pionero en la introducción de datos geográficos y en español en Linked Open Data.
El Instituto Geográfico Nacional acumula en la actualidad datos espaciales de España que incluyen información geográfica de referencia (límites administrativos, poblaciones, hidrografía, construcciones, nombres geográficos, vías de comunicación, ocupación del suelo, etc.) La investigación del Grupo de Ingeniería Ontológica ha comenzado a transformar, en una primera fase, la información hidrográfica (ríos, lagunas, embalses, etc.) recogida en las bases de datos de éste Instituto y, de forma inmediata, continuará con información sobre municipios, provincias, carreteras, monumentos y cualquier otro tipo de información geoespacial de interés. La implantación de todos estos datos en la Linked Open Data estará finalizada a finales de 2010.
Tecnologías propias
El Grupo de Ingeniería Ontológica de la FIUPM ha realizado la vinculación de los datos del IGN utilizando tecnologías desarrolladas con anterioridad en este grupo de investigación en el marco del proyecto europeo NeOn. Las tecnologías utilizadas son conocidas como R2O & ODEMapster.
R2O & ODEMapster corforman un marco integrado para la expresión formal, la evaluación, verificación y explotación de correspondencias semánticas entre ontologías y bases de datos relacionales.
El marco integrado está compuesto por:
R2O, un lenguaje formal declarativo con expresividad suficiente como para representar situaciones de correspondencia complejas, debido al hecho de que se alinean dos modelos desarrollados y mantenidos de forma independiente y entre los que pueden darse disparidades de todo tipo.
ODEMapster, procesador que se encarga del proceso de upgrade o enriquecimiento semántico del contenido de la base de datos, mediante la extracción bajo demanda del contenido de la base de datos. Esta extracción se realiza en respuesta a preguntas planteadas en términos de la ontología mediante un proceso de re-escritura de consultas.
Conjuntos de datos (burbujas) de España
Con estas tecnologías, lo que hacen los investigadores del Grupo de Ingeniería Ontológica es generar nuevas burbujas con los datos del IGN para relacionarlas con las demás burbujas que integran ésta red mundial de datos. Una burbuja es un conjunto de datos de la misma temática publicado en la Red conforme a las características de LOD.
El trabajo de relacionar los datos del IGN con LOD se inserta en un futuro ecosistema de contenidos multimedia y servicios interactivos que reúna las tecnologías conocidas como Web 2.0 con los aspectos sociales, semánticos y los geográficos.
En este contexto, el IGN ha confiado al Grupo de Ingeniería Ontológica la labor de procesar sus datos para generar las burbujas en Linked Open Data, facilitando de tal forma que su acceso sea universal y prácticamente instantáneo a través de Internet para todas las personas interesadas. El trabajo del Grupo de Ingeniería Ontológica está recogido en un espacio específico llamado GeolinkedData.
Los Gobiernos del Reino Unido (ver video) y de Estados Unidos están realizando asimismo esfuerzos por poner sus datos públicos a disposición de todas las personas interesadas a través de Internet (data.gov, data.gov.uk), y en Europa ya hay una directiva de la Comisión para acercar los datos públicos a los ciudadanos.
El grupo de investigación de este proyecto está liderado por Asunción Gómez Pérez, directora del Departamento de Inteligencia Artificial de la FIUPM y directora asimismo del Grupo de Ingeniería Ontológica, y del que forman parte el profesor Oscar Corcho y el geógrafo Luis Manuel Vilches Blázquez.
Por parte del Instituto Geográfica Nacional participan Sebastián Mas Mayoral, Director del Centro Nacional de Información Geográfica, y Antonio Rodríguez Pascual, Jefe de Área de Infraestructura de Información Geográfica del CNIG.