Mariano Rico, investigador del Grupo de Ingeniería Ontológica (OEG) de la Escuela Técnica Superior de Ingenieros Informáticos (ETSIINF), ha sido galardonado con el III premio en el concurso Aporta, gracias a un “buscador basado en lenguaje natural guiado que busca facilitar el descubrimiento de los datos ofrecidos por las administraciones públicas y su reutilización”.
Celebrado bajo el título “El valor del dato para la Administración”, el Desafío Aporta forma parte de la iniciativa Aporta, puesta en marcha con la idea de promocionar la apertura de información en España e impulsada desde el Ministerio de Energía, Turismo y Agenda Digital, a través de la Entidad Pública Empresarial Red.es, en colaboración con el Ministerio de Hacienda y Función Pública.
En esta entrevista, Mariano Rico nos explica en qué consiste qMe-Aporta, la idea presentada a concurso, y cuáles han sido los elementos que han llevado al jurado a la concesión del premio.
Pregunta.- El proyecto qMe-Aporta ha sido galardonado con el III premio en el Desafío Aporta. ¿Nos puede explicar en qué consiste?
Respuesta: qMe es el nombre de un proyecto de start-up que presenté al programa de emprendimiento ActúaUPM 2017. La “q” es de query, el término inglés para “preguntar”, de forma que el acrónimo qMe podría traducirse como “pregúntame”. Una feliz coincidencia hizo que encajase qMe con Aporta para obtener algo que tiene mucho sentido en el contexto del concurso: “qué nos aportan los datos abiertos”.
P.- El sistema ha sido reconocido en un concurso que pretende dar impulso a tecnologías que mejoren la eficiencia de la Administración Pública. En este sentido, ¿cuál es la utilidad del sistema?
R.- Durante los tres años (2013-2016) en los que estuve contratado en la UPM como investigador Juan de Cierva, desarrolle la tecnología Dylan-Q , el producto estrella de qMe. En la propuesta qMe-Aporta se aplica esta tecnología al catálogo de datos que ofrece datos.gob.es. En esencia, qMe-Aporta permite que cualquier persona, sin necesidad de conocimientos técnicos, pueda buscar los conjuntos de datos más adecuados a sus necesidades. El catálogo de datos de datos.gob.es tiene algo más de 16.000 conjuntos de datos, en 61 formatos distintos, por lo que encontrar el conjunto más adecuado no es en absoluto evidente. Nuestra tecnología permite que, en lugar de la tradicional búsqueda por “palabra clave”, el usuario haga la pregunta de forma guiada. Esto es, el sistema propone inicios de preguntas (“¿dónde”, “¿cuándo”, “dime”, etc.) y, una vez que el usuario ha seleccionado el comienzo de la pregunta, le propone continuaciones. Este proceso es iterativo, hasta que el usuario da por finalizada la pregunta.
P.- Vemos la utilidad como usuario. En el caso de que una empresa se interese por el sistema, ¿qué ventajas obtendría?
R.- Hemos identificado varios entornos en los que este sistema es especialmente interesante:
- Call centers, en los que operadores humanos atienden las preguntas de los clientes de la empresa: sabemos que la formación de estos operadores es costosa y que tienen mucha rotación, por lo que son un coste importante para las empresas. Nuestro sistema integra la información y permite resolver las preguntas de una manera intuitiva y fiable. Si los operadores del call center usasen nuestra tecnología serían mucho más eficientes, y los tiempos de atención al cliente se reducirían notablemente.
- Autoconsumo, ese término inglés para el “yo me lo guiso, yo me lo como”: diversos estudios constatan que muchos clientes sienten lo que se denomina “fricción” cuando hablan con operadores de call center, y prefieren resolverse las dudas yendo al sitio web de la empresa y explorando sus páginas web. Nuestro sistema permitiría que el cliente encontrase la respuesta a sus preguntas de una forma intuitiva y rápida.
- Inteligencia de negocio o sistemas para directivos con los que se puede pedir la creación de un informe con determinadas características: actualmente estos sistemas son, en su mayoría, una caja vacía de texto en la que el directivo teclea sin ningún tipo de guiado. Cuando ha terminado la pregunta, el sistema analiza la pregunta, y genera el informe. En muchas ocasiones el sistema no es capaz de entender la pregunta en su totalidad, ofreciendo resultados parciales o incompletos.
En fin, podría continuar la lista, porque gran parte de nuestra actividad profesional requiere buscar información, integrarla, y visualizarla, de la manera más eficiente, precisa y rápida.
P.- ¿Qué tipo de empresa sería el “target” ideal?, ¿ya se ha mostrado interés desde algún sector?
R.- Esta tecnología ha sido premiada en las convocatorias “Innovatech Tecnology Transfer” y ActúaUPM, ambas organizadas por el Centro de Apoyo a la Investigación Tecnológica (CAIT) de la UPM. Como resultado de la visibilidad que nos ha dado el CAIT, varias empresas han mostrado su interés por esta tecnología, de ámbitos tan distintos como eléctricas, turismo, bibliotecas, editores, por mencionar algunas.
Nuestro tipo de empresa-cliente ideal sería las que manejan dominios del conocimiento muy concretos (por ejemplo, seguros, banca, administraciones públicas) y con información muy interrelacionada. Cuanto más grande sea el problema de acceso a la información, bien por los tipos de datos (documentos, bases de datos tradicionales o no-SQL), bien por su complejidad, más necesidad tendrían de nuestra solución.
P- El desarrollo del qMe-Aporta, o mejor dicho, el desarrollo de Dylan-Q, la tecnología que, según nos explica, sustenta el proyecto galardonado, ¿es un trabajo conjunto? ¿Es un esfuerzo individual?
R.- Lo he desarrollado en colaboración con mis colegas Philipp Cimiano y Christina Unger, de la Universidad de Bielefeld (Alemania), con los que trabajé durante mi contrato Juan de la Cierva. Fueron particularmente intensos los veranos, durante los que trabajé en sus instalaciones (se encuentran el CITEC, un centro de excelencia puntero en TIC). Quiero aprovechar para agradecer la financiación al Ministerio, por mi contrato y las estancias. Pero, sobre todo, le quiero agradecer a mi familia haber sacrificado sus vacaciones, y mucho tiempo de estar juntos, por apoyar mi sueño de “una bola de cristal” a la que preguntar, como lo definió hace mucho tiempo mi hija.
P.- Entre las actividades e investigaciones que desarrolla en el OEG destaca su labor como creador y responsable de la DBpedia del español. Gracias a ello, este verano participará en el Google Summer of Code como mentor de uno de los proyectos aprobados. ¿Cuál será su papel?, ¿En qué consiste esta mentoría?
R.- En la presente edición de este programa, que comenzó su andadura en 2005, DBpedia ha conseguido la financiación de 10 proyectos por parte de Google. Entre ellos figura mi propuesta, “nuestra” propuesta; fruto de un paper que se publicará a lo largo del presente mes de marzo en el track de Cognitive Computing del Congreso SAC 2018.
El proyecto que nos concierne continuará con el desarrollo –descrito en el paper- de la labor de descripción de un método para predecir mapeos erróneos. Los mapeos son el proceso, realizado por humanos, en el que se dota de semántica a la información de Wikipedia. Son fundamentales en el proceso de generación de datos semánticos de DBpedia, por lo que detectar errores en los citados mapeos ha sido una tarea crítica en DBpedia. El proyecto se describe aquí.
Seremos tres mentores, de ahí “nuestra” propuesta: Nandana Mihindukulasooriya, Dimitris Kontokostas y yo mismo. Los tres somos coautores del citado paper. Nos encargaremos de mentorizar el proyecto propuesto y aprobado por Google, que permitirá a un estudiante trabajar durante tres meses en la labor de predicción de mapeos erróneos para una generación más limpia y veraz de contenidos.
El Google Summer of Code es un programa de Google que busca introducir a los estudiantes en el desarrollo de software de código abierto. Para ello, financia un sistema de trabajo “mentorizado” durante los meses de verano, con la idea de acercar el mundo laboral al mundo estudiantil a través de proyectos con aplicación en la vida real.
P- ¿Ya se ha hecho la selección del alumno o de la alumna? ¿Se siguen admitiendo currículos?
R.- Desde el martes 13 de marzo se pueden inscribir quienes lo deseen (en su mayoría son estudiantes de máster o doctorado). Tienen dos semanas. Una vez cerrado el plazo de candidaturas, los mentores de cada proyecto elegimos a la persona que lo desarrollará durante los tres meses de duración del programa.
Está bien pagado (5000 USD), pero lo más importante es el prestigio de ser elegido y participar en un proyecto financiado por Google. Para inscribirse hay que acceder a la web del Google Summer of Code desde aquí.
P.- El desarrollo de Dylan-Q ha sido un trabajo conjunto, desarrollado durante diversas estancias en Alemania. Este verano, además, se dedicará a mentorizar uno de los programas del Google Summer of Code... todo este tiempo dedicado a investigar le puede tener alejado de los suyos, ¿Cómo combina un investigador su labor profesional con el tiempo dedicado la familia?
R.- Jaja, me alegra mucho esta pregunta, siempre he querido que me la hagan. Tengo a gala mi esfuerzo por conciliar mi vida laboral y familiar. Ya sabéis que esta profesión es muy exigente, y que la pasión con la que la vivimos nos obliga a pasar mucho tiempo fuera de casa, o, aun estando en casa, es muy frecuente “estar en las nubes”. Suelo disfrutar de mi familia por la tarde, y me lo tomo como mi momento de relax y disfrute. Me gusta hacer la compra de fresco en el mercado de mi barrio, y hacer la cena. Por la noche, cuando todos se han ido a la cama, me refugio en mi escritorio algunas horas, para alargar la jornada. Una de las ventajas de cumplir años es que cada vez necesito dormir menos. Afortunadamente duermo poco pero del tirón. También disfruto llevando cada día a mis tres hijos al colegio y al instituto. A las 8:30 ya estoy en el laboratorio.
La información sobre la tecnología en la que se sustenta qMe-Aporta está disponible en el Catálogo de Tecnologías de la UPM.
El vídeo de la concesión del premio Aporta se puede visualizar desde esta dirección: https://www.youtube.com/watch?v=_THSO_8H7vs
Fuente: Página web de la UPM.
Created under Creative Commons License - 2015 OEG.