En el grupo OEG hemos diseñado un benchmark para evaluar la nueva funcionalidad para federar consultas SPARQL propuesta por el grupo del W3C, SPARQL-WG. Este benchmark utiliza consultas que son enviadas a varios SPARQL endpoints del proyecto Bio2RDF . Estas consultas han sido diseñadas en conjunto con expertos en biología del mismo proyecto, incrementando en complejidad una query básica, cubriendo así un mayor rango de consultas posibles.
Estas consultas primero acceden al SPARQL endpoint gene id, el cual contiene un conjunto de identificadores de genes. Estos identificadores los utilizamos en conjunto con los identificadores de los genes del repositorio Pubmed para obtener información acerca de unos descriptores. Estos descriptores pertenecen a la taxonomía MeSH, la cual es la taxonomía base del National Library of Medicine de los EEUU. Una vez tenemos esa taxonomía podemos completar la información he hemos recogido de esos 3 SPARQL endpoints y completarla con la información del endpoint HHPID el cual provee interacciones entre genes y el virus HIV.
Ficheros disponibles:
Semantics and optimization of the SPARQL 1.1 federation extension, Carlos Buil Aranda, Marcelo Arenas, Oscar Corcho. To appear in Extended Semantic Web Conference (ESWC2011), Semantic Data Management track, 2011.
Created under Creative Commons License - 2015 OEG.