
Un paso adelante que, sin prisa pero sin pausa, está tomando la información digital en línea (léase Internet) es la de enlazar datos por medio de herramientas automáticas. El objetivo es generar, sin la intervención de los usuarios, un espacio global de información en el que sistemas y agentes software puedan explotar estos datos (recopilándolos, agregándolos, interpretándolos, publicándolos, etc.) utilizando vocabularios consensuados y ontologías.
Pensemos un poco: tú y yo navegamos la web por documentos. Encontramos una web en HTML, de la que obtenemos unos datos, que nos llevan a un informe disponible en formato PDF, que a su vez nos lleva a un libro, del que sacamos el nombre de una persona con la que hablamos. ¿Quién elige los datos que van enlazando una fuente de información con otra: tú.
Ahora pasémosla a algo mucho más cotidiano: sale una nueva red social, te das de alta, y tienes que volver a introducir tus datos personales, y eso que son los mismos que ya has metido en otras redes sociales. Y ni hablar de las webs de trabajo: introducir tu currículum una vez y otra, y otra más, es absurdo.
Y si eso es absurdo en el caso sencillo de unos datos personales, imagínate en el caso de datos científicos. Y al revés, imaginemos el potencial de una Web de Datos Enlazados, es decir, una web con datos estandarizados hasta tal punto que muchas aplicaciones, funcionando a la vez y en red, pudieran usarlos, intercambiarlos, transformarlos y divulgarlos. Entonces nos damos cuenta de que está empezando a venir una nueva era: la era del Linked Data, término fue propuesto por Tim Berners-Lee, creador de la World Wide Web. El valor y la utilidad de los datos enlazados es mayor tanto en cuanto éstos estén más interconectados con otros datos en la Web de Datos.
Por dar solamente unas pinceladas técnicas, enlazar datos estructurados en la Web es posible gracias al RDF, un lenguaje para representar información sobre recursos propuesto por el Consorcio de la World Wide Web en el área de la Web Semántica. Los datos en la Web de Datos se describen mediante el uso de términos que aparecen en vocabularios consensuados u ontologías. Ejemplos de vocabularios son DC para describir propiedades genéricas de recursos, FOAF para describir personas, SIOC para describir comunidades on-line o, VoID para describir conjuntos de datos enlazados, entre otros. En este artículo de Asunción Gómez Pérez tienes estos puntos mucho más desarrollados.
La cantidad de datos enlazados publicados en la Web de Datos ha experimentado un enorme crecimiento en los últimos años, y no cabe duda de que la generación y utilización de tal cantidad de datos enlazados procedentes de fuentes heterogéneas creará nuevas oportunidades de investigación y de negocio. El mayor auge hasta ahora se ha producido en el contexto de la publicación de datos del sector público. Sin embargo, el fenómeno de Linked Data se está extendiendo a otros sectores, entre los que destacan los medios de comunicación, infraestructuras y logística, el ámbito universitario y científico y el de los datos geográficos.
Mi recomendación es que le echéis un vistazo a la ya larga lista de “data sets” que hay disponible en formato abierto, y que os animéis a utilizar las diversas aplicaciones o buscadores semánticos que sacan partido de esas colecciones de datos, desgraciadamente, la mayoría de ellos en inglés aunque en la web de AELID, la Asociación Española de Linked Data, tenéis también alguna colección interesante de datos públicos y privados.
En definitiva, un cambio de paradigma que hay que seguir, y que demuestra la tremenda riqueza del mundo de la exploración de información. Por si queréis más, os dejo este vídeo de Tim Berners Lee donde él mismo nos lo cuenta.









Información Bitacoras.com…
Valora en Bitacoras.com: Un paso adelante que, sin prisa pero sin pausa, está tomando la información digital en línea (léase Internet) es la de enlazar datos por medio de herramientas automáticas. El objetivo es generar, sin la intervención de …..