Datos Vinculados para Archivos, Bibliotecas y Museos

[Como limpiar, vincular y publicar tus metadatos]

Prólogo

Nunca antes tanto de nuestro patrimonio cultural global ha estado a nuestro alcance.

Sin embargo, dado que hasta ahora se han gastado miles de millones en digitalización, tanto pública como privada, todavía se siente como si estuviéramos en las primeras etapas de lo que podría ser posible.

A pesar de las interfaces realmente utilizables e intuitivas, todavía queda mucho por hacer en términos de herramientas simples de búsqueda y descubrimiento en múltiples colecciones.

Dos de los conjuntos de datos que figuran como estudios de caso en este libro son de instituciones en las que he dirigido los equipos responsables de su publicación pública. Uno, el Powerhouse Museum, era una institución estatal grande y comparativamente bien dotada, con una larga historia de rigor, excelencia y documentación basada en computadora entre sus departamentos de catalogación y registro; y el otro, Cooper-Hewitt, una pequeña casa museo histórica, cuya colección aún está mejor documentada en tarjetas que datan de mediados del siglo XX.

Incluso cuando estas dos instituciones tenían versiones del mismo objeto, como la silla de oficina seminal Aeron, los dos registros documentales correspondientes no podrían haber sido más diferentes en detalle y perspectiva. Pero al final del día, el futuro de estas dos instituciones radica en lo que pueden hacer con esos registros y lo que se puede construir sobre ellos ahora y dentro de cien años. Al hacer que estos conjuntos de datos estén disponibles públicamente, descargables y accesibles a través de API simples y bien diseñadas, tanto Powerhouse como Cooper-Hewitt tuvieron que aceptar la aceptación de lo incompleto de sus esfuerzos de digitalización y catalogación.

Anteriormente lo describí como "wabi sabi institucional", haciendo referencia a la estética japonesa de la imperfección como belleza y aplicándola a la estrategia y la práctica organizacionales.

Este libro es una guía muy necesaria sobre el 'cómo' obtener más de esas colecciones que forman la columna vertebral de bibliotecas, archivos y museos, incluso si las galerías ahora se están llenando de 'experiencias' de gran éxito, y las salas se reemplazan con terminales de Internet y cómodos salones.
De hecho, a medida que nuestras instituciones del conocimiento se convierten cada vez más en lugares de interacciones y experiencias sociales memorables, la importancia de que las colecciones tengan una mayor exposición, acceso y vida a quienes se encuentran fuera del "edificio" es cada vez más crítica.

Es importante destacar que este libro presenta los medios para ver la totalidad del proceso de hacer que sus colecciones estén disponibles, desde los arduos procesos de limpieza y conexión hasta su publicación para el mundo.
En el camino, hay desviaciones hacia vocabularios controlados, crowdsourcing, API, perfiles de datos y código.

A menudo, dentro de las instituciones, estas tareas, y los discursos asociados, todavía son llevados a cabo por individuos ubicados en diferentes ramas del árbol organizacional y, a veces, incluso en diferentes edificios.

Esta separación física y psicológica a menudo ha contribuido a una inercia institucional en torno a la disponibilidad de colecciones, y espero que los lectores comprendan mejor la complejidad en cada etapa del proceso y comiencen a colaborar mejor.
Junto con una variedad de estudios de casos útiles y ejemplos de código, tanto el humanista digital en ciernes como el registrador y catalogador de larga data deberían poder comenzar rápidamente a hurgar y experimentar con sus propios conjuntos de datos.

Si mis equipos hubieran tenido acceso a este libro cuando comenzamos a hacer que los datos de las colecciones estuvieran ampliamente disponibles en 2006, podríamos haber hecho las cosas de manera un poco diferente y mejor.

Sebastian Chan
Director de Medios Digitales y Emergentes
Smithsonian Cooper-Hewitt, Museo Nacional de Diseño, Nueva York

Índice

Introducción
Modelado
1. Introducción
2. Datos tabulares
3. Modelo relacional
4. Lenguajes de meta-marcado
5. Datos vinculados
6. Conclusión
7. Notas
8. Referencias
Limpieza
1. Introducción
2. Un nuevo campo de calidad de datos
3. Perfiles de datos
4. Conclusión
5. Caso de estudio: Base de datos de manustritos de Shoenberg
6. Notas
7. Bibliografía
Reconciliando
1. Introducción
2. Vocabularios controlados
3. Semántica y máquinas
4. Traeyendo vocabularios controlados de la web
5. Habilitando interconexiones
6. Conclusión
7. Caso de estudio: Powerhouse Museum
8. Notas
9. Referencias
Enriqueciendo
1. Introducción
2. El potencial del crowdsourcing
3. La escala de abrazo
4. Misión de oro para la semántica
5. Manejando URLs ambiguas
6. Conclusión
7. Caso de estudio: The British Library
8. Notas
9. Referencias
Publicación
1. Introducción
2. Identificar contenidos con URLs
3. Marcando el contenido
4. Una web para humanos y máquinas
5. Conclusión
6. Caso de estudio: Cooper-Hewitt National Design Museum
7. Notas
8. Referencias
Conclusiones
1. Estadísticas, probabilidad y humanidades
2. Fuerzas del mercado
3. Uso de URLs
4. Comprometerse
5. Notas
6. Referencias
Index

Esta edición 'refurbished' (en español), toma como guía el libro Linked Data for Libraries, Archives and Museums de Seth van Hooland y Ruben Verborgh, publicado por Facet Publishing