¿Qué son los metadatos? Definición, tipos y ejemplos

que son los metadatos

Acompañan a todos los archivos y documentos que circulan en la red de redes, están presentes en cada sitio web que visitamos y, de alguna forma, pueden revelar información valiosa para algunos y peligrosa para otros. Los metadatos están presentes en todo el universo digital. Sin embargo, como no son visibles a primera vista, hasta los ciudadanos más geek suelen ignorar su existencia.

Sabemos que existen y que están por todas partes, pero ¿sabemos realmente qué son los metadatos? En este artículo vamos a hacer un análisis para que por fin puedas entender de una forma sencilla qué son los metadatos, cuáles son los tipos de metadatos que existen, y algunos ejemplos de metadatos más comunes en nuestra vida diaria en Internet.

¿Qué son los metadatos?

Si buscamos la definición de metadatos en Internet encontraremos distintas opciones, ya que los metadatos no tienen una definición única. El significado de metadatos se entiende mejor cuando nos referimos a la propia etimología del término metadatos, que viene de dos palabras del griego y del latín.

El concepto de metadatos viene, por un lado, de la palabra del griego clásico “meta” (μετα), que significa ‘después de, más allá de, o sobre”​. Este prefijo se une al concepto latino “datum”, es decir, «dato». El significado de metadatos más básico según su etimología sería «sobre datos». Partiendo de esta base, la definición de metadatos más común y extendida es la siguiente: los metadatos son datos sobre datos.

Definición de metadatos según Jack Myers (acuñador del concepto)

Aunque el uso e interés por los metadatos ha crecido a medida que florece la revolución digital, el concepto de metadato ya existía antes de Internet. El término «metadatos» fue acuñado en 1969 por Jack E. Myers y registrado en 1986 por su empresa, The Metadata Company. La primera definición de metadatos que se le dio (muy cercana a la definición más extendida actualmente) fue la de dato sobre el dato, entendiendo que los metadatos proporcionan la información mínima necesaria para identificar un recurso.

Definición de metadatos técnica, según la NISO

Pero para conocer a fondo qué son los metadatos quizá necesitemos una definición más precisa desde un punto de vista técnico. Aquí encontramos la definición de metadatos de la National Information Standards Organization (NISO), que describe los metadatos como

«información estructurada que describe, explica, localiza o facilita de algún modo la recuperación, el uso o la gestión de la información».

«Understanding Metadata» – National Information Standards Organization (NISO)

Tipos de metadatos

Si atendemos al punto de vista técnico, la mejor forma de conocer qué tipos de metadatos existen es perderse en el amplio conocimiento que ofrece la NISO en este ámbito, concretamente en su publicación “Understanding metadata”, que recomendamos leer para un entendimiento profundo de nuestros amigos los metadatos.

De una forma resumida, según esta publicación encontramos que existen distintos tipos de metadatos según su función:

Metadatos descriptivos

Son los metadatos que nos sirven para encontrar o comprender un recurso. Algunos ejemplos de estos metadatos los encontramos en cualquier documento tipo word o pdf, como pueden ser el título del archivo, nombre del autor del archivo o fecha de publicación del mismo.

Metadatos administrativos

Tienen multitud de funciones y dentro de éstos podemos encontrar:

  • Metadatos técnicos, para descodificar y renderizar los archivos
  • Metadatos de preservación, sirven para la gestión a largo plazo de los archivos
  • Metadatos de derechos, para la gestión de los derechos de propiedad intelectual vinculados a los contenidos.

Metadatos estructurales

Son los que establecen relaciones de las partes de los recursos entre sí, utilizando lenguajes de marcado para integrar metadatos y otras características estructurales o características semánticas dentro de los contenidos.

Nuestros amigos los metadatos tienen un universo muy amplio, por eso la clasificación de los mismos puede dar lugar a infinitos tipos de metadatos. Para entender esto, vamos a ver qué son las meta tags o metaetiquetas.

Metadatos y meta tags

Los metadatos se organizan con etiquetas (meta tags). Una etiqueta o metaetiqueta da nombre a un metadato. Por ejemplo, la fecha de creación de un documento o la última modificación de éste. También encontramos etiquetas relativas a las coordenadas GPS donde se ha tomado una fotografía, incluso sobre la velocidad a la que se mueve un dispositivo cuando se graba un video.

Se pueden definir tantas meta etiquetas como sea necesario. Esto hace que el número de etiquetas diferentes sea “infinito”. En Suments Data, donde desarrollamos soluciones basadas en Big Data, Inteligencia Artificial y Machine Learning, llevamos identificados más de 250.000 meta tags distintos a través de nuestra tecnología Verics para el análisis de metadatos de un sitio web.

Ejemplos de metadatos

Los metadatos tienen ese rollo “oculto” y parece que circulan como una “masa oscura” en el universo de Internet. Sin embargo, realmente los metadatos están accesibles para cualquiera que esté dispuesto a encontrarlos. A continuación vamos a ver algunos ejemplos de metadatos que están presentes en nuestra vida diaria en Internet.

Metadatos de un documento pdf

Los documentos de tipo PDF creados con Acrobat 5.0 o cualquier versión posterior contienen metadatos de documento en formato XML (Extensible Markup Language). Los metadatos en documentos pdf incluyen información relevante sobre el archivo y el contenido del mismo. Algunos ejemplos de metadatos en archivos pdf pueden ser el nombre del autor, fechas de creación y modificación del documento, palabras clave o información sobre derechos o copyright.

Puedes ver los metadatos de un pdf en las Propiedades del documento (click derecho – propiedades) Los metadatos de este tipo de documentos también se pueden visualizar, ampliar o modificar usando productos externos a Adobe Acrobat.

Metadatos de una foto

El tema de metadatos fotos tiene mucha chicha. En el caso de las fotografías, los metadatos cobran gran importancia por el riesgo que suponen en materia de privacidad. A través de estándares como Exif (Exchangeable image file format), todas las fotografías que se realicen con un dispositivo digital tienen metadatos incrustados que pueden revelar mucha información, esto se aplica a cualquier archivo de imagen con el formato .jpg, .tiff, .raw, .png, etc. Algunos ejemplos de metadatos de las fotos son:

  • El nombre del propietario del dispositivo o cámara
  • Coordenadas GPS con la ubicación exacta de dónde se ha tomado la fotografía.
  • Fecha y hora en la que se tomó la fotografía.
  • Datos técnicos de la fotografía como el modelo de cámara o dispositivo con el que se ha realizado la fotografía, versión del firmware usada, uso del flash, distancia focal, apertura de diafragma, nivel ISO, balance de blancos o el tamaño de la imagen.
  • Tamaño de la fotografía.
  • Vista en miniatura (thumbnail) de la fotografía.

Metadatos de un vídeo

Los metadatos de un vídeo son muy similares a los de una fotografía o imagen. Además, incluyen otros relativos al formato vídeo, algunos ejemplos de metadatos de los vídeos pueden ser el formato en el que están grabados, duración del vídeo, tasa de bits o bitrate, que indica la cantidad de información (peso del archivo) por cada unidad de tiempo, la fecha de grabación y de edición, el software utilizado o el códec que se necesita para reproducirlo.

Metadatos de una página web

En Suments llevamos identificadas más de 250.000 meta tags distintas, por lo que la lista de ejemplos de metadatos en un sitio web podría ser interminable. Esto es porque los sitios web alojan una gran cantidad de imágenes, vídeos y documentos. Además, podemos sumarle los metadatos de archivos comunes de un sitio web de lenguajes de programación como HTML, CSS, JS, o PHP.

El análisis de metadatos de un sitio web es importante para asegurar que los metadatos no están generando filtraciones de datos personales o información comprometedora. La comunicación de datos personales supone una potencial “violación de acceso a datos” según el Reglamento General de Protección de Datos. Por otro lado, una fuga de información de datos internos a través de los metadatos supone un elevado riesgo para la seguridad de la organización, ya que esta información puede ser utilizada para ataques de phishing o social engineering (ingeniería social).

filtraciones datos personales junta de extremadura web

En Suments Data desarrollamos tecnologías que te ayudarán a realizar una gestión de metadatos de tu sitio web para garantizar una protección de datos en todos los niveles:

Verics: análisis de metadatos en un sitio web. Analiza los metadatos que se alojan en una página web y detecta cuáles pueden suponer un incumplimiento del RGPD. Una vez completado el análisis, Verics® resume en un informe todas las filtraciones de datos encontradas, organizadas por tipo de archivo, gravedad y subdominios encontrados.

Share on facebook
Share on linkedin
Share on twitter
Share on email
Share on whatsapp
Share on telegram