1 de julio de 2011

Eliminar los Metadatos de documentos


Tanto Fotos, como los documentos y demás archivos contienen información oculta sobre su origen, autor, fechas, programa utilizados, hora de la edición e incluso algunas cámaras de fotos o móviles pueden incluir coordenadas geográficas en las fotos. Toda esta información oculta se denomina metadatos, un ejemplo es las etiquetas EXIF para fotos o ID3 para música. 

Los metadatos son útil para clasificar y organizar los contenidos de librería de los documentos, pero son peligrosos por la cantidad de información sensible de nuestra organización que transmiten sin que tengamos un control sobre ella. 


Un archivo es un bloque de información. La mayor parte de la información del archivo son los datos del contenido del propio archivo, pero hay una pequeña parte que es reservada para la información sobre el tipo de documento, fecha de creación, autor, etc., esta información se encuentra en la cabecera o en los metadatos del los archivos.

Por hacer una comparación, piensa que un archivo es un paquete que vamos a enviar a un cliente por mensajería, pues los metadatos y la cabecera son etiquetas que se ponen al paquete que contienen información sobre el remitente, y el albarán nos dice en que fecha se embaló el paquete, que contiene, etc. 

Los editores de documentos son capaces de leer y manipular los metadatos de los documentos con los que trabajan, estos metadatos les facilita el trabajo a la hora de clasificar los documentos, por ejemplo como crees que un programa sabe cual es el documento más reciente, la respuesta te la imaginas verda. 

Sin embargo, los metadatos también suponen un riesgo para la privacidad y la seguridad una organización, y lo que es peor nunca pesamos en ellos. 

Los documentos de Office, y especial los documentos Word, tiene una gran cantidad de metadatos, como son: nombre, iniciales, nombre de la empresa, ruta de guardado, resúmenes, revisiones y versiones, texto oculto y otros datos. 

La mayoría de estos datos se pueden ver haciendo clic con el botón derecho del ratón, elegimos Propiedades y pulsamos sobre la pestaña Resumen o usando aplicaciones como Metadata Analyzer, Foca que es una aplicación de una empresa de Auditorías de Seguridad Informática española, cuyo representante más mediático es Chema Alonso. 

Foca es una aplicación que te puedes descargar en la siguiente dirección: http://www.informatica64.com/DownloadFOCA/. Tienes que pasar un email y te enviarán el enlace para realizar la descarga, pero también te permite analizar documentos para extraer los metadatos de forma online, en la siguiente dirección: http://www.informatica64.com/foca/default.aspx.

Debemos tener en cuenta que los metadatos de los documentos de Word ofrecen mucha información a los usuarios de la organización, que quizás no nos interese que sepan y por eso es conveniente eliminar los metadatos del documento. 

Microsoft ofrece instrucciones detalladas para evitar que Word añada metadatos a los documentos, así como instrucciones para eliminarlos, pero es más sencillo recurrir a eliminadores masivos de metadatos, como Doc Scrubber, que te puedes descargar en esta pagina: http://www.javacoolsoftware.com/dsdownload.htm.

Doc Scrubber busca metadatos en de los archivos de Word de una carpeta y permite eliminar los que desees, aunque sólo los que tienen extensión doc y no puede eliminar los que tiene extensión docx. La operación es rápida y segura. Entre los datos que se eliminan está el GUID identificador, comentarios, palabras clave, fechas de guardado, fecha de impresión, tiempo de edición, historiales de revisión.

Aunque el más completo es BatchPurifier, que elimina datos de veinte tipos de documentos (archivos PDF y OpenOffice), pero este programa es una versión de prueba o de evaluación. Te lo puedes descargar de la siguiente Web: http://batchpurifier.softonic.com.

EXIF, IPTC y XMP metadatos de imagen 

Las cámaras digitales y los programas de retoque digital incrustan información en los archivos JPG y RAW, desde la hora en la que se tomó la foto hasta las coordenadas geográficas en el caso de que conectan a un dispositivo GPS. 

Los metadatos EXIF revelan información sobre una fotografía. Esta información es útil para clasificar las imágenes, y los metadatos EXIF indican cómo y cuándo se tomó una foto digital, pero si no deseas que se conozca esta información, entonces deberás usar un eliminador o un editor de metadatos para imágenes. 

Entre las muchas disponibles, puedes elegir MetaStripper, que es una utilidad gratuita que elimina los datos EXIF, IPTC y COM. 

Otro programa es Stripper es un programa para borrar los metadatos contenidos en los archivos de imagen JPG y PNG, que te puedes descargar en la siguiente dirección: http://www.steelbytes.com/?mid=30. 

Esta es una aplicación portable, es decir, que puedes llevarla en un pendrive y no es necesario instalar en equipo. Para ejecutar esta aplicación, arrastrar las imágenes sobre la ventana del programa y se marcan los metadatos quieres borrar, entre otras opciones que nos permite el programa. Cuando todo esté listo, presiona “Clear“, y el programa se encarga de hacer todo. Al final, da un informe. 

ID3 metadatos de sonido 

Los archivos de audio también tienen metadatos. ID3 que se usa para añadir una serie de datos., como por ejemplo información sobre el autor y disco de una canción MP3, etc. Las grabadoras de audio suelen añadir las etiquetas ID3 a los archivos que producen. Para quitarlos, uno de los más efectivos es ID3Kill. 

Espero que os haya servido de ayuda a tod@s. Un saludo:

Antonio

No hay comentarios:

Publicar un comentario

No olvides dejar tu comentario y gracias por tu tiempo ;-)