Almacenamiento

Diógenes digital: guardar datos que no vas a utilizar

La promesa de estar basados en datos o de la IA hacen que asistamos a una especie de Diógenes digital en el que no se borra información innecesaria

Tecla Delete
Tecla DeleteDreamstime

El síndrome de Diógenes es un trastorno del comportamiento que sufren algunas personas que se dedican a acumular, de manera compulsiva, objetos y desechos. Además, suelen abandonar las medidas más básicas incluso de higiene personal y doméstica, lo que les lleva a un aislamiento social. Como en muchos otros trastornos, quienes sufren esta patología suelen negar que padezcan esta enfermedad.

Aunque no está clínicamente reconocido como un trastorno, lo cierto es que sí se puede hablar de una traslación de este síndrome de Diógenes al ámbito digital de nuestras vidas. Es más, teniendo en cuenta la velocidad de creación de datos, podemos estar ante un problema creciente con un impacto significativo, tanto en la vida cotidiana de las personas (por ejemplo, a nivel económico, al necesitar cada vez más dispositivos o espacio de almacenamiento en la nube) como medioambiental (puestos que estos soportes generan residuos, no siempre son reciclados y también consumen energía eléctrica).

Este síndrome de Diógenes surge con la digitalización de nuestras vidas. A diferencia del síndrome de Diógenes tradicional, que se caracteriza por la acumulación compulsiva de objetos físicos, el síndrome de Diógenes digital se manifiesta en la acumulación excesiva y desorganizada de archivos digitales, correos electrónicos, fotos, videos y cualquier tipo de contenido en nuestros dispositivos electrónicos.

¿Quién no almacena cientos (cuando no miles) de fotos que nunca más vuelve a consultar pero que, por algún motivo, da miedo o pena borrar o eliminar? ¿Cuántos correos electrónicos somos capaces de almacenar en la bandeja de entrada? ¿Has revisado alguna vez la cantidad de almacenamiento que ocupa una aplicación como WhatsApp?

Las personas o empresas con este síndrome suelen tener dificultad para eliminar contenido digital por miedo a perder información valiosa o útil en el futuro. Esto puede llevar a una saturación de almacenamiento, pérdida de productividad y estrés.

Guardar ¿para qué?

¿Estamos guardando datos por encima de nuestras posibilidades? Jaime Balañá, Senior Solutions Engineering Manager Iberia & LatAm en NetApp, concede que es una buena pregunta. «Diría que estamos guardando muchos datos. Si es por encima de nuestras posibilidades o no, ahí ya habría más discusión. Pero que guardamos muchos y cada vez más, está clarísimo», reconoce.

Según las cifras que maneja NetApp (dedicada precisamente, al almacenamiento de datos empresariales), de todos los datos que se guardan, casi al 70% de ellos no se vuelve a acceder nunca. Balañá entiende que se guardan datos desde hace mucho tiempo pensando que en algún momento se les podrá sacar partido. No en vano, el mantra con la eclosión de la Inteligencia Artificial (IA) es que su aplicación en las empresas será tan buena como lo sean los datos con los que trabaje esa IA. «Algunos sacan partido a esos datos históricos. Pero otras veces son datos que no sirven para nada porque hay que limpiarlos, eliminar duplicados, etc.», determina.

Juan Huguet, CEO y cofundador de Anyformat (especializada la adopción de la Inteligencia Artificial Generativa para la explotación de todos los datos no estructurados), coincide en que también las empresas están guardando muchos datos con la esperanza de poder utilizarlos en beneficio propio. «Estos datos, que analizados en grandes cantidades pueden aportarte mucho valor para entender qué es lo que está pasando en tu negocio y en tu empresa, hasta ahora no eran aprovechables en gran medida porque faltaban los medios, que eran muy caros a nivel de tiempo, recursos y coste. Ahora, gracias a esta generación de tecnologías, se pueden escalar y utilizar por la mayoría de las empresas».

En este sentido, Anyformat defiende que permite la extracción, estructuración y normalización de datos desde cualquier tipo de fuentes, desde las desestructuradas (tipo PDF, mails o llamadas) a las estructuradas para poder obtener información. «Todavía hay muchos equipos dedicados a leer documentos en PDF y extraer información muy específica y muy detallada para luego meterla dentro de un Excel. Nosotros ayudamos a estas personas a automatizar parte de ese proceso, a hacer más liviana este tipo de datos y que simplemente tengan que validar que el dato que está en la guía sea correcto».

Tecnología para gestionar

Además, cada vez es más frecuente que se añadan prestaciones a los productos (como el historial de versiones) que permiten que no sea necesario guardar cada versión de un archivo importante en el que se esté trabajando. Es más, Huguet asegura que, tanto a nivel personal como empresarial, en breve va a haber tecnologías que nos dirán ellas mismas qué datos podemos borrar sin temor a perder nada de nuestros dispositivos. «Las propias IA nos dirán en qué foto salimos más guapos y cuáles del resto de imágenes tomadas podemos eliminarlas sin problema», pone como ejemplo.

Eso sí, también señala que nadie mejor que el gesto de una empresa para saber qué datos son los que le ayudan en su negocio y cuáles no. «La tecnología te tiene que ayudar a explotar esa información que tienes y esas intuiciones o hipótesis que tienes», relata.

En un terreno más empresarial, Balañá defiende que también hay tecnologías en los sistemas de almacenamiento que permiten ver si los datos almacenados son sensibles o no. «Podemos proporcionar herramientas que digan qué tipos de datos hay (científicos, sobre raza, salud, número de DNI o de cuentas bancarias) y si los datos están en el sitio que deberían». Algo que puede ser importante si van a ser utilizados o no. «El dato siempre tiene que estar cerca de la computación. Puedes medir esa distancia y decidir si te interesa tener esa información en la nube, en tu casa o, dentro de la misma nube, en qué región», explica, defendiendo que, gracias a este tipo de herramientas, se puede saber la calidad de los datos que guardamos. «Pero siempre va a haber algo que se te escapa», concede.

Consejos tengo

Conversando con estos dos expertos, hemos querido preguntar por consejos o trucos para evitar guardar tantos datos.

«Cuando guardas infinitas versiones de un mismo documento, dentro de un tiempo no sabrás cuál es el archivo bueno», expresa Juan Huguet, quien también alude a la cantidad de tiempo que toda esta gestión conlleva. «A la hora de gestionar la información, hay que aplicar la economía del otro, tenemos que ser consciente del valor añadido que aportan estos datos o no, del tiempo que vamos a perder gestionándola o no», señala.

Balañá reconoce que, al ser información digital y parecer más etérea, puede ser difícil hacernos una idea del volumen que ocupan todos estos datos. Y aunque asegura que «no es muy caro guardar datos», cree que desde el punto de vista de la sostenibilidad se puede hacer mucho para tirar aquello que no sea útil. «Igual que en tu casa te preocupa el espacio y el precio del metro cuadrado, en el caso de los datos es el precio del metro cuadrado del centro de datos, que lleva incorporado el precio de la refrigeración, de la electricidad, etc.», expone.

La capacidad de guardar

Lo que parece descartado es que el mundo se quede sin capacidad de guardar todos los datos que produce cada año.

Así, y en línea con el fuerte crecimiento del volumen de datos que se crean, se prevé que aumente la base instalada de capacidad de almacenamiento, creciendo a una tasa de crecimiento anual compuesta del 19,2% durante el periodo entre 2020 y 2025. En 2020, la base instalada de capacidad de almacenamiento alcanzó los 6,7 zettabytes. Afortunadamente, siguen borrándose datos.

De 64,2 a 180 zettabytes en cinco años

Desde la llegada de la digitalización y la popularización de Internet, se han creado más datos en 20 años que en todo el resto de la humanidad. En 2020, sin ir más lejos, la cantidad de datos creados y replicados alcanzó un nuevo máximo histórico debido al aumento de la demanda por la pandemia, ya que cada vez más personas trabajan y aprenden desde casa y utilizan las opciones de entretenimiento doméstico. Se calcula que la cantidad total de datos creados, capturados, copiados y consumidos en todo el mundo está aumentando rápidamente, desde los 64,2 zettabytes en 2020. Hasta 2025, se prevé que la creación mundial de datos aumente a más de 180 zettabytes.