Sostenibilidad
El genoma de 4.000 especies que genera un petabyte de datos
El 70% de la superficie está cubierta por agua y quedan muchas áreas por explorar
De 2018 y 2022, se creó la misma cantidad de datos que desde el 95 hasta 2018: 20 zettabytes, por lo que Guillaume de Landtsheer, vicepresidente de Francia en NetApp, asegura que en 2025 habrá 175 zettabytes.
Un petabyte de todos ellos corresponderá al proycto de genómica de 4.000 especies que realizan Ifremer y el Museo. Benoît Morin, ingeniero líder de IA y alta computación (HPC) en Ifreme, aclara que no están tratando de predecir la evolución de las especies, sino «intentar predecir dónde viven las poblaciones, cómo los cambios en la química del agua afectarán a los ecosistemas existentes y cómo podemos ayudar a protegerlos». El atlas de especies permitirá hacer metagenómica en diferentes áreas y saber dónde pueden vivir animales pequeños, el plancton, los unicelulares y otras especies. «Ahora mismo tomamos una muestra y no sabemos si puede contener cientos de animales pequeños diferentes y quiénes son», confiesa.
«Nuestra infraestructura de almacenamiento tiene un área activa, donde residen los datos de los investigadores que están en uso. Cuando esta frecuencia baja, se mueven a un almacenamiento diferente. Todo se hace automáticamente en un sistema mucho menos costoso de adquirir y de operar», defiende. «Así podemos tener lo mejor de ambos mundos: podemos dar acceso rápido a los investigadores para que puedan hacer ciencia y almacenar grandes cantidades de datos hasta que se necesitan más adelante».
Otros estudios
No es el único para el que se trabaja con datos. Así, y dado que son un manjar para muchos pero pueden transmitir muchas enfermedades a los humanos, los responsables de Ifremer se preguntaron si las ostras podían transmitir el Covid. Aunque la respuesta es no, este ejemplo ilustra todo lo que la comunidad científica puede hacer gracias a la gestión de los datos y la capacidad de cómputo.
✕
Accede a tu cuenta para comentar