El genoma de 4.000 especies que genera un petabyte de datos

El 70% de la superficie está cubierta por agua y quedan muchas áreas por explorar

Benoit Morin, ingeniero en IA de Ifremerphilippe HUGUENifremer

Arantxa Herranz
Arantxa Herranz

Creada: 18.10.2024 19:30

Última actualización: 18.10.2024 19:30

De 2018 y 2022, se creó la misma cantidad de datos que desde el 95 hasta 2018: 20 zettabytes, por lo que Guillaume de Landtsheer, vicepresidente de Francia en NetApp, asegura que en 2025 habrá 175 zettabytes.

Un petabyte de todos ellos corresponderá al proycto de genómica de 4.000 especies que realizan Ifremer y el Museo. Benoît Morin, ingeniero líder de IA y alta computación (HPC) en Ifreme, aclara que no están tratando de predecir la evolución de las especies, sino «intentar predecir dónde viven las poblaciones, cómo los cambios en la química del agua afectarán a los ecosistemas existentes y cómo podemos ayudar a protegerlos». El atlas de especies permitirá hacer metagenómica en diferentes áreas y saber dónde pueden vivir animales pequeños, el plancton, los unicelulares y otras especies. «Ahora mismo tomamos una muestra y no sabemos si puede contener cientos de animales pequeños diferentes y quiénes son», confiesa.

«Nuestra infraestructura de almacenamiento tiene un área activa, donde residen los datos de los investigadores que están en uso. Cuando esta frecuencia baja, se mueven a un almacenamiento diferente. Todo se hace automáticamente en un sistema mucho menos costoso de adquirir y de operar», defiende. «Así podemos tener lo mejor de ambos mundos: podemos dar acceso rápido a los investigadores para que puedan hacer ciencia y almacenar grandes cantidades de datos hasta que se necesitan más adelante».

Otros estudios

No es el único para el que se trabaja con datos. Así, y dado que son un manjar para muchos pero pueden transmitir muchas enfermedades a los humanos, los responsables de Ifremer se preguntaron si las ostras podían transmitir el Covid. Aunque la respuesta es no, este ejemplo ilustra todo lo que la comunidad científica puede hacer gracias a la gestión de los datos y la capacidad de cómputo.

«Hay cuatro proyectos que están utilizando cables de fibra óptica en el suelo del fondo marino para detectar vibraciones, lo que podría predecir tsunamis», detalla. Según sus datos, los humanos podemos llegar a profundidades de 6.000 metros, pero hay áreas que alcanzan los 10.000 metros, por lo que queden muchos espacios por explorar. «Más del 70% de la superficie de la Tierra está cubierta por agua. El mar representa más del doble y medio de la superficie que las masas terrestres. Así que todavía tenemos mucho trabajo por hacer», asegura. Y está convencido de que se logrará. «Si hemos llegado a la Luna…».