Estilos

El retorno de la cinta de datos

Aunque nunca se ha dejado de usar para backups, IBM y Fujifilm presentan un nuevo soporte que multiplica por 27 la densidad de almacenamiento hasta 580 TB en un cartucho

JULIO MIRAVALLS | 20 de enero de 2021
Vuelven las cintas de datos. Que en realidad nunca se fueron. El concepto creado hace más de 60 años como soporte de almacenamiento sigue vigente, sobre todo como backup de la nube. Aunque hace tiempo que quedan fuera del imaginario colectivo, e incluso del dominio de muchos técnicos informáticos, que ya no ven mucho más allá de las nubes y los discos SSD, sigue siendo el último respaldo de seguridad. Ahora son artefactos de tamaño reducido, basados desde hace tres décadas en las características tecnológicas DAT (para audio digital). En algunos casos, ideales para asegurar los datos más sensitivos en respaldo físico reducido, fácil de custodiar.

Los más viejos del lugar todavía pueden recordar cuando se programaban los mainframes (aquellos ordenadores-armarios que ocupaban las paredes de grandes salas de trabajo) utilizando tarjetas perforadas. Y los más jóvenes, en todo caso, han visto en las películas esas carcasas redondas, moviéndose lenta o compulsivamente en un plano vertical, sobre alguno de los módulos del gran computador que lee sus datos a vertiginosas velocidades de 12 o 13 kilobytes por segundo...

Pero la cinta no ha muerto.

Según detalla en el blog de IBM Mark Lantz, manager en sus laboratorios de investigación de Zurich, un proyecto de IBM y Fujifilm acaba de batir «un nuevo récord mundial en almacenamiento de cintas, el sexto desde 2006».

Más detalles que añade Lantz: «Superando los límites, conseguimos 317 GB/pulgada2 de densidad de área en un prototipo de cinta magnética de partículas de ferrita de estroncio (SrFe) desarrollado por Fujifilm. Esto es aproximadamente 27 veces más que la densidad de área utilizada en las actuales unidades de cinta comerciales de última generación».



El proyecto de IBM y Fujifilm rescata la validez del veterano sistema para afrontar la abrumadora cantidad de datos que genera el mundo digital. Se calcula una producción diaria de 2,5 quintillones de bytes (2,5 exabytes, cada uno de los cuales equivale a un millón de terabytes). En cinco años, se estima, se almacenarán 175 zetabytes. Cada zetabyte son mil exabytes.

Las cifras son, sencillamente, inabarcables para la mente humana. Y complicadas de explicar, con el baile entre el billón en el idioma español y el billion en inglés (equivalente al millardo, mil millones, que aquí apenas se utiliza) y los sucesivos saltos de mil en mil que hace la lengua de Shakespeare (seguro que él jamás imaginó tales magnitudes). Pero si tomamos como unidad básica al terabyte, cualquier usuario de ordenador se hace idea de lo que significa.

Echando las cuentas (con riesgo de error) sobre unos 7.800 millones de habitantes del planeta, sale que aportaríamos una media diaria de más de trescientos megas por persona. Y como no todos los seres humanos vivos están conectados, o no lo están con la misma continuidad, parece que esa producción media por persona debería incrementarse bastante en determinadas áreas del mundo. Aunque hay que advertir que no sólo las personas generan datos. También lo hacen las máquinas y en particular los dispositivos IoT, con sensores en permanente misión de recolectarlos y transmitirlos. Sus aportaciones forman una inmensa catarata al océano de datos que se está formando.

Borrachera de datos

Esta borrachera de datos es suficiente para explicar la necesidad de exagerados medios de almacenamiento, que además se multiplican si se considera la conveniencia de mantener redundancias de seguridad. Mucha de esa información estará en la nube (algunos datos, duplicados o triplicados en las diversas nubes existentes), pero lo prudente es mantener copias en soportes estáticos, que a ser posible no consuman energía mientras están fuera de uso. Por eso, subraya Lantz, «los gigantes tecnológicos y las instituciones académicas siguen recurriendo a las cintas magnéticas para el almacenamiento de archivos».

El coste de la cinta magnética es muy inferior al de los almacenamientos en disco tradicional mecánico, y todavía más frente al disco sólido, SSD, basado en celdillas de memoria flash. Según el experto de IBM, los datos grabados en cinta correctamente tienen una persistencia de al menos 30 años.

A cambio, el inconveniente fundamental de la cinta es el tiempo necesario para la recuperación de inforamción, en el mismo orden que fue grabada. La cinta es un almacenamiento de muy alta latencia (tiempo necesario para encontrar un dato), sin opción de búsquedas aleatorias en el soporte. Sólo admite la lectura secuencial.

En el disco clásico los cabezales de lectura se desplazan a toda velocidad sobre la superficie de los platos (suelen ser entre dos y cuatro) sin limitaciones, para leer datos en cualquier punto. En los discos flash se busca el dato específico por direccionamiento de cada celdilla. Esa diferencia puede significar que en un disco se recupere un determinado volumen de datos en cuestión de minutos (más rápido todavía en el SSD), mientras que en una cinta hagan falta varias horas para hacerlo. La recuperación de un sistema tras un desastre, basada en cinta puede durar días, según el volumen de datos que implique. Si esa recuperación se pudiera hacer mediante discos, según las circunstancias bastaría el tiempo que se tarde en montarlos.

Pero cuando se habla de volúmenes ingentes de datos, hay un importante factor de coste (además de la mayor fragilidad de los discos) en el soporte y en el espacio necesario para guardarlo. En el caso de la cinta es una fracción del coste de un disco, porque toda la tecnología de escritura y lectura está en los cabezales de un solo aparato. La cinta como tal es sólo un soporte enrollado dentro de un casette, con determinadas características químicas.

Explica Lantz, respecto al nuevo soporte desarrollado en el laboratorio, que «un solo cartucho de cinta con esta nueva densidad de área tiene el potencial de almacenar unos 580 terabytes. Sólo para ponerlo en perspectiva, 580 TB es el equivalente a 786.977 CDs apilados a 944 metros de altura, lo que es más alto que Burj Kalifa, el edificio más alto del mundo. Todo encaja en un cartucho de cinta en la palma de la mano».

Química y física

«La actual generación de cinta utiliza partículas de ferrita de bario (BaFe) para recubrir el medio de almacenamiento de la cinta magnética», detalla. «Para aumentar la densidad, Fujifilm ha inventado algo nuevo llamado ferrita de estroncio (SrFe). El SrFe puede convertirse en partículas más pequeñas con 'propiedades superiores', lo que significa una mayor densidad de almacenamiento en la misma cantidad de cinta».

El proyecto de IBM no se basa sólo en la química. También tiene una parte física: incluye una nueva tecnología de cabezal de baja fricción, que permite utilizar cinta muy lisa, con un detector capaz de leer en la cinta SrFe a una densidad lineal de 702 Kbpi, usando un sensor de lectura TMR ultra-estrecho de 29 nm de ancho.

Además, ha desarrollado nuevas tecnologías servo-mecánicas, para mantener un posicionamiento preciso de los cabezales de lectura/escritura en relación con la cinta. Así consigue una precisión de 3,2 nanómetros, moviéndose la cinta a una velocidad de 15 kilómetros por hora. Lantz precisa que «podemos posicionar el cabezal de la cinta con una precisión que es aproximadamente 1,5 veces el ancho de una molécula de ADN».

La conclusión del experto es que, con este avance, la cinta de datos gana otra década de supervivencia. O, mejor dicho, de convivencia con la nube híbrida, como soporte de respaldo.

El logro de la nueva química y aplicación en los dispositivos de lectura y grabación «representa una mejora potencial de la capacidad de aproximadamente 48 veces más que un cartucho LTO8, el último producto de cinta magnética estándar de la industria, y una mejora de 29 veces más que el actual producto de cinta empresarial de IBM», remacha Lantz, para augurar largo uso del viejo artefacto renovado.




1302 palabras / etiquetas: Almacenamiento, cinta de datos, IBM, Fujifilm, Zurich Lab, Mark Lantz
URL permanente: https://apuntelego.es/apuntes/2021/20210120_retorno_cinta_de_datos.html


**PUBLICIDAD**