Un estudio innovador supone un importante paso adelante en la búsqueda de desarrollar una letra singular-sistema de almacenamiento basado en datos digitales.
Recursos datos está creciendo a un ritmo exponencial hoy en día debido a nuestra dependencia de los dispositivos y requiere un almacenamiento sólido a largo plazo. El almacenamiento de datos se está convirtiendo poco a poco en un desafío porque la tecnología digital actual no es capaz de ofrecer una solución. Un ejemplo es que en los últimos dos años se han creado más datos digitales que en toda la historia de la computadoras, de hecho, cada día se crean en el mundo 2.5 quintillones de bytes {1 quintillón de bytes = 2,500,000 Terabytes (TB) = 2,500,000,000 Gigabytes (GB)} de datos. Esto incluye datos sobre sitios de redes sociales, transacciones bancarias en línea, registros de empresas y organizaciones, datos de satélites, vigilancia, investigación, desarrollo, etc. Estos datos son enormes y no están estructurados. Por lo tanto, ahora es un gran desafío abordar los enormes requisitos de almacenamiento de datos y su crecimiento exponencial, especialmente para organizaciones y corporaciones que requieren un almacenamiento sólido a largo plazo.
Las opciones disponibles actualmente son disco duro, discos ópticos (CD), tarjetas de memoria, unidades flash y la unidad de cintas más avanzada o discos BluRay ópticos que almacenan aproximadamente hasta 10 Terabytes (TB) de datos. Dichos dispositivos de almacenamiento, aunque se utilizan comúnmente, tienen muchas desventajas. En primer lugar, tienen una vida útil de baja a media y deben almacenarse en condiciones ideales de temperatura y humedad para poder durar muchas décadas y, por lo tanto, requieren espacios de almacenamiento físicos especialmente diseñados. Casi todos estos consumen mucha energía, son voluminosos y poco prácticos y pueden dañarse con una simple caída. Algunos de ellos son muy caros, a menudo están plagados de errores de datos y, por lo tanto, no son lo suficientemente robustos. Una opción que ha sido aceptada universalmente por la organización se llama computación en la nube, un acuerdo en el que una empresa básicamente contrata un servidor "externo" para manejar todos sus requisitos de almacenamiento de datos y TI, conocido como la "nube". Una de las principales desventajas de la computación en la nube son los problemas de seguridad y privacidad y la vulnerabilidad a los ataques de piratas informáticos. También hay otros problemas como los altos costos involucrados, el control limitado por parte de la organización matriz y la dependencia de la plataforma. La computación en la nube todavía se considera una buena alternativa para el almacenamiento a largo plazo. Sin embargo, parece que la información digital que se genera en todo el mundo ciertamente está superando nuestra capacidad para almacenarla y se necesitan soluciones aún más sólidas para atender esta avalancha de datos y, al mismo tiempo, proporcionar escalabilidad para tener en cuenta las necesidades de almacenamiento futuras.
¿Puede el ADN ayudar en el almacenamiento de la computadora?
Nuestros estudiantes letra singular (ácido desoxirribonucleico) se está considerando como un medio alternativo interesante para el almacenamiento de datos digitales. letra singular es el material autorreplicante presente en casi todos los organismos vivos y es lo que constituye nuestra información genética. Un artificial o sintético. letra singular es un material duradero que se puede fabricar utilizando máquinas de síntesis de oligonucleótidos disponibles comercialmente. El principal beneficio del ADN es su longevidad como letra singular dura 1000 veces más que el silicio (chip de silicio, el material utilizado para la construcción) computadoras). Sorprendentemente, solo un milímetro cúbico de letra singular ¡Puede contener un trillón de bytes de datos! letra singular También es un material ultracompacto que nunca se degrada y puede almacenarse en un lugar fresco y seco durante cientos de siglos. La idea de utilizar ADN para el almacenamiento existe desde hace mucho tiempo, desde 1994. La razón principal es la forma similar en la que se almacena la información en una computadora y en nuestra computadora. letra singular – ya que ambos almacenan los planos de información. Una computadora almacena todos los datos como 0 y 1 y el ADN almacena todos los datos de un organismo vivo utilizando las cuatro bases: timina (T), guanina (G), adenina (A) y citosina (C). Por lo tanto, el ADN podría considerarse un dispositivo de almacenamiento estándar, al igual que una computadora, si estas bases se pueden representar como 0 (bases A y C) y 1 (bases T y G). El ADN es resistente y duradero, y el reflejo más simple es que nuestro código genético (el modelo de toda nuestra información almacenada en el ADN) se transmite eficientemente de una generación a la siguiente de manera repetida. Todos los gigantes del software y el hardware están interesados en utilizar ADN sintético para almacenar grandes cantidades y lograr su objetivo de resolver el archivo de datos a largo plazo. La idea es convertir primero el código de computadora 0 y 1 en el código de ADN (A, C, T, G), el código de ADN convertido luego se usa para producir hebras sintéticas de ADN que luego se pueden almacenar en frío. Siempre que sea necesario, las hebras de ADN se pueden retirar del almacenamiento en frío y su información se decodifica utilizando una máquina de secuenciación de ADN y la secuencia de ADN finalmente se traduce nuevamente al formato informático binario de 1 y 0 para leerse en la computadora.
Se ha mostrado1 que sólo unos pocos gramos de ADN pueden almacenar quintillones de bytes de datos y mantenerlos intactos hasta por 2000 años. Sin embargo, esta simple comprensión ha enfrentado algunos desafíos. En primer lugar, es bastante caro y también tremendamente lento escribir datos en el ADN, es decir, la conversión real de 0 y 1 en las bases del ADN (A, T, C, G). En segundo lugar, una vez que los datos se “escriben” en el ADN, resulta complicado encontrar y recuperar archivos y requiere una técnica llamada letra singular secuenciación: proceso de determinar el orden preciso de las bases dentro de un letra singular molécula, después de lo cual los datos se decodifican nuevamente a 0 y 1.
Un estudio reciente2 por científicos de Microsoft Research y la Universidad de Washington han logrado un "acceso aleatorio" sobre el almacenamiento de ADN. El aspecto de “acceso aleatorio” es muy importante porque significa que la información se puede transferir hacia o desde un lugar (generalmente una memoria) en el que se puede acceder directamente a cada ubicación, sin importar en qué lugar de la secuencia. Con esta técnica de acceso aleatorio, los archivos se pueden recuperar del almacenamiento de ADN de manera selectiva en comparación con antes, cuando dicha recuperación requería la necesidad de secuenciar y decodificar un conjunto de datos de ADN completo para encontrar y extraer los pocos archivos que se deseaban. La importancia del "acceso aleatorio" aumenta aún más cuando la cantidad de datos aumenta y se vuelve enorme, ya que reduce la cantidad de secuenciación que debe realizarse. Es la primera vez que se muestra el acceso aleatorio a una escala tan grande. Los investigadores también han desarrollado un algoritmo para decodificar y restaurar datos de manera más eficiente con más tolerancia a los errores de datos, lo que hace que el procedimiento de secuenciación también sea más rápido. En este estudio se codificaron más de 13 millones de oligonucleótidos de ADN sintético, que eran datos de 200 MB de tamaño que constan de 35 archivos (que contienen video, audio, imágenes y texto) con un tamaño de 29 KB a 44 MB. Estos archivos se recuperaron individualmente sin errores. Además, los autores han ideado nuevos algoritmos que son más robustos y tolerantes a errores al escribir y leer las secuencias de ADN. Este estudio publicado en Nature Biotechnology en un avance importante que muestra un sistema viable a gran escala para el almacenamiento y la recuperación de ADN.
El sistema de almacenamiento de ADN parece muy atractivo porque tiene una alta densidad de datos, una alta estabilidad y es fácil de almacenar, pero obviamente enfrenta muchos desafíos antes de que pueda ser adoptado universalmente. Pocos factores son la decodificación del ADN (la secuenciación), que requiere mucho tiempo y trabajo, y también la síntesis de letra singular. La técnica requiere más precisión y una cobertura más amplia. Aunque se han realizado avances en este ámbito, el formato exacto en el que se almacenarán los datos a largo plazo, como letra singular todavía está evolucionando. Microsoft se ha comprometido a mejorar la producción de ADN sintético y abordar los desafíos para diseñar un sistema completamente operativo. letra singular sistema de almacenamiento para 2020.
***
{Puede leer el trabajo de investigación original haciendo clic en el enlace DOI que figura a continuación en la lista de fuentes citadas}
Fuentes)
1. Erlich Y y Zielinski D 2017. DNA Fountain permite una arquitectura de almacenamiento robusta y eficiente. Ciencias. 355 (6328). https://doi.org/10.1126/science.aaj2038
2. Organick L y col. 2018. Acceso aleatorio en almacenamiento de datos de ADN a gran escala. Biotecnología de la naturaleza. 36. https://doi.org/10.1038/nbt.4079