Un millón de discos duros en tu PC: el ADN como almacenamiento digital

En un momento en que producimos cada vez más datos y surge la cuestión de su almacenamiento, los biólogos interesados ​​en este problema han recurrido a uno de los «discos duros» más compactos disponibles: l ADN.

La información genética se almacena en el ADN gracias a las bases químicas indicadas A, C, G y T. El almacenamiento de datos en el ADN in vitro propone en particular utilizar estas bases como unidades de almacenamiento de información, como los 0 y 1 en informática (IT – contracción de la información y automática – es el dominio…).
ktsdesign/Shutterstock

En efecto, esta macromolécula presente en todas las células contiene toda la información necesaria para el correcto funcionamiento y reproducción (Reproducción. Elementos para una teoría del sistema didáctico es un libro…) de éstas, codificada en sus cuatro bases A, C, G y T. En este principio, ¿no podría contener datos creados por seres humanos, codificados en las bases del ADN como lo son en forma de 0 y 1 en una computadora (Una computadora es una máquina equipada con una unidad de procesamiento que lo permite. ..)?

En los últimos años, una gran cantidad de investigación se ha centrado en la posibilidad de almacenar datos en el ADN, ya sea in vivo (dentro de las células) o in vitro. Esta solución tecnológica sería, según sus impulsores, una forma de hacer frente a las dificultades de almacenamiento de datos que surgirán en unos años.

La cantidad global de datos digitales se estimó en 2018 en 33 zettabytes (mil billones de billones de bytes), y se duplica cada dos o tres años. El almacenamiento de datos en discos duros o cintas magnéticas requiere cada vez más espacio. Por lo tanto, requiere una infraestructura y recursos energéticos cada vez mayores. Finalmente, el almacenamiento convencional no es muy duradero, por lo que los datos archivados en CD o cinta magnética deben transferirse aproximadamente cada 10 años.

La primera demostración de almacenamiento de datos en el ADN se remonta a la década de 1980 con el trabajo de Joe Davis, quien luego codificó la representación de una runa germánica en el genoma de una bacteria. Pero los desarrollos técnicos en torno a esta idea solo han despegado desde principios de la década de 2010.

Tus datos en tubos de ensayo

El almacenamiento de datos en el ADN in vitro funciona con mayor frecuencia de la siguiente manera: los datos que deben conservarse (textos, imágenes) se convierten en una secuencia de 0 y 1, que a su vez se transponen en secuencias de nucleótidos A, C, G y T. Luego, la molécula de ADN se sintetiza mediante dispositivos dedicados, que agregan los nucleótidos deseados uno tras otro para formar hebras de ADN, con mayor frecuencia de unas pocas decenas a doscientos pares de bases; en comparación, las bacterias suelen tener un genoma de un pocos millones de pares de bases, y los humanos 3.200 millones de bases por célula. De este modo, una información bastante voluminosa se distribuirá en varias hebras de ADN, pero se reconstituirá cuando se lea. Luego, las moléculas se pueden almacenar, a menudo en una solución acuosa. El acceso a la información se realiza mediante secuenciación (En bioquímica, la secuenciación consiste en determinar el orden lineal de…) e interpretación de las secuencias obtenidas.

El ADN codifica la información necesaria para la vida. ¿Podrían guardarse allí otras cosas, por ejemplo, tu libro favorito?
Gio.tto, Shutterstock

El costo es una de las principales limitaciones del almacenamiento in vitro: la síntesis de ADN y, por lo tanto, la escritura de datos, es costosa. Para eludir los costos relacionados con esta síntesis, se exploran métodos alternativos (Alternativas (título original: Destiny Three Times) es una novela de Fritz Leiber publicada…). Por ejemplo, se prevé utilizar una codificación basada en estructuras físicas del ADN: aquí, el plegamiento o no del ADN corresponde entonces a un 0 o a un 1. Otra opción, la codificación mediante modificaciones epigenéticas: en este caso, los bits se codifican gracias a la presencia o ausencia de modificaciones químicas a lo largo de la molécula de ADN, y no a través de las bases.

Otra limitación actual es que el paso de síntesis puede llevar mucho tiempo y ser propenso a errores, al igual que el paso de secuenciación necesario para leer los datos. Para compensar los errores, la codificación de los datos debe incluir redundancia de información y se utilizan códigos correctores: son secuencias que se agregan después de los datos de interés, lo que permite reconstruir la información en caso de error o borrado durante la escritura o la lectura. . Estos códigos de corrección de errores provienen del trabajo sobre la codificación de la información. La información redundante, es decir, la información ya presente en el mensaje, se añade alrededor de la información a transmitir. Esto permite que el sistema que lo decodifica detecte y reelabore los errores. Uno de los códigos de corrección de errores más utilizados, el código Reed-Solomon, también está presente en los CD y códigos QR para evitar pérdidas de información.

Tus datos en bacterias

También es posible almacenar datos in vivo, en el genoma de organismos vivos. En 2017, se codificó un gif animado en el genoma de una bacteria, integrándose las bases que constituyen el código en un lugar específico del genoma. Luego, un triplete de nucleótidos se codificó para un color de píxel, lo que permitió la reconstrucción en 21 niveles de gris.

Secuencia de animación que muestra un caballo de carreras al galope. Fotos tomadas por Eadweard Muybridge (fallecido en 1904), publicadas en 1887 en Filadelfia bajo el título «Animal Locomotion». Este cortometraje fue codificado en el genoma de _E. coli_ en 2017.
Fuente: Wikimedia Más recientemente, en 2021, investigadores de la Universidad (Una universidad es una institución de educación superior cuyo objetivo es el…) de Columbia establecieron un sistema para transferir datos directamente desde un formato digital al almacenamiento biológico.

En este nuevo sistema, denominado «grabación molecular electrobiológica», el formato digital, compuesto por 0s y 1s, se expresa como una señal eléctrica. Así, para codificar un 0 no hay señal eléctrica y se integra en el genoma una secuencia del genoma original de la bacteria. En cambio, para codificar un 1, por tanto, en presencia de una señal eléctrica, se integra en el genoma una secuencia exógena -ajena al genoma de la bacteria-. Los investigadores codificaron así el mensaje «hola mundo» en el genoma de la bacteria. Si bien la cantidad de datos codificados aún es pequeña, esta es la primera demostración de escribir datos directamente desde la computadora a un organismo vivo: una especie de grabadora de video celular, capaz de registrar datos en el equivalente biológico de la cinta magnética (La cinta magnética (o cinta magnética) es un soporte que permite la grabación…): ADN.

Colonias de bacterias E. coli en una placa de Petri.
Lectura de Nathan/Flickr, CC BY-NC-ND

Es más difícil manipular el ADN in vivo que in vitro y, para los métodos de «registro molecular», la densidad del espacio de almacenamiento (aquí, la cantidad de información por nucleótido) es menor allí, la codificación de un 0 o un 1 actualmente requiere alrededor de 50 nucleótidos. Sin embargo, los datos registrados in vivo tienen la ventaja de ser fáciles de copiar, gracias a la división celular, a diferencia de los datos almacenados in vitro, que deben replicarse mediante PCR, reacción en cadena de la polimerasa, una técnica que permite duplicar grandes cantidades de ADN o ARN de pequeños cantidades de material genético y cebadores específicos), ahora famoso por su papel en el cribado (Screening, en medicina, consiste en buscar una o más enfermedades o…) del SARS-Cov-2, pero más caro que los cultivos durante los cuales el las células se están dividiendo.

La replicación del ADN se menciona a menudo como un problema del almacenamiento in vivo, porque es probable que genere mutaciones que podrían dañar los datos al introducir errores de codificación; sin embargo, los errores de replicación del ADN son más raros in vivo que durante la PCR.

Almacenamiento «frío», pero no solo

El almacenamiento de datos en el ADN parece estar más bien indicado para el archivo de los llamados datos «fríos», es decir, datos a los que el acceso es poco frecuente. Pero se prevén otras aplicaciones.

Este tipo de almacenamiento también podría usarse en esteganografía, es decir, para ocultar un mensaje dentro de otro mensaje. Por ejemplo, las células que almacenan ADN portador de información podrían mezclarse con bacterias de un entorno natural para ayudar a ocultar información.

La autenticación de objetos a través de códigos de barras de nucleótidos también se examina, por ejemplo en este estudio, que propone utilizar ADN encapsulado en sílice y mezclado con aceites de oliva para que sea posible verificar su autenticidad.

Imagen de microscopía confocal de bacterias (Bacillus subtilis).
Fernán Federici, Flickr, CC BY-NC-SA

A pesar de que el almacenamiento de datos en el ADN ya no es ciencia ficción, aún queda un largo camino por recorrer antes de que se convierta en la corriente principal. El ADN se mantiene bien y es muy compacto, millones de nucleótidos ocupan sólo unos pocos micrómetros, por lo que tendría una densidad de almacenamiento un millón de veces mayor que la de los discos duros. Estas son sus ventajas frente a los métodos de almacenamiento tradicionales, como el almacenamiento magnético (utilizado en discos duros) o el almacenamiento óptico (CD y DVD).

No obstante, los diversos costes implicados, en particular para la escritura de los datos, siguen siendo varios órdenes de magnitud superiores a los del almacenamiento convencional. La velocidad de lectura de datos, a menudo la velocidad de la secuenciación del ADN, también es un obstáculo a superar, aunque se han logrado avances considerables en esta área en los últimos años, y aún quedan mejoras por venir, como los métodos de secuenciación que requieren solo un ADN. molécula, donde los métodos convencionales requieren varios.

Incluso si no es imposible imaginar, dentro de unas pocas décadas, un estante de archivo lleno de tubos de ensayo que contengan libros en forma de ADN, es poco probable que pronto pueda ver su película favorita. un reproductor de DVD genético.

¿Te ha gustado este artículo? ¿Quieres apoyarnos? Compártelo en las redes sociales con tus amigos y/o coméntalo, ¡esto nos animará a publicar más temas similares!

Deja un comentario