venerdì 3 maggio 2013

il dna come archivio dati

Gentilissimi ecco, per Voi 1 A e 3 A, un articolo tratto, e lievemente modificato, dalla newsletter Le Scienze. Buona lettura. NR


tecnologia biologia
Come archiviare sul DNA libri, canzoni e film
I sonetti di Shakespeare, e parte di un discorso di Martin Luther King, sono stati registrati e archiviati in una minuscola fialetta di DNA: ricercatori dell'EMBL sono riusciti a sviluppare un codice che consente di archiviare masse imponenti di dati, su un supporto in grado di resistere migliaia di anni, che, per la sua conservazione, non richiede energia e non rischia l'obsolescenza tecnologia dei dispositivi elettronici. Già ora il sistema è economicamente conveniente per conservare grandi archivi, come quelli storici e governativi, che devono sfidare i secoli (red)
Ventisei secondi del famosissimo discorso di Martin Luther King I have a dream e 154 sonetti di Shakespeare sono stati memorizzati, rispettivamente come file MP3 e come testo ASCII, in un filamento di DNA. A riuscirci è stato un gruppo di ricercatori dello European Bioinformatics Institute (EMBL-EBI), che descrivono il metodo utilizzato in un articolo pubblicato su “Nature”. Il DNA è un materiale ideale per la conservazione delle informazioni: richiede una quantità di spazio incredibilmente piccola, non ha bisogno di alcuna energia per conservare l'informazione e infine, come ha dimostrato il sequenziamento del genoma di uomini e animali risalenti a molte migliaia di anni fa, è in grado di preservarla per un tempo quasi illimitato, al contrario degli attuali supporti elettronici e optoelettronici. Tutti i supporti utilizzati finora si scontrano inoltre con il problema dell'obsolescenza dei dispositivi, che impongono frequenti e costose migrazioni da un sistema vecchio a uno nuovo.

Nick Goldman, dell'EMBL-EBI, con la fialetta in cui sono archiviati i sonetti di Shakespeare. (Cortesia European Molecular Biology Laboratory)
Tentativi di utilizzare il DNA come mezzo di archiviazione erano già stati effettuati, ma avevano incontrato due difficoltà: in primo luogo, con i metodi attuali, è possibile produrre solo sequenze di DNA piuttosto brevi. Inoltre, la scrittura e la lettura di DNA sono soggette a errori, in particolare in presenza di ripetizioni delle lettere del DNA.  Nick Goldman e Ewan Birney sono riusciti a superare questi problemi sviluppando un nuovo codice. "Sapevamo di aver bisogno di creare un codice usando solo brevi stringhe di DNA, e di doverlo farlo in modo da rendere impossibile la creazione di una 'smagliatura' in corrispondenza di una stessa lettera”, ha detto Birney. “Così abbiamo pensato: rompiamo il codice in un sacco di frammenti sovrapposti da entrambe le parti, con informazioni  di indicizzazione che mostrano dove si trova ogni frammento nel codice generale, e creiamo uno schema di codifica che non consenta ripetizioni. In questo modo, per fallire si dovrebbe avere lo stesso errore su quattro diversi frammenti, evento davvero raro.".

L'informazione digitale codificata con bit (a, in blu), viene convertita in base 3 (b, rosso) utilizzando un codice che sostituisce ogni byte con cinque o sei cifre in base 3 (trit). Il risultato viene convertito in DNA (c, verde) sostituendo ciascun trit con uno dei tre nucleotidi che differiscono da quello precedentemente utilizzato, così che non vengano generati polimeri strutturalmente identici. E' così possibile produrre un gran numero di segmenti di 100 basi che si si sovrappongono uno all'altro per 75 basi, creando una notevole ridondanza di informazione (d, verde). Un'ulteriore garanzia di correttezza della codifica è data poi dall'accoppiamento con segmenti in cui i dati archiviati sono codificati in ordine inverso (violetto). A questo punto vengono aggiunti i codici di indicizzazione (giallo) che permettono la ricostruzione dell'intero file. (Cortesia Goldman et al. / Nature)
I dati così memorizzati possono essere recuperati con il sequenziamento del DNA e la ricostruzione dei file originali, che gli autori hanno ottenuto con il cento per cento di precisione. Comprensibilmente, la velocità di scrittura e lettura dei file non può rivaleggiare con quella dei supporti elettronici; tuttavia, scrivono gli autori, “l'archiviazione su DNA è già economicamente valida per archivi a lunga scadenza e con una bassa aspettativa di accesso frequente, come gli archivi storici e governativi”, per i quali si può prevedere un orizzonte di conservazione compreso fra i 600 e i 5000 anni. Ma la rapidità con cui vengono abbattuti i costi di sequenziamento e lettura del DNA permettono di prevedere che non sia lontano il momento in cui il nuovo metodo diverrà conveniente anche per grandi insiemi di dati che si vogliono conservare per 50-100 anni e, in prospettiva, anche per quelli con un orizzonte di conservazione inferiore ai 50 anni.
(24 gennaio 2013)

1 commento:

  1. nonna rosa ora che la scuola è quasi finita e i prof. non danno più verifiche può mettere un link solo sul dna? grazie.
    David Beacham

    RispondiElimina