Presentati da IllyCaffè e Lavazza uno studio italiano che per la prima volta al mondo ha analizzato il DNA del caffè arabica. Si tratta di un unicum nel panorama della ricerca genomica mondiale, che apre la strada a futuri sviluppi dal punto di vista scientifico e agroalimentare, con conseguente ricaduta a livello economico lungo tutta la filiera del caffè e con il coinvolgimento di tutti i Paesi produttori e consumatori. Lo studio è stato condotto dalle Università di Padova, Trieste e dall’Istituto di Genomica Applicata di Udine, con il coordinamento del professor Giorgio Graziosi di DNA Analytica Srl, spin off dell’Università di Trieste. Un esempio virtuoso di collaborazione fra due aziende protagoniste del mercato del caffè mondiale e di proficua cooperazione fra privato e pubblico. Di seguito si riporta un approfondimento sullo studio
Coordinamento del progetto a cura del Prof. Giorgio Graziosi, DNA Analytica Srl, spin off dell’Università di Trieste, in collaborazione con l’Università di Padova, l’Università di Udine e l’Istituto di Genomica Applicata di Udine.
SEQUENZIAMENTO DEL GENOMA DI COFFEA ARABICA
Per sequenziamento del DNA si intende la determinazione dell’ordine dei diversi nucleotidi (quindi delle quattro basi azotate che li differenziano Adenina, Citosina, Guanina e Timina) che costituiscono l’acido nucleico, in cui sono contenute tutte le informazioni genetiche. La determinazione dei geni presenti in questa sequenza, nonché delle istruzioni per esprimerli nel tempo e nello spazio, rappresenta un aspetto di importanza fondamentale nella ricerca del perché e del come gli organismi vivono. Il sequenziamento del genoma del caffè può pertanto presentare molteplici aspetti di interesse, non solo dal punto di vista scientifico, ma anche dal punto di vista agroalimentare con conseguenti ricadute, anche economiche, sia per i paesi produttori sia per i paesi consumatori.
Il progetto si pone l’obiettivo di decodificare il DNA di Coffea arabica e di immagazzinare i risultati in opportune banche dati.Il genoma di Arabica è costituito da circa 2,6 miliardi di basi per una lunghezza fisica di circa 140 cm. Viste queste dimensioni, è stato necessario suddividere le attività in varie fasi, ciascuna delle quali è stata accompagnata dallo sviluppo di strategie diverse.Le cinque fasi principali in cui si è articolata la ricerca comprendono: 1) Preparazione di una genoteca BAC; 2) Sequenziamento fisico del DNA dei BAC; 3) Sequenziamento fisico del DNA genomico intero; 4) Ricostruzione informatica delle sequenze; 5) Annotazione ed identificazione dei geni codificanti.
1) Preparazione di una genoteca BAC
La grandezza e la complessità del DNA di Coffea arabica rendono complesso il sequenziamento diretto dell’intero genoma soprattutto a causa della sua natura poliploide che porta alla presenza di coppie di sequenze molto simili ma non identiche, ciascuna derivante da uno dei due genomi ancestrali. Per tale ragione è stata scelta una innovativa strategia ibrida che combina, assieme al tradizionale sequenziamento diretto dell’intero genoma, il sequenziamento di cloni BAC. E’ stato quindi necessario frammentare il genoma in tanti segmenti più piccoli, ciascuno dei quali è stato successivamente inserito in un vettore, costituito da cromosomi artificiali batterici (BAC: Bacterial Artificial Cromosome). Questa strategia ha consentito di ottenere una collezione di colonie batteriche (cloni), contenente almeno una copia di tutte le sequenze di DNA presenti nel genoma. Tale collezione è definita libreria genomica o genoteca. Questa prima fase si è conclusa con la costituzione di una genoteca BAC pari a circa 175.000 cloni, ciascuno dei quali contiene un frammento di DNA di Arabica di circa 100.000 nucleotidi.
2) Sequenziamento fisico del DNA dei BAC
Ciascun clone è stato posto in coltura in modo che le cellule batteriche si moltiplicassero e automaticamente moltiplicassero le copie del frammento di DNA di Arabica producendo una quantità di DNA sufficiente alle esigenze del processo di sequenziamento. Si è quindi proceduto alla fase di sequenziamento vero e proprio, che per motivi di costo, nonché di ridondanza della genoteca, ha riguardato soltanto 36.864 dei 175.000 cloni ottenuti, riuniti a loro volta in 96 gruppi (o pools) contenenti ciascuno 384 cloni.
3) Sequenziamento fisico del DNA genomico intero
E’ stata adottata una strategia che ha previsto la produzione di collezioni di frammenti di DNA genomico di diverse dimensioni, ciascuno dei quali è stato sequenziato ad entrambe le estremità fino ad ottenere circa 100 gigabasi di sequenza complessiva.
4) Ricostruzione informatica delle sequenze
Al termine del sequenziamento si ottiene un’ampia collezione di piccole sequenze casuali, che devono essere assemblate ad ottenere una sequenza consenso che copra l’intero genoma. Perché questo sia possibile, i dati di sequenza bruta vengono innanzitutto ripuliti dalle sequenze del DNA del vettore batterico in modo da avere solo le sequenze dei frammenti di DNA di Coffea arabica. La sequenza di ogni singolo frammento di Arabica è stata quindi confrontata con la sequenza di tutti gli altri frammenti per stabilire se la coda di un frammento corrispondesse alla testa di qualche altro frammento e potessero essere riuniti in una ricostruzione almeno parziale del genoma. Questo processo ha consentito la ricostruzione di oltre il 50% del DNA di Arabica ed è in corso il lavoro che, combinando le due strategie descritte ai punti 2 e 3, dovrebbe consentire di avvicinarsi ad una ricostruzione completa.
5) Annotazione e identificazione dei geni codificanti
CONCLUSIONE
Il sequenziamento del genoma di Coffea arabica fa parte di un ambizioso programma di ricerca che si pone come obiettivo la ricostruzione, finora mai affrontata, dell’intero genoma di un organismo tetraploide, i cui due genomi ancestrali sono estremamente simili. L’obiettivo, per quanto difficile, è quello di poter distinguere le sequenze derivate dal progenitore C. eugenioides da quelle derivanti dal progenitore C. canephora. Una buona conoscenza del materiale genetico è di fondamentale importanza per la qualità della pianta, e quindi del seme, in quanto tutte le sue strutture e funzioni sono dettate dalla sequenza di nucleotidi del DNA che determina, a sua volta, la sequenza degli amminoacidi nelle molecole proteiche.Queste considerazioni hanno rappresentato il punto di partenza del progetto, che ha portato ad oggi ad una buona decifrazione della base genetica della pianta del caffè Arabica.
Sono stati infatti sequenziati cloni BAC ed è stata effettuata una prima ricostruzione del genoma. Sono stati, inoltre, sequenziati dei trascritti di foglie e radici di alcune varietà di Arabica per poter identificare i geni codificanti, ovvero quei tratti di DNA effettivamente attivi dai quali dipendono le caratteristiche della pianta e quindi del chicco di caffè.
Potenti mezzi di bioinformatica stanno, infine, lavorando per identificare le possibili funzioni dei geni codificanti. Dal sequenziamento del genoma di Arabica sono attese ricadute in vari settori, non ultimo quello economico, con possibili applicazioni agronomiche ed industriali. In più, le analisi genomiche strutturali e funzionali potranno permettere di comprendere come i due genomi di C. eugenioides e C. canephora si combinano ed interagiscono in quello di C. arabica per conferirgli le sue caratteristiche distintive che non rappresentano la semplice somma delle caratteristiche delle due specie ancestrali e che lo rendono così ricercato per la produzione della bevanda caffè.
Committenti della ricerca: Lavazza e illycaffé.
Contact: segreteria@studiosuitner.it