Molecolare I (seconda parte) pdf PDF

Title Molecolare I (seconda parte) pdf
Course Biochimica
Institution Università degli Studi di Pavia
Pages 19
File Size 1.3 MB
File Type PDF
Total Downloads 7
Total Views 127

Summary

appunti biologia molecolare ...


Description

PROGETTO GENOMA UMANO Il progetto del genoma umano, avviato nel 1990, ha avuto un ruolo fondamentale nel favorire tutta una serie di importanti innovazioni che hanno reso sempre più veloce ed economico il sequenziamento genomico. Il primo articolo è stato! pubblicato nel febbraio del 2001, ma l'articolo più completo sul progetto è stato pubblicato nel 2003. Il genoma umano è lungo circa 3200Mb, di cui solo 48Mb di DNA codificante (1,5%), 1152Mb (36%) costituiscono il cosiddetto "gene related" DNA (Introni, UTR, Pseudogeni, frammenti genici) e le restanti 2000Mb costituiscono il DNA intergenico, formato da sequenze ripetute intersperse chiamate LINE (21%), SINE (15%), LTR (9%), Transposoni a DNA (3%), sequenze ripetute in tandem anche dette microsatelliti (3%) e una piccola percentuale di altri tipi. I geni umani sono circa 21000, in media contengono 8.8 esoni ognuno dei quali è lungo all'incirca 170bp. Il numero di introni è in media 7.8 con una lunghezza media di 5420bp. Il Progetto genoma umano è un progetto di ricerca scientifica internazionale il cui obiettivo principale é quello di determinare la sequenza delle coppie di basi azotate che formano il DNA e di identificare e mappare i geni del genoma umano (previsti circa centomila, trovati circa 20-25000) dal punto di vista sia fisico sia funzionale. I problemi legati al sequenzimanto di un genoma non sono relativi alla produzione delle sequenze in sé, ma alla determinazione dell’ordine con cui queste sequenze devono essere disposte per ottenere la conoscenza completa del genoma, ovvero del corretto “assemblaggio” dell’intero genoma. La disposizione ordinata dei frammenti risulta complessa a causa della presenza di sequenze ripetute. Ne consegue che, abbiamo bisogno di un insieme di marcatori, ovvero di elementi genetici unici di cui si nota con precisione la disposizione lungo il genoma. L’insieme di questi marcatori costituisce quella che viene denominata mappa fisica o mappa genica. Più elevato è il numero di marcatori di cui si dispone, maggiore è la risoluzione della mappa e, di conseguenza, tanto più agevole sarà la ricostruzione dell’intera sequenza. Supponiamo, per esempio, di avere una mappa costituita da una serie ordinata di marcatori M1, M2, M3 e M4. Se disponiamo i tre frammenti di sequenza S1, S2, S3 che contengono rispettivamente i marcatori M3-M4, M1-M2 e M2-M3, potremo ordinare in modo corretto le tre sequenze sulla base della localizzazione dei marcatori in comune e costruire una sequenza più lunga, detta sequenza consenso. Il DNA genomico non può essere sequenziato direttamente ma prima deve essere frammentato, e i frammenti risultati clonati in vettori appropriati. I vettori più utilizzati a questo scopo sono i BAC, che possono contenere frammenti di DNA piuttosto grandi e possono essere propagati in E. coli. STRATEGIE DI SEQUENZIAMENTO DEI GENOMI COMPLETI 1. CLONE BY CLONE SHOTGUN GENOME SEQUENCING (CGS) In questo tipo di approccio i ricercatori sono partiti preparando una libreria di DNA. Spezzettato il genoma umano in frammenti sovrapponibili di dimensioni comprese tra 100 e 200 coppie di kb, sono stati inseriti nei cromosomi batterici artificiali (BAC), per poi introdurli in E. coli. (I BAC sono simili ai plasmidi batterici, ma possono accogliere dei pezzi più grandi di DNA). Quando i batteri si dividono, copiano i BAC producendo così un insieme di frammenti clonati sovrapponibili. In seguito è stato determinato la posizione di ognuno di questi frammenti di DNA sulla mappa genomica umana. Per fare questo, hanno utilizzato diverse nucleasi di restrizione per ricavare una sorta di “firma” di riconoscimento per ogni clone. La posizione dei siti di restrizione in ogni frammento ha permesso ai ricercatori di mappare ogni clone BAC su una mappa di restrizione dell’intero genoma umano, preparata precedentemente, utilizzando la stessa serie di nucleasi di restrizione. Conoscendo la posizione relativa di ogni frammento clonato, i ricercatori hanno selezionato circa 30.000 cloni BAC, li hanno divisi in frammenti più piccoli e hanno determinato la sequenza nucleotidica di ciascun BAC separatamente, utilizzando il metodo shotgun. Hanno potuto così assemblare l’intera sequenza del genoma congiungendo le sequenze di migliaia di singoli BAC che insieme coprono l’intera lunghezza del genoma.

Questa premappatura riduce la probabilità di assemblare in maniera errata le regioni che contengono sequenze ripetute e, praticamente, elimina la possibilità di unire tra loro erroneamente sequenze provenienti da cromosomi diversi. La prima sequenza umana è l’unico genoma tra quelli dei mammiferi a essere stato completato in maniera così metodica. Il Progetto Genoma Umano ha rappresentato un enorme successo dal momento che ha permesso di acquisire le tecniche, la sicurezza e la spinta necessarie allo sviluppo della prossima generazione dei metodi di sequenziamento del DNA, che stanno trasformando rapidamente tutti gli ambiti della biologia. 2. WHOLE GENOME SHOTGUN SEQUENCING (WGS) Questa strategia è molto più semplice e veloce rispetto al CGS, in quanto viene saltata completamente la fase di costruzione del MTP, ma rende la ricostruzione della sequenza genomica più complessa, soprattutto nel caso di genomi ad alto contenuto di DNA ripetitivo e non codificante. L’assemblaggio delle sequenze mediante il WGS è possibile in quanto vengono utilizzati vettori diversi che possono contenere inserti di dimensioni molto variabili, che possono andare da 1-2 kbp per i vettori plasmidici a oltre kbp per i vettori BAC, di cui vengono sequenziale entrambe le estremità. Queste, se corrispondono a sequenze uniche, attraverso programmi bioinformatici, consentono la ricostruzione affidabile della sequenza genomica di interi cromosomi. Tuttavia possono rimanere dei buchi, che possono essere più o meno estesi, in funzione del grado di copertura ottenuto e dalla ripetitività del genoma. NGS - NEXT GENERATION SEQUENCING Con il termine Next Generation Sequencing (NGS) o sequenziamento in parallelo si indicano una serie di tecnologie che permettono di sequenziare grandi genomi in tempi molto brevi. La procedura per arrivare al sequenziamento è diversa a seconda del materiale di partenza. Il gDNA è inizialmente frammentato in una libreria di piccoli segmenti che possono essere sequenziati uniformemente e accuratamente in milioni di reazioni parallele. I nuovi filamenti di basi che sono stati identificati, chiamati “reads”, possono essere riassemblati usando un genoma conosciuto di referenza (risequenziamento) o tramite un nuovo sequenziamento (quando non conosciamo il genoma di referenza). Il set completo di reads allineate rivela l’intera sequenza di ogni cromosoma nel campione di gDNA. A. gDNA estratto. B. Il gDNA è frammentato in una libreria di piccoli segmenti ciascuno sequenziali in parallelo. C. Le sequenze individuali (reads) sono riassemblate tramite l’allineamento a un genoma di referenza. D. L’intera sequenza del genoma proviene da il consenso delle reads allineate.

Metodi che possono essere usati nella Next Generation Sequencing • Sequencing by synthesis (illumina); • Pyrosequencing (454); • Sequencing by ligation (SOLiD sequencing); • Single-molecule real-time sequencing (Pacific Bio); • Ion semicondutor (Ion Torrent sequencing)." Sequencing by synthesis (Illumina) Prevede una fase di amplificazione clonare del DNA ottenuto dalla frammentazione del campione in esame. La prima fase consiste nella preparazione della libreria di frammenti. Le estremità dei frammenti vengono completate; ad entrambe le estremità si aggiunge un adenina che protrude dalla doppia elica. Vengono quindi legati gli adattatori e si effettua la selezione dei frammenti di DNA cui questi sono legati. Nella seconda fase il DNA viene fissato sulla superficie di una cella a flusso e si effettua una amplificazione a ponte. L’amplificazione genera cluster clonali di frammenti cui vengono poi appaiati i primer per il seqeunziamento. Dopo l’appaiamento di un primer appropriato i quattro deossinucleotidi vengono aggiunti simultaneamente. Ciascun deossinucleotide è marcato con un fluorocromo

diverso e porta un gruppo bloccante al 3’-OH che impedisce l’incorporazione di ulteriori nucleotidi. Una volta rilevata la fluorescenza viene rimosso il blocco del 3’-OH ed eseguito un nuovo ciclo di sequenziamento. Tra le peculiarità delle piattaforme illumina vi è la possibilità di ottenere le sequenze di entrambe le estremità dei frammenti ottenuti (paired-end sequencing), rendendo quindi molto più accurata e specifica l’analisi dei dati. Studio dell’interazione DNA-proteine La metodologia Chip-Seq, prevede il sequenziamento massivo del DNA. Consente di determinare una mappa su scala logaritmica dei siti di legame tra DNA (o RNA) e uno o più proteine in esame per cui sia disponibile un anticorpo specifico. Utilizzando anticorpi specifici per determinate modificazioni istoniche è possibile ottenere la mappa completa dello stato della cromatina nei tipi cellulari e condizioni sperimentali in esame.

TRASCRIZIONE E TRADUZIONE La trascrizione è il processo tramite il quale le informazioni contenute nel DNA vengono trascritte enzimaticamente in una molecola di RNA. Procede sempre in direzione 5' --> 3', perché le RNA polimerasi agiscono solo in questa direzione. È un processo attraverso cui si passa dal linguaggio deossiribonucleotidico del DNA a quello ribonucleotidico dell’RNA. È un processo reversibile per retrotrascrizione, in cui la cellula può andare in contro ad un processo di retrotrascrizione con prodotto il DNA. Con la retrotrascrizione di solito si formano i pseudo-geni. Il processo di traduzione invece è un processo irreversibile. Il processo dell'espressione genica consiste in due fasi: trascrizione e traduzione. La trascrizione genera un filamento singolo di RNA identico in sequenza ad uno dei due filamenti di un DNA a doppia elica. Genera quindi differenti tipi di RNA chiamati trascritti. Le tre classi principali coinvolte nella sintesi delle proteine sono: - RNA messaggero: mRNA che codificano le proteine;

- RNA transfer: tRNA - RNA ribosomiale: rRNA

! Gli RNA non codificanti svolgono diverse funzioni nella fisiologia della cellula: - snRNA (small nuclear RNA, circa 150 nt) partecipano alla maturazione dell’mRNA;

- snoRNA (small nuclear RNA) sono molecole corte di RNA in grado di favorire modificazioni chimiche dell'RNA ribosomiale, transfer RNAs e altre;

- miRNA (microRNA, 20-25 nt) regolano l'espressione genica a livello trascrizionale e post-trascrizionale tramite sovrapposizione con sequenze complementari presenti su molecole di RNA messaggero bersaglio;

- scRNA (small conditional RNA,...


Similar Free PDFs