In questa esercitazione vedremo che tipo di informazioni possiamo ricavare partendo dalla struttura terziaria. La struttura terziaria, conosciuta anche come struttura tridimensionale (o 3D) viene risolta attraverso metodiche sperimentali quali la cristallografia e la NMR. Come di certo saprete, con l'analisi della struttura terziaria ci è possibile studiare l'organizzazione degli elementi strutturali di una proteina nei tre piani dello spazio. Ovviamente con una struttura proteica possiamo fare molto di più... di seguito alcuni esempi.
In entrambi i casi la proteina è una superossido dismutasi (SOD), un enzima con un atomo di rame e uno di zinco nel sito attivo.
Per prima cosa dovete scaricare i file pdb dalla banca dati di strutture cristallografiche RCSB PDB sul proprio computer. Aprite la pagina di RCSB e inserite il codice del file pdb nel campo a destra di "PDB ID or Keyword" e premete Search. Comparirà la pagina relativa alla proteina data con a destra anche l'immagine della proteina. Selezionate "Download files/PDB file (text)" e salvate il file sul vostro computer.
Ora calcoliamo la distanza tra i due atomi: nel menù scegliete Wizard/Measurement/selezionate il primo atomo e poi il secondo ed infine premete Done. Comparirà un nuovo oggetto chiamato measure01 con la distanza tra i due atomi in Angstrom come etichetta.
Riportate la distanza tra gli atomi che appare nel disegno sul foglio con le domande (ma non chiudete PyMol che tra poco vi servirà di nuovo!).
Adesso cercheremo i ligandi dei due atomi (ovvero quali amminoacidi della proteina legano i metalli del sito attivo) utilizzando il server PDBsum. Inserite il codice PDB della vostra proteina e premete Find.
Nel sito potete vedere diverse informazioni, come ad esempio la reazione enzimatica, la struttura secondaria (sotto il link Protein chain) e i ligandi dei cofattori (sotto Metal ions).
Cliccando sul link dei cofattori appare il disegno degli amminoacidi che legano gli ioni metallici (ignorate la molecola d'acqua); segnatevi i corrispettivi nomi (es His46 ...). Tenete in conto sia i legami diretti che i ponti H. Per interpretare il disegno di LIGPLOT basatevi su questa leggenda e descrizione:
Ora visualizziamoli anche in PyMol, per fare questo selezionate i residui interessati dalla cliccando sulla sequenza, rinominate la selezione (A/rename) e mostrate questi residui come legami (S/sticks) colorati per tipo di atomo (C/by element). Notate che gli atomi che legano i metalli sono soprattutto gli azoti "epsilon" dell'anello imidazolico delle istidine.
Se avete seguito bene le istruzioni, il risultato finale dovrebbe essere una rappresentazione di questo tipo:
Poiché i calcoli richiesti per ottenere il risultato sono parecchio pesanti dal punto di vista computazionale, vi forniamo direttamente le informazioni per aprire i risultati precalcolati; riuscite a risalire a quale proteina appartiene questo modello?
Andate alla seguente pagina per visualizzare il risultato.
Col tasto "Template" viene visualizzata la struttura della proteina di struttura nota, usata per predirre il ripiegamento della sequenza query visibile con il tasto "Model".
Come le sequenze aminoacidiche (struttura primaria) si possono allineare tra di loro, in modo analogo si possono allineare anche le strutture terziarie ovvero le strutture tridimensionali di proteine diverse, massimizzando il grado di sovrapposizione tra gli atomi delle due proteine (quantificato dal valore di RMSD). Uno dei programm più usati è CE che sta per il nome dell'algoritmo usato: Combinatorial Extension.
In questo esercizio proveremo ad allineare strutturalmente la proteina glutatione perossidasi (gpx) 1 con due suoi omologhi (anche strutturali): gpx 4 e gpx 5.
Per prima cosa scaricate dal sito RCSB PDB i due file PDB da allineare. Aprite la pagina di CE, andate su "Two chains", usate l'opzione "User file" e tramite il pulsante "Browse" spedite al server i due file di struttura da allineare (prima la gpx 1 e poi la gpx 4 o 5) e premete "Calculate alignment". Una volta calcolato l'allineamento, il server vi risponde con l'allineamento delle sequenze (da allineamento strutturale!!!), il valore di RMSD (indice della discrepanza media tra le posizioni degli atomi allineati) e da l'opzione di scaricare il file PDB con le due strutture sovrapposte sotto "Download alignment as a PDB file". Cliccate su tale link e scaricate il file PDB sul disco rinominandolo in ce.pdb (destro click sul file/rinomina).
Ora cerchiamo di visualizzare le due strutture sovrapposte con PyMol. Aprite PyMol e caricate il file ce.pdb. Poiché tale file PDB contiene due modelli, PyMol ne mostra soltanto il primo. Per mostrarli entrambi, digitate il comando "split_states ce" senza virgolette al prompt di PyMol (dopo PyMOL>). PyMol mostrerà questa volta le due catene separate (chiamatte ce_0001 e ce_0002). Ora cancellate la prima molecola (chiamata ce) con ce/A/delete object, nascondete tutto con all/H/everything e mostrate le due catene come linee che collegano soltanto i carboni alfa (tralasciando le catene laterali) con ce_0001/S/ribbon e colorate la catena di rosso con C/reds/red. Mostrate e colorate di verde l'altra catena. Mostrate le sequenze delle due strutture con Display/Sequence.
Come potete vedere, le due proteine hanno una struttura molto simile anche se hanno una bassa similarità di sequenza. Cliccando sulla catena verde (ovvero la struttura della gpx 4/5 allineata sulla rossa gpx 1) ed aiutandovi con la barra delle sequenze, siete in grado di individuare i due loop dove le gpx 4/5 differiscono dalla 1?
Provate (se possibile) ad identificare la o le funzioni delle due sequenze di esempio. Se riuscite, provate ad identificare la posizione (numeri degli amminoacidi) in cui si trovano i domini riscontrati. In base a quanto visto nella esercitazione precedente, scegliete il servizio web che più vi sembra adatto per un'operazione di questo tipo.
Esaminando una struttura proteica nota (ovvero di cui si conosce la struttura ad alta risoluzione ottenuta tramite tecniche di diffrazione di raggi X oppure NMR) ci si potrebbe chiedere quali sono e dove si trovano gli aminoacidi conservati e quali sono invece quelli con meno vincoli funzionali e che per questo motivo possono evolvere liberamente. Il server ConSurf risponde a queste domande. Questo server riesce, tramite una ricerca nelle banche dati con PSI-BLAST e sucessivo allineamento multiplo di sequenze con MUSCLE oppure CLUSTALW, a stimare il grado di conservazione per ogni aminoacido di una data struttura. Il grado di conservazione degli aminoacidi nella proteina viene visualizzato direttamente sulla struttura query tramite Jmol. Il colore di ciascun residuo varia da celeste (posizioni altamente variabili) a rosso scuro (posizioni conservate in strutture diverse). Le posizioni per le quali non si riesce ad ottenere una stima ragionevole della variabilità sono indicate in giallo chiaro.
Ora provate ad analizzare tramite ConSurf la struttura della deossi-emoglobina. Riempite i campi PDB ID, Chain Identifier e la vostra email per il ritiro dei risultati. Una volta premuto il tasto Submit verrà visualizzata la pagina temporanea che si aggiorna ogni 30 secondi. Entro una decina di minuti dovrebbe comparire la pagina dei risultati finali con il collegamento a Jmol (View ConSurf Results with FirstGlance in Jmol).
Osservate la posizione degli aminoacidi conservati.
Lo stesso risultato, anche se meno evidente, si ottiene analizzando le altre due catene dell'emoglobina (beta): B oppure D. Poiché le 2 catene alfa (chiamate A e C) nel file PDB sono identiche, potete attivare la visualizzazione anche dell'altra catena attivando i campi sotto "Act on identical chains".
Sequenza: Deossi-emoglobina, codice PDB: 2hhb, catena A oppure C (catene alfa)
BLUUES è un server che ci permette di calcolare il potenziale elettrostatico di una proteina. Tra le varie funzioni di questo utile tool è prevista anche la possibilità di studiare gli effetti di mutazioni. Il programma sfrutta l'equazione di Poisson-Boltzmann di cui ne calcola un'approssimazione lineare, permettendo un calcolo veloce senza perdere precisione.
Vediamo ora come utilizzarlo. Proviamo per esempio a calcolare gli effetti di una mutazione sulla proteina pVHL (Von Hippel–Lindau tumor suppressor). Il programma si presenta come una pagina web nella quale bisogna inserire delle informazioni. Nella pagina di presentazione è possibile calcolare il potenziale elettrostatico semplicemente inserendo il codice PDB della vostra proteina di interesse. In alto a destra è presente il tab Mutate, selezionatelo per attivare l'interfaccia che vi permette di studiare gli effetti di mutazioni.
Dovrebbe apparirvi un pannello nel quale inserire il codice PDB. Provate ad inserire il codice 1LM8 e selezionate la catena V. Dopo il tempo necessario in cui il programma caricherà l'elenco degli amminoacidi presenti nella struttura cristallografica dovrebbe apparirvi un secondo pannello nel quale indicare la mutazione desiderata.
Provate a mutatare uno o più residui a vostro piacimento.
Ci sono dei casi in cui la struttura terziaria non può essere risolta. Pensiamo al caso di proteine contenenti regioni disordinate. In questi casi il programma CSpritz permette di predirre la struttura secondaria della sequenza e fornisce un'indicazione sulle regioni ordinate (strutturate) e su quelle disordinate (non strutturate) della proteina.
Esamineremo due sequenze di criptocromo per verificare i risultati ottenuti tramite gli allineamenti nelle scorse esercitazioni. I risultati vengono spediti via posta entro cinque minuti circa (usate una qualsiasi delle vostre mail); riempite tutti e tre i campi (leggete bene cosa inserire in ogni campo) e scegliete "Long disorder" come tipo di predizione.
La spiegazione del formato di output del risultato lo potete trovare cliccando sulla pagina di aiuto di CSpritz. Osservate bene sia la seconda riga che porta informazioni sulla struttura secondaria che sulla terza che porta informazioni circa l'ordine/disordine.Spesso è utile sapere, durante lo studio di una proteina, se essa interagisce con altre e con quale tipo di interazione. Uno dei server che ci può servire in questo caso è STRING. Questo web server ospita la banca dati di interazioni proteina-proteina teoriche (stimate) e quelle conosciute (sperimentali). All'utente viene visualizzata una mappa colorata (grafo, rete di interazione) con la proteina query in centro e circondata da proteine con le quali interagisce. Scegliendo l'opzione "interactive" si possono spostare manualmente i nodi della rete (per facilitarne la visione), oppure tramite i tasti "+ more/- less" si possono inserire o nascondere ulteriori interazioni più lontante.
Sempre partendo da UniProt, visualizzate le reti di interazione tramite STRING delle seguenti proteine:
I motivi lineari delle proteine sono frammenti funzionali di pochi amminoacidi, che non assumono una struttura tridimensionale definita. Essi indicano siti di modificazioni post traduzionali, siti di legame con vari ligandi o siti di targeting cellulare. Il server ELM cerca di identificarli sulla proteina in esame e ne descrive la loro funzione. Anche se gli ELM (motivi lineari eucariotici) si possono trovare lungo tutta la proteina, essi sono funzionali soltanto nelle regioni non globulari, ovvero disordinate.
Utilizzando il server ELM, provate a identificare i motivi lineari che si trovano nella coda C-terminale disordinata nelle sequenze di criptocromo di piante.