Proteómica Estructural Y Funcional PDF

Title Proteómica Estructural Y Funcional
Course Genòmica proteòmica i interactòmica
Institution Universitat Autònoma de Barcelona
Pages 7
File Size 174.9 KB
File Type PDF
Total Downloads 13
Total Views 138

Summary

Grado de Genética...


Description

PROTEÓMICA ESTRUCTURAL Y FUNCIONAL Una vez obtenida la secuencia completa de un genoma se procede a la identificación y anotación de los genes codificados en él. Los genes que se traducen a proteína llevan el proceso de la anotación al campo de la proteómica. Este proceso incluye aspectos de proteómica estructural y funcional, ya que a partir de la secuencia de la proteína se intenta predecir la estructura tridimensional y la función de la proteína codificada. La proteómica estructural y funcional va más allá de las predicciones, ya que también agrupa aquellas técnicas que permiten corroborar o rechazar las predicciones basadas en los algoritmos bioinformáticos. Objetivos de la proteómica estructural Los principales objetivos son:  Determinar la estructura tridimensional de todas las proteínas  Estudiar los cambios conformacionales de las proteínas inducidos por unión a un ligando, por mutaciones o por cambios en las condiciones del medio Para ello, combina los métodos de predicción o modelado estructural con los métodos experimentales. Conceptos básicos  Motivo de secuencia: un fragmento proteico de secuencia conservada que aparece en una gran variedad de moléculas. Los motivos de secuencia no son estables de forma independiente fuera de la proteína y pueden aparecer en proteínas sin relación evolutiva. También pueden determinar alguna característica especial, como por ejemplo:  Motivos de modificaciones post-traduccionales CDK consensus sequence: S/T-P-X-K/R  Motivos de unión de TF (secuencia de DNA)  Motivos que definen una familia proteica (protein signature)  Motivo estructural: un fragmento de una proteína que está formado por más de un elemento de estructura secundaria, lo que se conoce como estructura supersecundaria. Estos motivos aparecen en moléculas con funciones diferentes. Ejemplo: zinc-finger, beta hairpin, helix-loop-helix… Pueden estar presentes en diferentes plegamientos y dominios.  Plegamiento (fold): distribución tridimensional conservada de elementos de estructura secundaria. Un mismo tipo de plegamiento puede aparecer en proteínas sin relación evolutiva, ya que tolera un elevado número de cambios en la estructura primaria. Ej: Rossmann fold.  Dominio: región de la cadena polipeptídica que tiene un plegamiento independiente, realiza una función específica y puede aparecer en más de una proteína. Suele corresponder a una unidad evolutiva. Las proteínas pueden tener uno o más de un dominio. Ej: piruvato quinasa. Recordemos que la secuencia de aa o estructura primaria puede adoptar estructuras regulares entre residuos cercanos en la cadena, conocidas como estructuras secundarias. En este grupo se incluyen las conocidas (hélices alfa u hojas beta). La estructura secundaria de las proteínas se pueden caracterizar mediante técnicas biofísicas como el dicroísmo circular o la espectroscopia de IR. Los elementos de estructura secundaria se pliegan sobre sí mismos para adoptar una conformación específica, o sea, una disposición espacial precisa que se conoce como estructura terciaria o estructura tridimensional. El estudio de la estructura terciaria se realiza mediante técnicas muy complejas, como la cristalografía de rayos X, la resonancia magnética nuclear y la microscopía electrónica criogénica. Las estadísticas actualizadas de la bbdd de estructuras tridimensionales PDB (Protein Data Bank) muestran el crecimiento exponencial de las estructuras tridimensionales disponibles. La técnica más usada para la determinación estructural es la cristalografía de rayos X, aunque en los últimos 2-3 años la criomicroscopía está creciendo también con fuerza. Especialmente para la determinación de la estructura de complejos

proteicos o complejos de proteína ácido nucleico. También podemos observar que el nº de proteínas cuya estructura se encuentra aún muy lejano del número de proteínas anotadas manualmente en la base de datos SwissProt. Y más aún del número de proteínas anotadas automáticamente en TrEMBL. El nº de proteínas con estructura conocida es además mucho menor que el nº de estructuras disponibles, si tenemos en cuenta que es muy frecuente que más de una estructura corresponda a una misma proteína, ya que se suelen analizar de manera independiente algunos dominios. También se puede estudiar la misma proteína formando algún complejo, por ejemplo con un sustrato, o también el efecto estructural que causan las mutaciones. Métodos de predicción de estructura terciaria Para salvar la distancia entre el nº de proteínas con estructura conocida y el número total de proteínas existentes se utilizan los métodos de predicción de estructura terciaria. Los cuales se dividen en tres grupos fundamentales:  Comparative modeling/Homology modeling Basado en la existencia de la estructura tridimensional de proteínas similares que ya esté resuelta. Estas proteínas deben tener como mínimo un 30% de identidad de secuencia en más de 80 residuos. Existen muchos métodos de este tipo, que usualmente se pueden ejecutar online aunque usen servidores específicos y los resultados pueden tardar varios días dependiendo del método escogido.  Threading Los métodos de este tipo se basan en la identificación de folds compatibles con la secuencia de la proteína. Para ello se suelen utilizar funciones energéticas para cuantificar las interacciones entre parejas de residuos, y así ubicarlos en un posible esqueleto polipeptídico.  Ab initio/de novo Se basan en la predicción de novo a partir de la estructura terciaria de la proteína, teniendo en cuenta los principios generales que gobiernan el plegamiento proteico y la estabilidad termodinámica de los candidatos generados. Suelen utilizar algoritmos complejos que requieren gran cantidad de recursos computacionales. Destaca el método Rosetta. Modelado por homología Tiene 3 etapas. En la primera se selecciona el molde a utilizar, a partir de los alineamientos de secuencia de la proteína problema con la secuencia de las proteínas con estructuras disponibles en bases de datos como el PBD, CATH y SCOP. Una vez seleccionado, en la segunda etapa se realiza el modelado estructural propiamente dicho, cuyo resultado es evaluado en la tercera etapa mediante herramientas que evalúan funciones energéticas y el potencial estadístico del modelo al compararlo con estructuras experimentales. A continuación comentaremos brevemente el algoritmo que sigue el modelado estructural en el Swiss-Model. En este algoritmo se realiza el ensamblado de fragmentos tomando como punto de partida la estructura del molde seleccionado. Pasos a seguir:  Colocar el esqueleto de la cadena polipeptídica de aquellas regiones que tienen estructura secundaria definida  Modelado de las regiones flexibles que conectan los diferentes elementos de estructura secundaria  Modelado de la cadena lateral de cada uno de los residuos aminoacídicos de la proteína Después de completar el modelo se realizan ajustes buscando la minimización energética. Y se procede a la evaluación del modelo generado (QMEAN). Técnicas de proteómica estructural basadas en MS

A parte de las tres técnicas fundamentales para la determinación de la estructura tridimensional de las proteínas, existen otro grupo de técnicas de proteómica estructural, las cuales se pueden acoplar a la MS. Estas técnicas aportan información complementaria a la obtenida por la cristalografía de rayos X, RMN o criomicroscopía. Su uso puede ser ventajoso en algunos aspectos.  A diferencia de la cristalografía de rayos X y de la criomicroscopía, estas técnicas tienen la posibilidad de estudiar la dinámica de las proteínas  Posibilidad de estudio a nivel de todo el proteoma, en lugar de estudiar proteínas individuales  Necesitan poca cantidad de muestra en comparación con otras técnicas estructurales Para realizar estudios de tipo estructural se parte de la proteína entera en condiciones nativas. Ahora empezamos con las técnicas:  Hydrogen-Deuterium Exchange-Mass Spectrometry, HDX-MS Basado en el reemplazamiento de los átomos de hidrógeno de la proteína por el isótopo deuterio. Se intercambian aquellos átomos de H de los grupos -OH, -NH y -SH. Esto es porque son capaces de formar puentes de H con el agua. No obstante, solo se detectan por MS los átomos de H presentes en los enlaces amida, ya que el resto de reemplazamientos ocurren muy rápidos durante la manipulación de la muestra y no son detectados. La velocidad del intercambio de los átomos de H depende de:  pH y temperatura (menos pH y temperatura, menos velocidad)  Accesibilidad al disolvente de los protones intercambiables  Movilidad de la estructura (Protein breathing) Los protones accesibles al solvente (superficie de la estructura) se intercambian más rápido por deuterio. Si el hidrógeno amida de los residuos internos que está involucrado en puentes de hidrógeno internos estables intercambiará más lento. La estrategia experimental es la siguiente: Se parte de una muestra de proteína en estado nativo, la cual se mezcla con un volumen mucho mayor de tampón deuterado y se deja incubar por el tiempo deseado. A continuación, se para el intercambio mediante la adición de ácido y la disminución de la temperatura. La adición del ácido también provoca la desnaturalización de la proteína, la cual se digiere en esas condiciones ácidas usando un enzima proteolítico que puede trabajar en esas condiciones, que es la pepsina. Los péptidos obtenidos de esta manera se analizan mediante espectrometría de masas en tándem. Los residuos en los cuales se ha producido el intercambio se identifican por el aumento de la masa equivalente a un protón al comparar el espectro obtenido con el del control (mismo análisis en paralelo). También es posible determinar una cinética del reemplazamiento si repetimos el procedimiento descrito anteriormente utilizando diferentes tiempos de incubación con el tampón deuterado. Este intercambio también permite estudiar los cambios conformacionales de las proteínas, ya que cuando ocurre un cambio conformacional se altera la accesibilidad al disolvente, y por lo tanto el intercambio por deuterio de aquellas regiones implicadas en el cambio conformacional. Siempre y cuando tengamos la referencia del estado inicial. También se utiliza el HDX-MS para estudiar las interacciones proteína-ligando, ya que la interacción con el ligando evitará el intercambio por deuterio de aquellos H amida involucrados en la interacción directa con dicho ligando. Por tanto, si comparamos los resultados de un experimento de intercambio de HDX de la proteína aislada con los resultados del complejo proteína-ligando podemos determinar los residuos que interaccionan de manera directa con el ligando estudiado.

 Proteolisis limitada-MS (Lip-MS) Otra técnica de proteómica estructural muy utilizada. Cuando se realiza la digestión proteolítica de una proteína desnaturalizada la especificidad de corte está determinada por la secuencia de aa, es decir, porque existen los aa que reconocen esta proteasa para que pueda cortar. Sin embargo, cuando se incuba una proteína en su conformación nativa con una proteasa la especificidad de corte depende de la secuencia de aa y por la accesibilidad de los sitios de corte. Aquellos sitios de corte que se encuentran en zonas desestructuradas expuestas al disolvente serán digeridos más fácilmente que los sitios de corte que se encuentran en zonas estructuradas o en el núcleo hidrofóbico de la proteína. Por tanto, la proteolisis en condiciones nativas se puede utilizar como herramienta para el estudio estructural de las proteínas. Esta técnica consiste en la incubación de una proteína en su conformación nativa con una proteasa en bajas concentraciones, durante poco tiempo. Los productos generados se analizan posteriormente mediante espectrometría de masas. Se suele utilizar varias proteasas de diferentes especificidades o proteasas de amplio espectro p.ej proteinasa K. La proteolisis limitada permite determinar los dominios de una proteína, ya que se dirigirán preferentemente aquellas zonas desestructuradas dejando intacta las zonas que tienen un plegamiento tridimensional estable, como en los dominios proteicos. En proteínas con un único dominio también es posible estudiar aquellas zonas no estructuradas que unen los elementos de estructura secundaria. Lo primero en la estrategia experimental que se sigue es la reacción de proteolisis limitada con la proteína en condiciones nativas, utilizando la proteasa escogida. Seguidamente se desnaturaliza la proteína, se modifican los residuos de cisteína y se realiza una segunda digestión, en este caso usando tripsina. Los péptidos generados de esta segunda digestión se analizan mediante MS. Los cortes realizados con la proteasa escogida se pueden determinar al comparar con el control (misma proteína sin proteolisis limitada). Este procedimiento sirve también para estudiar los interacciones proteína-ligando, ya que los residuos involucrados en la interacción con el ligando estarán protegidos del corte de la proteasa. Igual que el intercambio de H por deuterio, la proteolisis limitada permite estudiar los cambios conformacionales respecto a condiciones iniciales en una proteína sometida a diferentes estímulos como cambios de temperatura, mutaciones, PTMs… Este estudio se puede hacer extensivo a todo el proteoma si se combina esta técnica con técnicas de proteómica cuantitativa como el SWATH o HRM.

Objetivos de la proteómica funcional  Clasificación y anotación funcional de las proteínas  Determinar o predecir la función de todas las proteínas Para ello utiliza métodos bioinformáticos de predicción y métodos experimentales. Anotación funcional de las proteínas Las proteínas se clasifican en 3 superclases funcionales, las relacionadas con el metabolismo energético, la información y la comunicación. Las proporciones de las proteínas que cumplen cada función pueden variar entre especies. El proceso de anotación funcional tiene como punto de partida la información genómica, a partir de la cual se determina la secuencia de la proteína codificada. A partir de la secuencia, se inicia el proceso de anotación automática basada en la identidad de dicha secuencia con otras proteínas indexadas en bbdd. De esta manera, se predice la función de la proteína. La función asignada se corrobora una vez realizada la anotación manual y se incluye la proteína en el banco de datos Swissprot. Anotación automática

En la predicción funcional realizada mediante anotación automática la búsqueda por similitud se complementa con información de diferentes herramientas informáticas, como el análisis de dominios, de motivos, modelado y clasificación estructural, localización celular e interactómica. Se estima que puede haber hasta un 30% de errores en la asignación funcional de los bancos de datos. Análisis de motivos y dominios Permite encontrar la aparición de mutaciones que sirven para determinar el nexo evolutivo entre proteínas. También es posible encontrar la adquisición o intercambio de dominios, lo que se denomina domain shuffling (adquisición o intercambio de dominios que originan cambios en la estructura tridimensional y que puede implicar la adquisición de nuevas funciones). Anotación funcional de proteínas Se usan términos de gene ontology. Consiste en un sistema jerárquico de vocabulario controlado organizado en 3 categorías:  Biological process. Agrupa procesos biológicos, ya sean globales o más específicos.  Molecular function. Agrupa las proteínas según su actividad bioquímica.  Cellular component. Localización subcelular. Problemas más frecuentes El primero es la presencia de secuencias de baja complejidad, es decir, proteínas con secuencias muy repetitivas que dificultan el alineamiento y la detección de patrones. El segundo es derivado de la evolución de las proteínas, especialmente cuando hay divergencia de secuencia o de función. Esto dificulta encontrar aquellos homólogos para proceder a la anotación funcional. Por último, el reemplazamiento por genes no ortólogos, el cual se define como el reemplazamiento de un gen por un equivalente funcional con diferente origen evolutivo. La aparición de este fenómeno dificulta el proceso de anotación, y es especialmente importante en las rutas metabólicas donde uno de sus componentes es reemplazado por un producto de un gen no ortólogo. Métodos experimentales para el análisis funcional de proteínas Métodos experimentales tradicionales:  Knockout. Aporta información limitada sobre su función, especialmente si el gen es esencial o si existen genes parálogos.  Perturbación parcial del sistema. Disminuir la expresión mediante el knockout de la proteína o sobreexpresar la proteína.  Identificación funcional basada en parejas de interacciones con función conocida. Métodos de proteómica funcional (saber función de las proteínas a nivel del proteoma utilizando cantidades muy pequeñas de muestra). Permiten realizar estudios en sistemas celulares o in vivo:  Protein chips o microarrays  SELDI  Activity –based probes Microarrays o protein chips Permiten el estudio masivo de la actividad de las proteínas. Son similares a los chips de DNA en cuanto a miniaturización, automatización y construcción en paralelo. Aunque la preparación de un chip de proteínas es bastante más compleja, ya que la composición química de las proteínas es mucho más variada. Esto ocasiona problemas adicionales asociados a la expresión, purificación e inmovilización de las proteínas. Tres tipos fundamentales:

 Microarray analítico Se clasifican de acuerdo a la naturaleza de la molécula utilizada para la captura, es decir, en químicos o biológicos. Suelen ser similares a las que se usan en las técnicas cromatográficas. En los chips químicos tenemos ligandos de tipo hidrofóbico, cargados, polares o iones metálicos. Los de tipo biológico se basan en la interacción entre moléculas biológicas. Pueden usar para la captura moléculas de origen proteico como anticuerpos, receptores o ligandos, pero la idea es que las moléculas utilizadas seleccionen algún tipo específico de proteínas. La aplicación de los microarrays analiticos incluye:  determinación de niveles de proteínas  caracterización de muestras proteicas (Protein profiling)  diagnóstico Una variante específica de los chips analiticos es SELDI (Surface Enhaced Laser Desorption Ionization). Combina chips analíticos de proteínas con MALDI-TOF MS. La estrategia experimental es la siguiente:  Microarray se incuba con el extracto proteico, de forma que captura las proteínas que interaccionen con el ligando específico unido a su superficie, ya sea de tipo químico o biológico  La placa del microarray, que está dividida en secciones, se somete a ionización por MALDI, teniendo en cuenta de orientar el láser de manera independiente a cada una de las secciones del microarray.  Podemos identificar las proteínas que están retenidas en cada una de dichas secciones. Detección de la masa de las proteínas (TOF). Ventajas:  Obtención de un mapa proteico de muestras múltiples  Poca cantidad de muestra (< 1ml/ 500-1000 cells) (biopsia, microdissected tissue)  Ideal para el descubrimiento de biomarcadores  Microarray de fase reversa Se utiliza para detectar proteínas específicas en una mezcla proteica, utilizando un procedimiento muy similar al del western blot o ELISA, pero a mayor escala. La mezcla de proteínas de diversas fuentes se inmovilizan en la superficie del array, y luego se incuba con anticuerpos contra la proteína de interés. Esta metodología también permite la cuantificación de proteínas, si se utilizan estándares adecuados, lo que la hace muy útil en diagnóstico. La diferencia entre el microarray analítico y el de fase de reversa es que el primero es para capturar todas aquellas proteínas que interaccionan con el ligando unido en la superficie mientras que el de fase reversa es lo contrario, se intenta detectar de una muestra de proteínas una sola.  Microarray funcional Contiene proteínas full-length inmovilizadas y el nº de estas puede abarcar todo un proteoma. Permite estudiar la actividad biológica, las interacciones con otras biomoléculas, análisis de sub-proteomas, pathways y PTMs.

Activity-based probes Sonda química que reacciona de forma específica con cierto grupo de proteínas y están formadas por tres elementos:  Warhead, responsable de la interacción específica con las proteínas de interé...


Similar Free PDFs