Passo-a-Passo da Bioinformática PDF

Title Passo-a-Passo da Bioinformática
Course Bioinformática
Institution Universidade Federal do Ceará
Pages 4
File Size 114.2 KB
File Type PDF
Total Downloads 71
Total Views 119

Summary

Download Passo-a-Passo da Bioinformática PDF


Description

Bioinformática • Desenho de Primers Específicos Primers específicos podem ser empregados para a amplificação a região codante de um gene ou para avaliar a expressão gênica por PCR em tempo real. Procedimento 1. Inicialmente pegar a sequência .FASTA do cDNA no NCBI através do número de série da proteína. Pode acontecer de essa sequência já ser informada na própria questão. 2. Anotar as regiões que compõem a sequência (Códon de Início – ATG; Códon de Parada – TAA, TAG ou TGA; UTRs 5’ e 3’) com o auxílio do ExPASy • Por isso é importante saber como fazer anotação. 3. Com o PearlPrimer aberto, na aba Standard PCR, copiar a sequência de cDNA completa (UTRs e ORF) para a caixa sequence. 4. Delimitar as regiões de início e fim da UTRs com auxílio do contador de caracteres e preencher a guia Amplified range. a. A primeira UTR, geralmente começa no início da sequência (5’1-?), você deve selecionar a partir do primeiro nucleotídeo e contar os caracteres até o nucleotídeo anterior ao ATG de início da ORF. Supondo que esse último nucleotídeo contabilize 124 nucleotídeos, a 5’ UTR irá do nucleotídeo 1 ao 124. Da mesma forma, faz-se com o lado 3’, tomando-se muito cuidado na contagem. 5. Ajustar os demais parâmetros: a. Primer Tm: 55-65 °C Difference 2 ou 3° C b. Primer Lenght: 19-23 ou 18-24 c. Options: assinalar “Exclude %GC” e “GC clamp” 6. Clicar em Find Primers (Os resultados aparecerão na guia Results na forma de uma lista com Primers Forward e Reverse) a. Não atentaremos para as análises de Tm e Formação de Dímeros. 7. Escolher um par de Primers (Não há um consenso sobre como escolher o melhor par dentre todos os gerados, eu acabo olhando o tamanho e a cobertura dele na sequência – aparece embaixo dos resultados, na forma de uma linha com a marcação das UTRs e os Primers como setinhas em vermelho) 8. Identificar/Anotar os Primers na sequência do cDNA e determinar o tamanho do amplicon, selecionando desde o primeiro nucleotídeo do primer forward até o último nucleotídeo do primer reverse e aplicar o contador de caracteres. a. O reverse primer, como será utilizado na fita complementar ao cDNA que usamos precisa ser transformado através de reverso complemento para poder ser marcado na nossa sequência. i. Qualquer software para realizar reverso complemento, facilmente encontrado se pesquisar no Google, pode ser empregado.

Análise dos Primers 1. As análises de Primers são realizadas através do OligoAnalyzer (https://www.idtdna.com/calc/analyzer). Nessa plataforma online você pode aplicar a sequência do primer na caixa sequence e selecionar a análise que você deseja realizar. 2. Em Analyze, os resultados apresentados serão os de comprimento (lenght), GC contente e Melting Temperature (Tm). a. GC content, deve estar entre 40-60% para ser considerado bom e acima disso, excelente b. Comprimento geralmente indica-se estar dentro da faixa 18-24 nucleotídeos. c. Temperatura de Melting deve estar na faixa 50-65 °C e a diferença entre as Tm dos dois Primers deve ser de no máximo 5 °C, sendo o ideal de apenas 2-3 °C. 3. Em Hairpin é verificada a formação de grampos. Como resultados, são apresentadas estruturas numeradas com valores de ΔG e Tm. a. O ideal é que não haja formação de grampos, mas aceita-se que hajam essas estruturas até 35 °C (faixa de 30 °C abaixo da Tm do Primer) o que possibilita que sejam desfeitos até a Tm do Primer ser atingida.

b. Valores para ΔG são ideais até -2 kcal/mol. Valores menores são ruins pois tornam a formação de grampos mais espontânea. 4. Em Self-Dimer são apresentadas as possibilidades de formação de dímeros entre dois primers iguais. a. Da mesma forma que nos grampos, a espontaneidade de formação de estruturas secundárias é crucial. Para Homodímeros, os valores ideais de ΔG tem que ser maiores que -6 kcal/mol. Valores menores, indicam maior probabilidade de formação e dificultam o processo de Anelamento. 5. Em Hetero-Dimer é averiguada a formação de dímeros entre os dois primers (forward e reverse). Quando se clica na opção, abre-se uma caixa para a inserção do outro primer, em sua sequência normal (sem reverso complemento!) a. Como o que acontece em homodímeros, os valores de ΔG tem que ser maiores que -6 kcal/mol. É importante apresentar todos esses resultados na prova. Mesmo que o par de primers que você escolheu da coleção que o PearlPrimer gerou nãos seja o melhor, hoje, foi dito pelo professor que o importante era avaliarmos o par de primers e explicitar suas vantagens e defeitos para o processo de amplificação de sequências. Para primers a serem aplicados em PCR quantitativa 1. Guia Real-time PCR 2. Ajuste de Parâmetros: a. Primer Tm: 55-65 °C Difference 2 °C b. Primer lenght: 19-23 bases c. Amplicon size: 80-200 bases d. Desmacar “Span intron/exon boundary” e “Overlap intron/exon boundary by # bases” 3. A sequência de cDNA em destaque na questão deve ser aplicada em ambas as caixas Genomic sequence e mRNA sequence 4. O restante segue os mesmos princípios anteriores. Não nos foi cobrado, na quarta-feira, o desenho de primers para PCR quantitativa • Modelagem Molecular

1.

2.

3.

4.

Preparação dos Arquivos Partindo-se da sequência ou organismo disponível, faz-se uma busca no BLASTp por moldes que possam ser empregados na modelagem da estrutura (Aplicar a sua sequência e na aba Database, restringir a busca para o banco de dados do PDB). Ao encontrar um molde com mais de 30% de identidade (a partir de 25% é aceitável) e com E-value o mais negativo possível, deve-se clicar sobre a sequência e ver o alinhamento realizado no BLAST. Lá, embaixo do nome da sequência há o Sequence ID, que é o código de acesso para a proteína que será o molde para o seu modelo ser gerado. Copiar o código de acesso e manter o alinhamento aberto. a. Se for dada uma sequência específica, pode-se aplicar diretamente no BLASTp, caso sejam dados um organismo e uma proteína específica, deve-se ir no NCBI e fazer um busca por nome da espécie e proteína. Será aberta uma página que mostra os bancos de dados e quantidade de resultados. Nessa página, clicar em Protein e buscar o seu resultado dentre os apresentados. Escolhido um resultado, na página que abrir em seguida, abrir o arquivo FASTA e copiar a sequência de aminoácidos. No arquivo .ali, ao lado de P1, coloca-se o nome da sequência que busca-se modelar. Após “sequence:”, da mesma forma, coloca-se o nome da sequência e copia-se o a parcela do alinhamento referente ao query. a. Você deve copiar as linhas do alinhamento que estão ao lado do nome query e substituir as que estão no arquivo, sem excluir o asterisco do final. Na segunda metade do arquivo, repete-se o procedimento, agora considerando-se o molde usado. Após P1 e “sequence”, coloca-se o código de acesso. Na mesma linha, colocar os valores de início e final da sequência do subject apresentadas no alinhamento do BLAST. Salve o arquivo com o nome da sequência que busca-se modelar e .ali no final. a. Lembrar que durante o salvamento, é importante selecionar na aba abaixo do nome que será dado ao arquivo a opção “todos os arquivos” para que possa ser salvo no formato correto. No arquivo .py, em “alnfile=” digita-se o nome do arquivo salvo como .ali. Em “knows=” digita-se o código de acesso do molde usado. Após “sequence” o nome da sequência que se busca modelar. Após “ending-model”

colocar a quantidade de modelos a serem gerados pelo Modeller (geralmente 200 ou 250). Salve o arquivo com nome da sequência que busca-se modelar e .py no final Teste dos Arquivos Tenha os três arquivos (.ali, .py e proteína molde) em uma mesma pasta no desktop. 1. Abrir o Modeller 9.15 (Não há um programa específico, você abre a aba de pesquisa do menu iniciar e pesquisa modeller que aparece) 2. Seguir os seguintes passos para encontrar a pasta onde os arquivos estão. a. Digite: cd.. (aperte enter) b. Digite: cd.. (aperte enter) c. Digite: cd users (aperte enter) d. Digite: dir (aperte enter) e. Digite: cd “nome de usuário do seu computador” (aperte enter) f. Digite: dir (aperte enter) g. Digite: cd “local onde está a parta com os três arquivos – Desktop” (aperte enter) h. Digite: dir (aperte enter) i. Digite: cd “nome da pasta com os três arquivos” (aperte enter) j. Digite: mod9.15 “nome do seu arquivo .py”.py (aperte enter) Caso apareça 'import site' failed; use -v for traceback, sua luta chegou ao fim e os seus modelos serão gerados • Estudos de Proteômica Softwares encontrados na aba Proteomics do site ExPASy 1. Predição de topologias e localização subcelular: Topology prediction a. TargetP b. PSORT (PSORT II --- PSORTII Prediction) 2. Modificações pós-traducionais em proteínas a. ChloroP (Caso a proteína seja endereçada ao Cloroplasto) b. MitoProt (Caso a proteína seja endereçada à Mitocôndria) i. Nessas ferramentas é importante atentar para a sequência a ser clivada da proteína para que ela possa ser considerada madura. Essa sequência é uma parte da sequência que aplicamos no software e ela é apresentada em ambos os programas como “Cleavage sequence” ou termos semelhantes. 3. Análise de estrutura primária de proteínas (Geralmente é cobrado para proteínas maduras) a. compute pI/MW tool 4. Predição de estruturas secundárias em proteínas a. GOR b. Nnpredict • Estudos de Filogenia Programa MEGA 1. Caso seja dado um arquivo com uma série de sequencias gênicas para serem comparadas por filogenia, tenha certeza que seu arquivo está em formato .FASTA, caso não, copie as sequencias dele para o bloco de notas e salve como formato .FASTA (Lembre-se de selecionar a opção “todos os documentos”) 2. Com o programa MEGA aberto, selecionar na guia Align a opção Edit/Build na Alignment, Create a New Alignment e então determinar qual o tipo de dados você está aplicando no Programa. (DNA ou Proteínas). 3. Na janela aberta, na guia Edit, selecione Insert Sequence from File e escolha o arquivo com as sequências a serem alinhadas. 4. Após as sequências serem abertas, selecione todas (Ctrl+A) e depois o ícone “ W” para alinhá-las com ClustalW. Na janela aberta, não há necessidade de mexer nos parâmetros, apenas selecionar BLOSUM em Protein Weight Matrix, que vem a ser a melhor matriz para alinhamento de proteínas (segundo o professor). Aguarde o alinhamento ser realizado 5. Seguindo, exporte o alinhamento para o formato MEGA. a. DATA > Export Alignment > MEGA format (.MEG)

6. De volta a janela inicial do MEGA, na guia Data, selecione Open a File/Session e abra o arquivo gerado no formato MEGA 7. Para reconstruir a árvore filogenética baseada no alinhamento feito: a. Analysis > Phylogeny > Construct/Test Neighbor-Joining Tree (Método mais rápido e “seguro”) b. Em Test of Phylogeny, selecionar Bootstrap Method e em No. of Bootstrap Replications colocar 1000. c. Model/Method em Poisson Model e Gaps/Missing Data Treatment em Complete Deletion 8. Após a geração da árvore filogenética, avaliar questões de homologia, ortologia e paralogia entre as sequencias dadas ao programa, apresentar tanto a árvore criada quanto suas observações quanto as relações genéticas entre as sequências. • Estudos de Estruturas no PyMol Determinação de origem, função, estruturas secundárias e formação e pontes dissulfeto. 1. Caso seja dada uma estrutura de proteína, abra ela no PyMol. Na lateral direita, na letra H escolha everything para a esconder toda a estrutura. Na letra S, escolha cartoon para a proteína ser mostrada em conformações de a-hélices e folhas B. 2. Na extremidade inferior direita, há um quadro de opções, selecione o S e aparecerá, acima da estrutura apresentada, a sequência de aminoácidos que compõem a proteína. Anote cerca de 20-30 desses aminoácidos em ordem e realize um BLASTp com a sequência. (Na guia database, selecionar Non-redundant protein sequences e na guia Algorithm, marcar Quick BLASTp. Após selecionar o melhor alinhamento, clicar na opção GenBank para ser encaminhado ao site e observar qual a espécie animal da qual a proteína originou-se 3. Na letra C, selecionar color by ss e avaliar a estrutura secundária e a predominância de a-hélices, folhas B ou voltas. 4. Selecionar Hide everything novamente e, em seguida, na letra S, a opção dissulfides para mostrar apenas as pontes dissulfeto formadas na estrutura da proteína. Selecionar as extremidades de cada uma das pontes e, na letra L, selecionar residues para ver os aminoácidos responsáveis por formar tais ligações. 5. Apresente os a aminoácidos formadores de pontes....


Similar Free PDFs