EJ12 Alineamientos Múltiples 2022 JenniferMozoSanchez 7 BB

You might also like

Download as pdf or txt
Download as pdf or txt
You are on page 1of 17

UNIVERSIDAD POLITÉCNICA DE PUEBLA

INGENIERIA EN BIOTECNOLOGIA
BIOINFORMÁTICA

Alineamiento múltiple de secuencias.


FACILITADOR:
MARIA GABRIELA ALVARADO CASTILLO
ALUMNA:
MOZO SÁNCHEZ JENNIFER

7 - BB, Octubre 2022


Alineamiento múltiple de secuencias.
Enlace: http://www.genome.jp/tools/clustalw/

Alineamientos múltiples con secuencias de ADN

Copie las siguientes secuencias de ADN y pégalas en la casilla de clustalW como se observa en
la figura

>NR_168788.1:107-687 Penicillium lunae PPRI 25881 ITS region; from TYPE material
TCCGTAGGTGAACCTGCGGAAGGATCATTACTGAGTGCGGGCCCTCTGGGTCCAACCTCCCACCCGTGTA
TACCGTACCTTGTTGCTTCGGCGGGCCCGCCATTCTGGCCGCCGGGGGGCACCCGCCCCCGGGCCCGCGC
CCGCCGAAGACACCATTGAACGCTGTCTGAAGATTGCAGTCTGAGCGATAAGCAAAAATTAGTTAAAACT
TTCAACAACGGATCTCTTGGTTCCGGCATCGATGAAGAACGCAGCGAAATGCGATAAGTAATGTGAATTG
CAGAATTCAGTGAATCATCGAGTCTTTGAACGCACATTGCGCCCCCTGGTATTCCGGGGGGCATGCCTGT
CCGAGCGTCATTGCTGCCCTCAAGCCCGGCTTGTGTGTTGGGCGCCGTCCCCCCGGGGACGGGCCCGAAA
GGCAGCGGCGGCACCGCGTCCGGTCCTCGAGCGTATGGGGCTTTGTCACCCGCTCTGCAGGCCCGGCCGG
CGCCAGCCGACCCCATCAACCCTTTTTTTCAGGTTGACCTCGGATCAGGTAGGGATACCCGCTGAACTTA
AGCATATCAATAAGCGGAGGA
>NR_167687.1:71-640 Aspergillus keveii CBS 209.92 ITS region; from TYPE material
TCCGTAGGTGAACCTGCGGAAGGATCATTACCGAGTGCAGGTCTGCCCCCGGGCAGGCCTAACCTCCCAC
CCGTGAATACCTGACCAACGTTGCTTCGGCGGTGCGCCCCCCCGGGGGTAGCCGCCGGAGACCACATTGA
ACCTCTTGTCTTTAGTGTTGTCTGAGCTTGATAGCAAACCTATTAAAACTTTCAACAATGGATCTCTTGG
TTCCGGCATCGATGAAGAACGCAGCGAACTGCGATAAGTAATGTGAATTGCAGAATTCAGTGAATCATCG
AGTCTTTGAACGCACATTGCGCCCCCTGGCATTCCGGGGGGCATGCCTGTCCGAGCGTCATTGCTGCCCT
TCAAGCCCGGCTTGTGTGTTGGGTCGTCGTCCCCTCCGGGGGACGGGCCCGAAAGGCAGCGGCGGCACCG
CGTCCGGTCCTCGAGCGTATGGGGCTTTGTCACCCGCTCGATTAGGGCCGGCCGGGCGCCAGCCGGCGTC
TCCAACCTTTTATTTTACCAGGTTGACCTCGGATCAGGTAGGGATACCCGCTGAACTTAAGCATATCAAT
AAGCGGAGGA
>NR_168823.1:2-585 Penicillium cuddlyae PPRI 26355 ITS region; from TYPE material
TCCGTAGGTGAACCTGCGGAAGGATCATTACTGAGTGCGGGCCCTCTGGGTCCAACCTCCCACCCGTGTA
TACCGTACCTTGTTGCTTCGGCGGGCCCGCCAGTCTGGCCGCCGGGGGGCACCTGCCCCCGGGCCCGCGC
CCGCCGGAGACATCATTGAACGCTGTCTGAAGATTGCAGTCTGAGCGATAAGCACAAATTAGTTAAAACT
TTCAACAACGGATCTCTTGGTTCCGGCATCGATGAAGAACGCAGCGAAATGCGATAAGTAATGTGAATTG
CAGAATTCAGTGAATCATCGAGTCTTTGAACGCACATTGCGCCCCCTGGTATTCCGGGGGGCATGCCTGT
CCGAGCGTCATTGCTGCCCTCAAGCCCGGCTTGTGTGTTGGGCGCCGTCCCCCCGGGGACGGGCCCGAAA
GGCAGCGGCGGCACCGCGTCCGGTCCTCGAGCGTATGGGGCTCTGTCACCCGCTCTGCAGGCCCGGCCGG
CGCCAGCCGACCCCCTCAACCCTTTTTTTTTTCAGGTTGACCTCGGATCAGGTAGGGATACCCGCTGAAC
TTAAGCATATCAATAAGCGGAGGA
>NR_168425.1:71-647 Archaeospora ecuadoriana E W5337 ITS region; from TYPE
material
TCCGTAGGTGAACCTGCGGAAGGATCATTAACAAAAGCGAGTTTCTACTTTTAGATTCTTGCTAGATCAA
CCAAAACCTGTTTCTTTATTGATGTATATAAATCAAACATCACATTCATTATATAATTTAATAAAACTTT
CAACAACGGATCTCTTGGCTCTTGCATCGATGAAGAACGCAGCGAATTGCGATAAGTAGTGTGAATTGCA
GAATTCCGTGAATCATCGAATCTTTGAACGCATATTGCACTCTTTGGTATTCCGAAGAGTATACCTGTTT
GAGGGTCATTGAATAATAATAATCTTGGTTGATTAATTGATCAAGGAATAATGAGTTATCCGTTACTTAT
TTTGTATAGGTGATGGTGATTCGAAAATAATGCTGGTCTTGGCTTGTAAGAGACGCGTATTTAGGGTGGC
ATTGCCTCCAAATTTTCGCAACCATCAAGTCAATTTCGGGTAGTGCTTTTTTCAATTACTTATAAAATTG
AAGGAACCACAACAAACATTTTTTTAATCGTGACCTCAAATCAGGTAAGAGTACCCGCTGAACTTAAGCA
TATCAATAAGCGGAGGA
>NR_168165.1:1-580 Botryotrichum verrucosum CBS 116.64 ITS region; from
TYPE material
ATTACAGAGTTGCAAACTCCCTAAACCATTGTGAACGTTACCTTCAAACCGTTGCTTCGGCGGGCGGCCC
GGGTCCGCCCGGTGCCCCCTGGCCCCCTAGCGGGGCGCCCGCCGGAGGAAACCCAACTCTTGATACATTA
TGGCCTCTCTGAGTCTTCTGTACTGAATAAGTCAAAACTTTCAACAACGGATCTCTTGGTTCTGGCATCG
ATGAAGAACGCAGCGAAATGCGATAAGTAATGTGAATTGCAGAATTCAGTGAATCATCGAATCTTTGAAC
GCACATTGCGCCCGCCAGTATTCTGGCGGGCATGCCTGTTCGAGCGTCATTTCAACCATCAAGCCCCAGG
CTTGTGTTGGGGACCTGCGGCTGCCGCAGGCCCTGAAAACCAGTGGCGGGCTCGCTGTCACACCGGGCGT
AGTAGATTTTATCTCGCTCAGGGCGTGCTGCGGGTTCCGGCCGTTAAAAAGCCTTTTTTACCCAAGGTTG
ACCTCGGATCAGGTAGGAAGACCCGCTGAACTTAAGCATATCAATAAGCGGAGGAAAAGAAACCAACAGG
GATTGCCCCAGTAACGGCGA
>NR_167944.1 Claviceps truncatispora CCC 578 ITS region; from TYPE material
ATCATTACCGAGTTTACACTCCCAAACCCACTGTGAACCTTACCACAACGTTGCCTCGGCGGGATGCGTC
CCGGCACGCCCATCGCAGGGCGCCGGAACCAAGGCGGCCCGCCGGGGGACCCAAAACTCACTGTATCTCT
TGCGGCATGTCTGAGTGGATTTTACAAATGAATCAAAACTTTCAACAACGGATCTCTTGGTTCTGGCATC
GATGAAGAACGCAGCGAAATGCGATAAGTAATGTGAATTGCAGAATTCAGTGAATCATCGAATCTTTGAA
CGCACATTGCGCCCGCCAGTACTCTGGCGGGCATGCCTGTTCGAGCGTCATTTCAACCCTCAAGCCCTGC
TTGGTGTTGGGGACCGGCTCCCGGGGGCCCGCCTCGCGCGGGCGCCCCTGCCGCCCCCTAAATCGATCGG
CGGCCACGACGCGGCCCCCCCTGCGCAGTAACATACCACCTCGCAGGCGGGAGCACGCCGCGGCCACTGC
CGTAAAACGCCCAACTTCTCAAGAGTTGACCTCGAATCAGGTAGGAATACCCGCTGAACTTAAGCATATC
AATAAGCGGAGGAAAAGAAACCAACAGGGATTGCCCCAGTAACGGCGAGTGAA
>NR_166324.1:11-554 Hippopotamyces phragmitis CPC 36385 ITS region; from TYPE
material
TCCGTAGGTGAACCTGCGGAGGGATCATTACAGAGTGAGGGCCCCCGGCCCGACCTCCAACCCTTTGTGA
ACCGTCTCAGTTGCTTCGGGGGCGACCCCGCCGCTCACCCGGCGCCGGCGCCCCCGGAGACCACGAACCC
TACGTATACCTGTCGTCGGAGTTTCAATCAAATTGAACAAAACTTTCAACAACGGATCTCTTGGTTCTGG
CATCGATGAAGAACGCAGCGAAATGCGATAAGTAATGTGAATTGCAGAATTCAGTGAATCATCGAATCTT
TGAACGCACATTGCGCCCCGTGGTATTCCGCGGGGCATGCCTGTTCGAGCGTCATTGCACCACTCAAGCC
TGGCTTGGTGTTGGGCGCCGCGGAGCCGATCCGCGCGCCTCGAAGTCTTCCGGCTGAGCCGTCCGTCTCC
CAGCGTTGTGGCATCACGTCTCGCTAGGGAGCCCGGCGGCCGCGGCCGTTAAACACCCCCCACAGGTTGA
CCTCGGATCAGGTAGGGATACCCGCTGAACTTAAGCATATCAATAAGCGGAGGA
¿Puedes identificar y encerrar en un rectángulo rojo la región más conservada entre las 7
secuencias? Si , la región más conservada de las 7 secuencias es aquella región que tiene
más asteriscos (*), ya que esto significa que el mismo nucleótido se encuentra siempre en las
7 secuencias.
¿Cuántos nucleótidos continuados abarca la región más conservada? La región más
conservada es de 158 nt, es decir la región más conservada cuenta con 158 nt

El programa también puede ejecutar un procedimiento para construir un árbol evolutivo a partir de nuestros
datos. Vaya hacia abajo de la página hasta la caja que dice "Select tree menu", despliegue el menú,
seleccione la primer opción y haga click en Exec. La figura que aparece en el resultado, representa un árbol
evolutivo aproximado.

Ahora realice el mismo ejercicio pero en la siguiente página: http://www.ebi.ac.uk/clustalw/

Se despliega una página dentro del servidor del EMBL-EBI que tiene varias opciones para el alineamiento
múltiple de secuencias, la primer opción es CLUSTAL OMEGA, seleccione ésta y realice el paso número 1
que consiste en verificar que en la casilla “enter or paste a set of” esté seleccionada la opción adecuada que
en éste caso es la molécula de DNA. Pegue sus secuencias en formato FASTA.
Posteriormente en el paso número 2 hay que verificar los parámetros, primero observe que en el formato de
salida (output format) se despliega un menú con varios formatos, pero por ahora nos quedaremos con el
“clustalW con numeración de bases” esto significa que se utilizará el clustalW pero con números de la
secuencias.

Presione el botón “submit” para someter al análisis las secuencias. Los resultados aparecen como se
muestra aquí en la figura…
Obtenga una imagen de la región más larga en donde las 7 secuencias logran la identidad. Obtenga también
una imagen del árbol filogenético compárelo con el que inicialmente se obtuvo con el clustalw.

BLASTp-COBALT

En ocasiones primero necesitamos recolectar varias secuencias para después compararlas entre sí todas.
Y para ello nos puede ayudar BLAST. Ahora trabajará con la secuencia de la proteína hexokinasa de
Saccharomyces cerevisiae. Realice una búsqueda de otras secuencias parecidas mediante el BLAST, es
decir, someta al programa BLAST la siguiente secuencia
>gi|398364415|ref|NP_116711.3| hexokinase 1 [Saccharomyces cerevisiae S288c]
MVHLGPKKPQARKGSMADVPKELMDEIHQLEDMFTVDSETLRKVVKHFIDELNKGLTKKGGNIPMIPGWV
MEFPTGKESGNYLAIDLGGTNLRVVLVKLSGNHTFDTTQSKYKLPHDMRTTKHQEELWSFIADSLKDFMV
EQELLNTKDTLPLGFTFSYPASQNKINEGILQRWTKGFDIPNVEGHDVVPLLQNEISKRELPIEIVALIN
DTVGTLIASYYTDPETKMGVIFGTGVNGAFYDVVSDIEKLEGKLADDIPSNSPMAINCEYGSFDNEHLVL
PRTKYDVAVDEQSPRPGQQAFEKMTSGYYLGELLRLVLLELNEKGLMLKDQDLSKLKQPYIMDTSYPARI
EDDPFENLEDTDDIFQKDFGVKTTLPERKLIRRLCELIGTRAARLAVCGIAAICQKRGYKTGHIAADGSV
YNKYPGFKEAAAKGLRDIYGWTGDASKDPITIVPAEDGSGAGAAVIAALSEKRcIAEGKSLGIIGA
Copie la secuencia de la proteína en formato FASTA y realice un BLASTp (protein-protein)
comparando contra la base de datos nr (Non redundant protein sequences).

Revise que los parámetros del alineamiento se vean igual que la figura de aquí abajo; bajo el botón BLAST,
despliegue la opción: parámetros del algoritmo (algorithm parameters) y en max target sequences aumente a
500 el número de resultados.

En la pestaña de “descriptions”, seleccione algunas secuencias y cópielas en formato FASTA. Al comienzo de


cada alineamiento hay un pequeño cuadro de selección, quite la palomita del recuadro “select all”.
Ahora vamos a buscar varias secuencias para compararlas, la página es muy extensa y habrá que
seleccionar de acuerdo al nombre y score parecido al que le daré, ya que el score puede ir cambiando a
medida que se agregan secuencias conocidas. Seleccione el primer alineamiento (es nuestra hexoquinasa 1
con un valor de total score= 999), luego la isoenzima 2 HXK2 (score aprox. 789), más abajo una hexoquinasa
hipotética de Candida glabrata (score total aprox. 772), y otra hexoquinasa de Trichoderma citrinoviride (score
aprox 556), si no encuentra las mismas secuencias puede usar las de su elección y con éstas secuencias
seleccionadas ahora haga un alineamiento múltiple presionando la opción “multiple alignment” que se
encuentra en la parte superior derecha de la lista de microorganismos.

El programa que utiliza NCBI para realizar ésto es COBALT. Observe los resultados, primero aparece un
resultado gráfico como el de la figura de abajo, cada línea roja representa cada secuencia, para aumentar el
zoom puede presionar el botón (+)
o desplazar la barra observe que la numeración corresponde a la longitud total del alineamiento esto es=496
residuos.
Una vez con el zoom aumentado puede utilizar las flechas para desplazarse a lo largo de las secuencias.
Con el zoom aumentado casi a 100% podemos observar con detalle cuál es el aminoácido en
cada posición y podemos ubicar una región que va desde el aminoácido 256 al 258 en donde
ocurre un gap por delección en la secuencia de thichoderma.

¿Cuáles son las posiciones en donde hay sustituciones? Un ejemplo de sustitución es el de glicina
por Histidina, ya que glicina se encuentra en todas las secuencias menos en la de trichoderma ya
que se sustituye por histidina
en qué sitio hay delecciones?. En la posición 257 existe un gap, por lo tanto en la misma posición
habra una deleción.

En una sección más abajo de la revisión gráfica, se encuentra “descriptions” que contiene las cuatro
secuencias con sus correspondientes números de acceso y enlaces. Copie en formato fasta las cuatro
secuencias de proteínas, y peguelas en word. Aquí se encuentran también los parámetros del alineamiento.
Y finalmente en una tercera sección de resultados aparece el alineamiento múltiple muy parecido
a como lo presenta Clustal.

Ahora regrese a la parte superior izquierda de los resultados y obtenga el árbol


filogenético correspondiente a éste alineamiento.

Según este resultado, de un ancestro inicial (representado por un punto de color gris a la izquierda) se
habrían separado dos ramas, una que dio origen a la hexoquinasa del Trichoderma y otra que da origen al
grupo de hexokinasas de Candida y de Sacharomyces, pero en un punto de la evolución se separan en otras
dos ramas, una para hexoquinasa de Candida y la otra rama que se subdivide finalmente en las dos
secuencias de hexoquinasas de Saccharomyces. Las secuencias más próximas entre sí son las secuencias
de hexoquinasa de Saccharomyces.
Ahora repetiremos el mismo ejercicio pero con Clustal W. Acceda al vínculo de clustalW, puede ver un cuadro
donde hay que pegar las secuencias que se quieren comparar. Copie las secuencias de hexoquinasas y
péguelas en la caja del ClustalW, recuerde que debe verificar que esté seleccionada el tipo de molécula
adecuada, en este caso, proteína. En todos los casos, asegúrese que el símbolo ">" aparezca en la primera
línea de cada secuencia FASTA. En Multiple alignment parameters revise que la matriz sea BLOSUM en
“Select Weight Matrix

Obtenga el alineamiento, ¿Puede identificar y encerrar en un rectángulo rojo la región más


conservada entre las secuencias?. Sí, la region más conservada es aquella que muestra más
secuencias similitud entre las 4 secuencias, en el cas de este programa se marcan con *
Obtenga el árbol filogenético y diga ¿Cuáles son las secuencias más antiguas, es decir más
cercanas al ancestro común? El ancestro común es Trichoderma ya que es la rama del arbol
mayoritaria, así mismo es de está de la cual parten las secuencias complementarias.

¿Cuáles son las secuencias más parecidas entre sí? Las secuencias más parecidas entre sí es la
de 2 y 3, es decir la secuencia de candida y sacharomyces 1
Ejercício

Realice otro alineamiento con las anteriores 4 secuencias de proteína pero además agregaremos otras que
ya no aparecen en la lista de BLAST, y cuya secuencia está en el texto más adelante, son: una hexoquinasa
de Aspergillus lentulus(score aprox. 555), una hexoquinasa de Neurospora (score 407), una hexoquinasa de
Drosophila (score 254), una hexoquinasa de Trypanosoma (score 250), y una glucoquinasa de Rattus (score
241). Observe que a cada secuencia le dejamos solamente parte del nombre para que resulte fácil después
identificar el organismo del cual provienen dentro del alineamiento y del árbol filogenético, si no hacemos
esto, el programa colocará el número de acceso de cada secuencia dificultando su identificación a simple
vista.
A continuación le presento las secuencias (las cuatro iniciales) y las añadidas que se utilizarán
puede copiarlas todas desde aquí y someterlas al clustal omega (también al clustalW):
>Saccha1
MVHLGPKKPQARKGSMADVPKELMDEIHQLEDMFTVDSETLRKVVKHFIDELNKGLTKKGGNIPMIPGWV
MEFPTGKESGNYLAIDLGGTNLRVVLVKLSGNHTFDTTQSKYKLPHDMRTTKHQEELWSFIADSLKDFMV
EQELLNTKDTLPLGFTFSYPASQNKINEGILQRWTKGFDIPNVEGHDVVPLLQNEISKRELPIEIVALIN
DTVGTLIASYYTDPETKMGVIFGTGVNGAFYDVVSDIEKLEGKLADDIPSNSPMAINCEYGSFDNEHLVL
PRTKYDVAVDEQSPRPGQQAFEKMTSGYYLGELLRLVLLELNEKGLMLKDQDLSKLKQPYIMDTSYPARI
EDDPFENLEDTDDIFQKDFGVKTTLPERKLIRRLCELIGTRAARLAVCGIAAICQKRGYKTGHIAADGSV
YNKYPGFKEAAAKGLRDIYGWTGDASKDPITIVPAEDGSGAGAAVIAALSEKRIAEGKSLGIIGA
>Saccha2
MVHLGPKKPQARKGSMADVPKELMQQIENFEKNFTVPTETLQAVTKHFISELEKGLSKKGGNIPMIPGWV
MDFPTGKESGDFLAIDLGGTNLRVVLVKLGGDRTFDTTQSKYRLPDAMRTTQNPDELWEFIADSLKAFID
EQFPQGISEPIPLGFTFSFPASQNKINEGILQRWTKGFDIPNIENHDVVPMLQKQITKRNIHIEVVALIN
DTTGTLVASYYTDPETKMGVIFGTGVNGAYYDVCSDIEKLQGKLSDDIPPSAPMAINCEYGSFDNEHVVL
PRTKYDITIDEESPRPGQQTFEKMSSGYYLGEILRLALMDMYKQGFIFKNQDLSKFDKPFVMDTSYPARI
EEDPFENLEDTDDLFQNEFGINTTVQERKLIRRLSELIGARAARLSVCGIAAICQKRGYKTGHIAADGSV
STRYPGFKEKAANALKDIYGWTQPHLDDYPIKVVPAEDGSGPGAAVIAALAQKRIAEGKSVGIIGA
>Candida
MVHLGPKKPPTRKGSMVDMPQQLLDQIKVFEEMYTVDGETLRKVTKHFITELDKGLSKKGGNIPMIPGWV
MEYPSGKEKGDYLAIDLGGTNLRVVLVKLGGDRTFDTTQSKYKLPEAMRTTKNHEELWSFIADSLQAFLE
DQFPEGVKGKLPLGFTFSYPASQDRINQGVLQRWTKGFDIPNVEGHDVVPMLQKQIEKRNLPIDIVALIN
DTTGTLVASLYTDGETKMGVIFGTGVNGAYYDVVSDIPKLEGKLADDIPSDSPMAINCEYGSFDNEHVVL
PRNKYDLIIDEESPRPGQQAFEKMSSGYYLGEMLRLALLDLYDQGLILKGQDISKLKKPYVMDTSYPSKI
EDDPFENLEDTDELLQKNLGIQTTVQERKLIRRLCELIGTRSARLSVCGIAAICQKRGYETAHIAADGSV
FKMYPGFKEKAAQGLADIYGWEHKDPKDCPIVIVDAEDGSGAGAAIIAALAEKRIAEGKSLGVLGA
>Tricho
MVGLGPRPPPSRKGSTADLPKDLLNEVRKLEEIFTVDTAKLKQITDHFVNELAKGLSVEGGSIPMNPTWV
MAYPDGHETGSFLALDMGGTNLRVCEITLTDRKSEFDIIQSKYRMPEELKTGSSEELWEYIADCLHQFIE
THHGDCSKLDAMPLGFTFSYPATQHYIDEGILQRWTKGFDIAGVEGQNVVPMFEAAIAKRGVPIKLSALI
NDTTGTLIASAYTDPKVKIGCIFGTGCNAAYMEDCGSIPKLAHMNLPPDCPMAINCEWGAFDNEHKVLPR
TKYDIAIDEDSPRPGQQAFEKMIAGLYLGEIFRLVLVDLHDNKEIHIFENQDISLLRRPYTLDSSFLSGI
EEDPFENLQETFDTFQSKLNITPTGPELELVRRLAELIGTRAARLSACGVAAICKKKKFESCHVGADGSV
FNKYPHFKARGAQALREILDWPAKSNPKEEDPVEILAAEDGSGVGAALIAALTLKRAKAGNLAGILHPEN
FV
>ASPerg
MVHLGPKKPQARKGSMADVPKELMQQIENFEKNFTVPTETLQAVTKHFISELEKGLSKKGGNIPMIPGWV
MDFPTGKESGDFLAIDLGGTNLRVVLVKLGGDRTFDTTQSKYRLPDAMRTTQNPDELWEFIADSLKAFID
EQFPQGISEPIPLGFTFSFPASQNKINEGILQRWTKGFDIPNIENHDVVPMLQKQITKRNIPIEVVALIN
DTTGTLVASYYTDPETKMGVIFGTGVNGAYYDVCSDIEKLQGKLSDDIPPSAPMAINCEYGSFDNEHVVL
PRTKYDITIDEESPRPGQQTFEKMSSGYYLGEILRLALMDMYKQGFIFKNQDLSKFDKPFVMDTSYPARI
EEDPFENLEDTDDLFQNEFGINTTVQERKLIRRLSELIGARAARLSVCGIAAICQKRGYKTGHIAADGSV
STRYPGFKEKAANALKDIYGWTQPHLDDYPIKVVPAEDGSGPGAAVIAALAQKRIAEGKSVGIIGA
>Neuros
MVHLGPKKPQARKGSMADVPKELMQQIENFEKNFTVPTETLQAVTKHFISELEKGLSKKGGNIPMIPGWV
MDFPTGKESGDFLAIDLGGTNLRVVLVKLGGDRTFDTTQSKYRLPDAMRTTQNPDELWEFIADSLKAFID
EQFPQGISEPIPLGFTFSFPASQNKINEGILQRWTKGFDIPNIENHDVVPMLQKQITKRNIHIEVVALIN
DTTGTLVASYYTDPETKMGVIFGTGVNGAYYDVCSDIEKLQGKLSDDIPPSAPMAINCEYGSFDNEHVVL
PRTKYDITIDEESPRPGQQTFEKMSSGYYLGEILRLALMDMYKQGFIFKNQDLSKFDKPFVMDTSYPARI
EEDPFENLEDTDDLFQNEFGINTTVQERKLIRRLSELIGARAARLSVCGIAAICQKRGYKTGHIAADGSV
STRYPGFKEKAANALKDIYGWTQPHLDDYPIKVVPAEDGSGPGAAVIAALAQKRIAEGKSVGIIGA
>Drosoph
MVHLGPKKPQARKGSMADVPKELMQQIENFEKIFTVPTETLQAVTKHFISELEKGLSKKGGNIPMIPGWV
MDFPTGKESGDFLAIDLGGTNLRVVLVKLGGDRTFDTTQSKYRLPDAMRTTQNPDELWEFIADSLKAFID
EQFPQGISEPIPLGFTFSFPASQNKINEGILQRWTKGFDIPNIENHDVVPMLQKQITKRNIPIEVVALIN
DTTGTLVASYYTDPETKMGVIFGTGVNGAYYDVCSDIEKLQGKLSDDIPPSAPMAINCEYGSFDNEHVVL
PRTKYDITIDEESPRPGQQTFEKMSSGYYLGEILRLALMDMYKQGFIFKNQDLSKFDKPFVMDTSYPARI
EEDPFENLEDTDDLFQNEFGINTTVQERKLIRRLSELIGARAARLSVCGIAAICQKRGYKTGHIAADGSV
YNRYPGFKEKAANALKDIYGWTQTSLDDYPIKIVPAEDGSGAGAAVIAALAQKRIAEGKSVGIIGA
>Ratt
MVHLGPKKPPTRKGSMVDMPQQLLDQIKVFEEMYTVDGETLRKVTKHFITELDKGLSKKGGNIPMIPGWV
MEYPSGKEKGDYLAIDLGGTNLRVVLVKLGGDRTFDTTQSKYKLPEAMRTTKNHEELWSFIADSLQAFLE
DQFPEGVKGKLPLGFTFSYPASQDRINQGVLQRWTKGFDIPNVEGHDVVPMLQKQIEKRNLPIDIVALIN
DTTGTLVASLYTDGETKMGVIFGTGVNGAYYDVVSDIPKLEGKLADDIPNDSPMAINCEYGSFDNEHVVL
PRNKYDLIIDEESPRPGQQAFEKMSSGYYLGEMLRLALLDLYDQGLILKGQDISKLKKPYVMDTSYPSKI
EDDPFENLEDTDELLQKNLGIQTTVQERKLIRRLCELIGTRSARLSVCGIAAICQKRGYETAHIAADGSV
FKMYPGFKEKAAQGLADIYGWEHKDPKDCPIVIVDAEDGSGAGAAIIAALAEKRIAEGKSLGVLGA

Observe los resultados, y oprima “show colors” para que los aminoácidos se pinten de diferente color.
¿Puede identificar y encerrar en un rectángulo rojo la región más conservada entre las
secuencias? Sí, la region más conservada es aquella que muestra más secuencias similitud
entre las 8 secuencias, en el cas de este programa se marcan con *
Obtenga el árbol filogenético y diga ¿Cuáles son las secuencias más antiguas, es decir más cercanas
al ancestro común? Las secuencias más antiguas, o el ancestro en común es ASperg 0, ya que es la
rama más larga o antigua y de ella sobreeaslen las demas, así mismo también ets Drosoph0.00359

¿Cuáles son las secuencias más parecidas entre sí? La secuencias más parecidas entre sí, son
Candida y ratt, así mismo saccha2 y neuros

You might also like