Sofía Samper (investigadora principal) y Jessica Comín (investigadora predoctoral), del grupo de investigación del IACS “Epidemiología molecular de la tuberculosis”, revisan los estudios de los primeros análisis genómicos del SARS-CoV-2 para trazar la evolución del virus, desde el más ancestral hasta el virus del linaje europeo, y su introducción en los distintos países desde el inicio del brote

27 de abril 2020.- La epidemiología molecular se apoya en los cambios que ocurren en el genoma de los microorganismos para determinar la evolución de los mismos y, de esta manera, poder visualizar la trazabilidad de la enfermedad. La secuencia del RNA del virus SARS-CoV-2, causante de la pandemia de COVID-19, tiene pocos sitios variables en su genoma, esto es, sitios que acepten mutación, por lo que es posible seguir su evolución analizando esos sitios variables.

Hemos revisado los estudios de los primeros análisis genómicos del SARS-CoV-2. El primero de ellos [1], que analiza muestras procedentes de China, reveló dos genotipos principales, denominados Tipo I y Tipo II, que se diferenciaban entre sí por la base nitrogenada que tenían en dos posiciones del genoma (8750 y 28112). Además, el Tipo I a su vez se subdividía en Tipo IA y Tipo IB en función de la base que tuvieran en la posición 29063. Todos ellos han sido aislados en humanos. El Tipo I presentaba los mismos alelos que el coronavirus de murciélago filogenéticamente más relacionado con el coronavirus humano.

Por tanto, se piensa que el Tipo IA sería el virus más ancestral, que evolucionó adquiriendo la mutación en la posición 29063 para dar el Tipo IB, que a su vez evolucionó adquiriendo dos nuevas mutaciones en las posiciones 8750 y 28112 para dar lugar al Tipo II. Los autores también observaron que ninguna de las muestras analizadas procedentes del mercado de Wuhan correspondían al Tipo I, sino que todas eran del Tipo II, por lo que el salto a los humanos parecería que no tuvo lugar en el mercado de Wuhan, sino que se produjo antes, en otro lugar de Wuhan, y habría sido provocado por el Tipo IA. También se observó que el Tipo II estaba más representado en las muestras aisladas de los pacientes. Pudo comprobarse que las dos mutaciones encontradas en las posiciones 8750 y 28112, aunque eran sinónimas, producían un aumento en la eficacia de traducción, dado que los nuevos codones generados tenían más tRNA en el genoma humano que los codones previos, lo que conlleva una mayor traducción, mayor síntesis de partículas virales y, potencialmente, más contagio.

Un artículo más reciente [2], en el que se incluyen genomas a nivel global, identifica un nuevo genotipo principal, el linaje C, separado de los demás por una nueva mutación no sinónima en la posición 26144, que sería el predominante en Europa, aunque también presente en otras partes del mundo.

 

Figura 1. Evolución de los linajes virales del SARS-CoV-2 según los dos artículos explicados arriba. En verde se indican los linajes y mutaciones encontrados por [1]. En azul se encuentran los linajes y mutaciones encontrados por [2]. La no coincidencia en los puntos de las mutaciones se debe al uso de genomas de referencia diferentes.

 

La filogenia en tiempo real que se realiza en Nextstrain [3] permite seguir la evolución desde el comienzo del brote. Nextstrain es un proyecto de código abierto para aprovechar el potencial científico y de salud pública de los datos del genoma del SARS-CoV-2, que incorpora los genomas de SARS-CoV-2 tan pronto como se comparten. Actualiza los datos disponibles públicamente junto con potentes herramientas analíticas y de visualización para uso de la comunidad con el objetivo de mejorar la respuesta al brote. En este momento ya hay 3123 genomas de aislados secuenciados en distintos países afectados, desde diciembre de 2019.

Los genomas revelan que el virus tuvo que originarse en Wuhan a finales de noviembre o principios de diciembre. Durante el segundo mes del brote, ya se produjeron introducciones del virus en otros países del mundo, y aunque se piensa que la mayoría de estos casos no produjeron transmisión local, se tiene la certeza de que al menos tres tuvieron que transmitirse provocando posteriormente los grandes brotes europeo, norteamericano y el de Oceanía.

Durante este periodo ya estaba en circulación el virus europeo ancestral, separado filogenéticamente del virus asiático originado en China, que circulaba sin vigilancia desde finales de enero o principios de febrero. Lo mismo se aplica al virus norteamericano ancestral. Durante el tercer mes de la pandemia, los brotes europeo y norteamericano crecieron y se observaron ya introducciones en el hemisferio sur.

Al estudiar estos genomas, se ve que las muestras agrupan en diferentes clados del árbol, lo que significa que la introducción en estos países se ha producido desde múltiples fuentes.

Finalmente, el ciclo se cierra con las reintroducciones en Asia, donde de nuevo están teniendo casos importados. Al estudiar estos genomas se observa que pertenecen a los clados de virus europeo y norteamericano más que al asiático, lo que concuerda con la importación de los casos desde los lugares en los que los brotes están activos actualmente. 

Con respecto a España, los genomas de pacientes secuenciados agrupan tanto con el virus del linaje europeo como del asiático, lo que implica múltiples introducciones del virus en España desde diferentes regiones.

[1] https://doi.org/10.1101/2020.02.25.20027953

[2] Forster P et al., Phylogenetic network analysis of SARS-CoV-2 genomes, Proc Natl Acad Sci U S A. 2020 Apr 8. pii: 202004999. doi: 10.1073/pnas.2004999117.

[3] nextstrain.org/

 

Contacto: ssamper.iacs@aragon.es

 

#EsteVirusLoParamosUnidos