La falta de datos genéticos sobre el COVID puede frenar el hallazgo de la próxima variante
Si algo aprendió la comunidad científica del SARS-CoV-2, el coronavirus que causa la enfermedad COVID-19, es que el virus muta y se adapta para sobrevivir a fuerza de incrementar su contagio.
Su código genético fue cambiando lentamente a medida que se propaga de persona a persona por todo el mundo. Durante la mayor parte de ese tiempo, las mutaciones no parecían significativas en cuanto a la peligrosidad del virus. Algunas de esas mutaciones incluso debilitan el virus.
Sin embargo, aparecieron variantes que sí merecieron atención. Algunas son clasificadas como de interés y otras de preocupación por su mayor transmisibilidad o por la posibilidad de que aumente la cantidad de casos que requieran hospitalización o reduzcan la eficacia de vacunas y tratamientos.
Para detectar esos cambios, se han creados plataformas internacionales que posibilitan compartir los datos genéticos que se descubren del coronavirus para detectar las nuevas variantes que puedan surgir.
Pero varios científicos han advertido en el último tiempo que las lagunas en los datos del genoma podrían obstaculizar la búsqueda de la próxima variante de COVID. La secuenciación de los genomas del SARS-CoV-2 ha ayudado a los investigadores a rastrear cómo evoluciona el virus, pero muchos países no comparten todos sus datos.
Lo que ocurre, es que muchos países que secuencian los genomas del SARS-CoV-2 comparten solo una fracción de ellos en repositorios públicos, y muchas secuencias carecen de información importante, según un análisis global de vigilancia genómica. Pero el estudio también encontró que a pesar de estos desafíos, los países se han vuelto más rápidos para compartir secuencias en el transcurso de la pandemia
Compartir abiertamente datos de secuenciación del genoma de muestras de SARS-CoV-2 ha permitido a los investigadores rastrear cómo evoluciona el virus y se ha convertido en un sello distintivo de la pandemia. Pero a los investigadores les preocupa que las brechas en los datos puedan dificultar la detección de la próxima variante preocupante de COVID-19 y podrían frustrar los esfuerzos para responder a ella rápidamente.
En un estudio publicado en Nature Genetics esta semana, investigadores recopilaron datos genómicos cargados en repositorios públicos, incluido GISAID, entre el comienzo de la pandemia y el 31 de octubre de 2021, que comprenden aproximadamente 4,9 millones de genomas de 169 países.
Compararon esas secuencias con informes oficiales de países individuales y encontraron que de 62 países que informan esos datos, 23 (más de un tercio) habían subido menos del 50 % de sus secuencias de las variantes de interés Alfa, Beta, Gamma y Delta. Alrededor de una cuarta parte de los países había subido menos del 25% de sus secuencias.
“La falta de intercambio es un problema global. No es solo una cuestión de país rico o pobre”, afirmó el coautor Andrew Azman, epidemiólogo de enfermedades infecciosas de la Universidad Johns Hopkins en Baltimore, Maryland.
Castigar la transparencia
Los autores sugieren varias razones por las que algunos países podrían no compartir todas sus secuencias en repositorios públicos. “Es posible que algunas de las muestras no hayan sido secuenciadas en primer lugar, porque hay formas de identificar variantes preocupantes sin secuenciar los genomas completos”, dice Azman. “Y dependiendo de la tecnología de secuenciación que hayan utilizado los investigadores, algunas muestras probablemente no tenían la calidad suficiente para cargarlas”, explicó Cynthia Saloma, bióloga molecular de la Universidad de Filipinas Diliman en Quezon City.
Pero una parte de las secuencias no compartidas probablemente se retenga por razones políticas, incluidas las repercusiones de ser el primer país en informar una nueva variante de preocupación. “La mayoría de los países que comparten esos datos suelen sufrir por ello”, indicó Nnaemeka Ndodo, bioingeniero molecular del Centro de Control de Enfermedades de Nigeria en Abuja. Por ejemplo, cuando investigadores en Sudáfrica y Botswana alertaron al mundo sobre la variante Ómicron en noviembre pasado, una gran cantidad de países respondieron cerrando sus fronteras a la región.
En algunos países, los gobiernos deben revisar y aprobar las secuencias antes de cargarlas. Los gobiernos de las naciones dependientes del turismo “podrían pedir a sus laboratorios que no compartan los datos debido al impacto que tendrá”, dijo Malavige. Pero Azman afirma que el intercambio de datos es solo una parte de la historia. Algunos países comparten una gran proporción de sus muestras, pero solo han secuenciado un puñado de genomas, dice.
Los investigadores encontraron que 87 países secuenciaban muestras de forma rutinaria, pero 31 no lo hacían, y el equipo no pudo encontrar información sobre las estrategias de vigilancia genómica para otros 76. A nivel mundial, no más del 4,5 % de los casos confirmados de COVID-19 se secuenciaban cada semana desde de septiembre de 2020 en adelante, con grandes discrepancias entre regiones, de un total de 3,4 % de genomas secuenciados en Europa durante el período de estudio a 0,1 % en el Mediterráneo oriental. Algunos países, incluidos Noruega, el Reino Unido y Canadá, han secuenciado al menos el 10% de sus casos acumulados.
Datos sobre datos
El estudio también evaluó la calidad de los metadatos cargados en GISAID por 169 países. Encontró que el 63% de las secuencias no incluían información sobre la edad y el sexo de la persona de la que se tomaron muestras, y más del 95% carecía de información clínica como la gravedad de los síntomas y el estado de vacunación de la persona infectada. Los países de ingresos más altos tendían a proporcionar menos metadatos que las regiones de ingresos más bajos.
Los metadatos son especialmente importantes cuando surge una nueva variante, para evaluar quién está en mayor riesgo, qué tan bien funcionarán las vacunas y los medicamentos existentes y las condiciones que podrían haber llevado a su aparición, dicen los investigadores.
Nuevamente, podría haber muchas razones para las brechas de información, como preocupaciones sobre la privacidad de los datos, y que la recopilación de metadatos no puede seguir el ritmo de las muestras que se secuencian. A veces, a una muestra le pueden faltar metadatos pero proviene de una provincia remota, por lo que es demasiado valiosa para no compartirla, dijo Nino Susanto, un bioingeniero que dirige el laboratorio de pruebas de COVID-19 GSI Lab en Yakarta.
A pesar de los desafíos para compartir datos, el estudio también encontró que los países se han vuelto más rápidos para compartir secuencias durante la pandemia. En 2020, los investigadores de la mayoría de los países tardaron cerca de tres meses, en promedio, en recopilar, secuenciar y cargar datos genómicos en repositorios públicos (consulte Aceleración). Sin embargo, eso se redujo a 20 días cuando surgió la variante Delta en 2021.