Из базы данных о геноме коронавируса пропала часть ранних записей
Алла Салькова
Часть ранних данных о геноме SARS-CoV-2 была удалена из общей базы, с которой работают ученые со всего мира, выяснил американский специалист. Ему удалось восстановить записи о генетических последовательностях ранних образцов коронавируса, полученных в Ухане — и эти образцы, как оказалось, отличаются от вариантов, распространившихся после.
Сами последовательности ничего не говорят о происхождении вируса, отмечает исследователь — появился ли он естественным путем или в лаборатории. Но получается, что до сих пор, изучая происхождение вируса, ученые работали с неполным набором данных, и это могло повлиять на результаты.
Благодаря генетическим последовательностям образцов коронавируса можно выяснить, как SARS-CoV-2 перешел к людям от животных, скорее всего — летучих мышей. И последовательности, полученные на ранних этапах пандемии, наиболее ценны — они позволяют максимально приблизиться к первоначальному событию распространения вируса.
Изучая данные, опубликованные различными исследовательскими группами, доктор Джесс Блум из Онкологического центра Фреда Хатчинсона наткнулся на опубликованное в марте 2020 года исследование, в котором упоминался 241 образец SARS-CoV-2, полученный учеными из Уханя. В исследовании говорилось, что генетические последовательности образцов были загружены в онлайн-базу Sequence Read Archive, управляемую Национальной медицинской библиотекой США.
Однако когда Блум захотел взглянуть на эти последовательности, ни одну из них он в базе не нашел.
Заинтересовавшись их исчезновением, он нашел еще одну работу, в которой упоминались недостающие последовательности. Выяснив, что многие последовательности находились в облачном хранилище Google Cloud, и файлы с ними имели одинаковый формат, Блум смог восстановить 13 из пропавших записей. Подробнее свой опыт он описал в статье, опубликованной на сервисе препринтов bioRxiv.
«Кажется вероятным, что последовательности удалили, чтобы скрыть их существование», — считает Блум.
Объединив эти 13 записей с уже известными, Блум выяснил, что эти образцы старше полученных в 2019 году на рынке Уханя — в них отсутствовали мутации, характерные для той линии. Подобные последовательности попадались и раньше. Это указывает на существование другой, более ранней линии коронавируса, которая не затронула рынок.
В целом же восстановленные последовательности имели больше сходств с коронавирусом летучих мышей, чем образцы с рынка.
«Возможно, наше представление о ситуации в Ухане на ранних стадиях может быть несколько некорректным», — считает он.
Национальные институты здравоохранения США подтвердили, что данные были удалены в июне 2020 года по просьбе исследователя, первоначально их предоставившего. В учреждении отметили, что то стандартная практика — генетики со всего мира обмениваются информацией в подобных базах данных с самого начала пандемии и периодически вносят изменения в собственные записи.
В свете споров о происхождении SARS-CoV-2 это вызывает вопрос — не удалил ли автор записи, чтобы что-то скрыть? Однако Блум отмечает, что обнаруженные последовательности не подкрепляют ни одну из версий.
«Это исследование не дает никаких дополнительных веских доказательств для подтверждения зоонозной или лабораторной природы вируса, — говорит он. — Скорее, оно показывает, что существуют дополнительные последовательности, относящиеся к раннему периоду пандемии, о которых до сих пор не было известно. А в некоторых образцах есть мутации, которые позволяют предположить, что эти образцы эволюционно старше вируса с рынка морепродуктов в Ухане».
«Это, безусловно, большая работа, и она многое дает для понимания происхождения SARS-CoV-2», — говорит эволюционный биолог Майкл Воробей.
Другие ученые отнеслись к выводам Блума более скептически.
«Если эти последовательности удалили, чтобы скрыть, то попытка провалилась, — считает Роберт Гэрри, профессор иммунологии Тулейнского университета. — Эти данные не дают никаких новых знаний о генетическом разнообразии SARS-CoV-2 в начале пандемии. Реальность такова, что мелкие ошибки постоянно сопровождают обмен научными данными».
«Язык работы необычен, в нем содержится много предположений и догадок, цитат сообщений из блогов, — добавляет специалист по микробному патогенезу Эндрю Престон из Батского университета в Великобритании. — Похоже, автор хотел указать на намеренное сокрытие китайскими властями ранних данных о последовательностях из Уханя. Однако это полностью субъективная оценка ситуации, которую будет очень трудно подтвердить или опровергнуть».
В целом же, работа подтверждает, что различные варианты коронавируса могли циркулировать в Ухане и до первых известных вспышек инфекции, связанных с рынком морепродуктов. Блум и другие ученые надеются, что исследователи, удалившие последовательности из базы, объяснят, зачем это сделали.
Свежие комментарии