Машинное обучение помогло диагностировать рак по ДНК микроорганизмов в крови
Друзья, с момента основания проекта прошло уже 20 лет и мы рады сообщать вам, что сайт, наконец, переехали на новую платформу.
Какое-то время продолжим трудится на общее благо по адресу
На новой платформе мы уделили особое внимание удобству поиска материалов.
Особенно рекомендуем познакомиться с работой рубрикатора.
Спасибо, ждём вас на N-N-N.ru
Ученые создали наиболее полную библиотеку следов нуклеиновых кислот микробиоты в анализах онкологических пациентов и с помощью методов машинного обучения выделили микроорганизмы, специфичные для различных типов опухолей. В перспективе это позволит создать новый универсальный метод диагностики рака на ранних стадиях по анализу крови.
Статья опубликована в журнале Nature.
Рак принято рассматривать как заболевание, которое напрямую связано с человеческим геномом, однако недавние исследования установили, что микробиом также влияет на опухоли и препятствует их эффективному лечению. До сих пор не известно, какой именно вклад обитатели нашего организма вносят в развитие различных типов рака. Исследовать эту зависимость трудно, потому что в процессе сбора и анализа образцов высока вероятность загрязнить их дополнительными нуклеиновыми кислотами.
Поиском простого и эффективного анализа, который мог бы выявлять рак различных типов на ранних стадиях, занято множество исследователей по всему миру. Сейчас разрабатывают целый ряд тестов, которые определяют опухоли по образцу крови; в качестве маркеров используют специфические белки или мутантную ДНК. Современные технологии статистической обработки результатов секвенирования ДНК позволяют исключить из анализа генетические следы, которые были внесены в образцы извне, и открывают возможность диагностировать рак по составу микробиоты.
Группа ученых под руководством Грегори Пура (Gregory Poore) из Калифорнийского университета в Сан-Диего проанализировала более 18 тысяч образцов, взятых у пациентов с 33 типами опухолей, из Атласа ракового генома на наличие в них микробной ДНК или РНК. К базе данных применили два независимых метода отбора и исключили материал, наличие которого могло быть следствием технической погрешности или загрязнения образца.
Затем ученые применили к данным (неразмеченные данные, застрагивающие 17 тысяч образцов 32 видов рака) стохастический градиентный бустинг, который должен был отличать опухолевые образцы от нормальных и классифицировать их по типам рака. Для проверки результата выборку разбили на две части, обучили алгоритм на каждой из них по отдельности, а затем применили полученные модели к другой половине данных. После этого отобрали образцы только пациентов на первой и второй стадиях рака (существующие методы диагностики плохо работают на ранних сроках) и провели обучение на них.
Финальной стадией была проверка алгоритма в условиях реальной жизни. Для этого исследователи взяли анализы крови у 69 здоровых людей и 100 пациентов на третьей или четвертой стадии одного из трех типов рака (рак простаты, легких или меланома) и секвенировали плазменную внеклеточную ДНК. К полученным образцам микробной ДНК применили алгоритм, выработанный на Атласе ракового генома.
В итоге даже после отбраковки больше 90 процентов данных модель успешно определяла тип опухоли как на всех стадиях, так и только на ранних. При тестировании в реальных условиях алгоритм идентифицировал более 90 процентов пациентов с раком, и не дал ложно-позитивных результатов для здоровых людей. Модель в 81 проценте случаев правильно отличила образцы больных раком легких и раком простаты.
Остается неясным, как микроорганизмы, ДНК которых использовали в анализе, связаны с развитием рака. Также непонятно, где находятся эти существа — в опухоли, в иммунных клетках или соединительной ткани — их следы могли попасть в кровь в любом из этих случаев. Неизвестно даже, были ли они живыми при взятии анализа.
- Источник(и):
- Войдите на сайт для отправки комментариев