Раковые клетки могут иметь тысячи мутаций в своей ДНК. Однако лишь немногие из них действительно приводят к прогрессированию рака, остальные же являются просто "пассажирами".
Различение этих вредных мутаций-драйверов и нейтральных пассажиров может помочь исследователям найти лучшие мишени для лекарственных препаратов. Чтобы активизировать эти усилия, группа специалистов под руководством Массачусетского технологического института создала новую компьютерную модель, которая может быстро просканировать весь геном раковых клеток и выявить мутации, которые встречаются чаще, чем ожидалось, что позволяет предположить, что они являются движущей силой роста опухоли. Этот тип прогнозирования вызывает трудности, поскольку некоторые геномные регионы имеют чрезвычайно высокую частоту "пассажирских" мутаций, заглушающих сигнал реальных движущих сил.
"Мы создали вероятностный метод глубинного обучения (deep-learning), который позволил нам получить действительно точную модель количества пассажирских мутаций, которые должны существовать в любом месте генома", - говорит соавтор исследования Максвелл Шерман. "Затем мы можем искать по всему геному регионы, где наблюдается неожиданное скопление мутаций, что позволяет предположить, что это мутации-драйверы".
В своем новом исследовании ученые обнаружили дополнительные мутации по всему геному, которые, по-видимому, способствуют росту опухоли у 5-10 % больных раком. Полученные результаты могут помочь врачам определить препараты, которые имеют больше шансов на успешное лечение таких пациентов, говорят исследователи. В настоящее время, по крайней мере, у 30 % больных раком не обнаруживается мутация-драйвер, которая может быть использована для лечения.
С тех пор как два десятилетия назад был секвенирован геном человека, исследователи пытаются найти в нем мутации, которые способствуют развитию рака, заставляя клетки расти бесконтрольно или уклоняться от иммунной системы. В результате были успешно найдены такие цели, как рецептор эпидермального фактора роста (EGFR), который часто мутирует при опухолях легких, и BRAF, являющийся распространенным фактором развития меланомы. На обе эти мутации теперь могут быть направлены специальные препараты. Хотя эти мишени оказались полезными, гены, кодирующие белки, составляют лишь около 2% генома. Остальные 98 % также содержат мутации, которые могут возникать в раковых клетках, но выяснить, способствуют ли какие-либо из этих мутаций развитию рака, было гораздо сложнее.
"На самом деле не хватает компьютерных методов, позволяющих искать эти "драйверные" мутации за пределами областей, кодирующих белки", - говорит Шерман. "Именно это мы и пытались сделать: разработать вычислительный метод, который позволит нам изучить не только 2 % генома, кодирующего белки, а 100%". Для этого исследователи разработали тип компьютерной модели, называемой глубинной нейронной сетью, для поиска в раковых геномах мутаций, которые встречаются чаще, чем ожидалось. В качестве первого шага они обучили модель на геномных данных 37 различных типов рака, что позволило ей определить фоновую частоту мутаций для каждого из этих типов.
"Действительно замечательная особенность нашей модели заключается в том, что вы обучаете ее один раз для данного типа рака, и она узнает частоту мутаций по всему геному одновременно для этого конкретного типа рака", - рассказывает Шерман. "Затем вы можете сравнить мутации, которые вы видите в когорте пациентов, с тем количеством мутаций, которое вы ожидаете увидеть".
Данные, использованные для обучения модели, были получены из проекта Roadmap Epigenomics Project и международной базы данных Pan-Cancer Analysis of Whole Genomes (PCAWG). Анализ этих данных с помощью модели дал исследователям карту ожидаемой скорости мутаций пассажиров по всему геному, так что ожидаемую скорость в любом наборе регионов (вплоть до одной пары оснований) можно сравнить с наблюдаемым количеством мутаций в любом месте генома. Используя эту модель авторы смогли дополнить известный ландшафт мутаций, которые могут вызывать рак. В настоящее время, когда опухоли раковых больных проверяются на наличие мутаций, вызывающих рак, известный драйвер обнаруживается примерно в двух третях случаев. Новые результаты данного исследования позволяют выявить возможные мутации-драйверы еще у 5-10 % пациентов.
Один из типов некодирующих мутаций, на котором сосредоточились исследователи, называется "криптические сплайс-мутации". Большинство генов состоят из последовательностей экзонов, которые кодируют инструкции по созданию белка, и интронов - элементов спейсера, которые обычно вырезаются из мессенджерной РНК перед ее трансляцией в белок. Криптические сплайс-мутации встречаются в интронах, где они могут запутать клеточный механизм, который их сплайсирует. Это приводит к тому, что интроны оказываются включенными, когда их не должно быть.
Используя свою модель, исследователи обнаружили, что многие криптические сплайс-мутации нарушают работу генов-супрессоров опухолей. Когда эти мутации присутствуют, опухолевые супрессоры сплайсируются неправильно, перестают работать, и клетка теряет одну из своих защитных функций против рака. Количество криптических сайтов сплайсинга, обнаруженных исследователями в этом исследовании, составляет около 5 % от всех мутаций драйверов, обнаруженных в генах-супрессорах опухолей. По словам исследователей, воздействие на эти мутации может предложить новый способ потенциального лечения таких пациентов. Один из возможных подходов, который пока находится в стадии разработки, использует короткие нити РНК, называемые антисмысловыми олигонуклеотидами (ASO), чтобы заменить мутировавший участок ДНК правильной последовательностью.
"Если бы удалось каким-то образом заставить мутацию исчезнуть, то вы решили бы проблему. Эти гены-супрессоры опухоли могут продолжать работать и, возможно, бороться с раком", - говорит Шерман. "Технология ASO активно развивается, и это может быть очень хорошим применением для нее".
Другая область, где исследователи обнаружили высокую концентрацию некодирующих мутаций-драйверов, находится в нетранслируемых областях некоторых генов-супрессоров опухолей. Уже было известно, что ген-супрессор опухолей TP53, дефектный при многих видах рака, накапливает много делеций в этих последовательностях, известных как 5' нетранслируемые области. Авторы обнаружили такую же картину в опухолевом супрессоре под названием ELF3.
Исследователи также использовали свою модель для изучения того, могут ли общие мутации, которые уже известны, также быть причиной различных типов рака. Например, исследователи обнаружили, что BRAF, ранее связанный с меланомой, также способствует развитию рака в меньшем проценте других типов рака, включая рак поджелудочной железы, печени и пищевода.
"Это говорит о том, что на самом деле существует много совпадений между ландшафтом распространенных факторов и ландшафтом редких факторов. Это дает возможность для терапевтического перепрофилирования", - говорит Шерман. "Эти результаты могут помочь в проведении клинических испытаний, которые мы должны организовать для того, чтобы эти препараты не только были одобрены при одном раке, но и были одобрены при многих типах рака и могли помочь большему числу пациентов".
Maxwell A. Sherman et al. Геномное картирование частоты соматических мутаций позволяет выявить факторы, вызывающие рак (аннотация).
Выявление мутаций-драйверов рака, которые дают пролиферативное преимущество, имеет центральное значение для понимания рака; однако поиск часто ограничивается белок-кодирующими последовательностями и конкретными некодирующими элементами (например, промоторами) из-за сложности моделирования сильно варьирующей частоты соматических мутаций, наблюдаемой в опухолевых геномах.
В данном исследовании мы представляем Dig - метод поиска драйверных элементов и мутаций в любой точке генома. Мы используем глубинные нейронные сети для картирования специфической для рака частоты мутаций в масштабах всего генома с разрешением в килобазах. Затем эти оценки уточняются для поиска доказательств наличия мутаций-драйверов под положительным отбором по всему геному путем сравнения наблюдаемых и ожидаемых количеств мутаций. Мы составили карты частоты мутаций для 37 типов рака и применили эти карты для выявления предполагаемых драйверов в интронных криптических областях сплайсинга, 5′ нетранслируемых областях и редко мутирующих генах. Наши карты частоты мутаций с высоким разрешением, доступные для изучения через Интернет, являются ресурсом, позволяющим обнаружить драйверы в масштабах всего генома.