ХОД ВЫПОЛНЕНИЯ ПРОЕКТА

Отчетная документация

Этап №1 - 12.02.2018-31.12.2018 (Основные результаты)

В ходе выполнения проекта по Соглашению о предоставлении субсидии от 12.02.2018 № 14.587.21.0049 с Минобрнауки России в рамках федеральной целевой программы «Исследования и разработки по приоритетным направлениям развития научно-технологического комплекса России на 2014-2020 годы» на этапе № 1 в период с 12.02.2018 по 31.12.2018 выполнялись следующие работы:

Получателем субсидии за счет средств субсидии:

1.1 Проведение патентного поиска и поиска по литературе.

1.2 Разработка программного модуля для поиска общего фармакофора на основании структур активных и неактивных молекул.

1.3 Разработка подхода для дизайна библиотек с использованием карт GTM.

1.4 Разработка алгоритма виртуального скринирования библиотек соединений с использованием фармакофорных моделей.

Иностранным партнером за счет собственных средств:

1.5 Литературно-патентный поиск, поиск данных в открытой литературе.

1.6 разработка нового подхода для фармакофорного моделирования, основанного на создании сигнатуры фармакофора.

1.7 Разработка модуля для создания разнообразной библиотеки соединений с использованием 3D фармакофорных сигнатур.

План исследований первого этапа выполнения проекта был выполнен в полном объеме, все запланированные на первый этап (2018 год) задачи были решены в полном объеме.

При этом были получены следующие результаты:

  1. был проведен патентный поиск и поиск по патентной литературе как получателем субсидии (пункт 1.1 Плана-графика исполнения обязательств), так и Иностранным партнером (пункт 1.5 Плана-графика исполнения обязательств);

  2. Иностранным партнером был разработан подход и реализован программный продукт для фармакофорного моделирования, основанного на создании сигнатуры фармакофора (пункт 1.6 Плана-графика исполнения обязательств);

  3. на основании разработанного подхода создания сигнатуры фармакофора получателем субсидии был разработан модуль для поиска общего фармакофора на основании структур активных и неактивных молекул (пункт 1.2 Плана-графика исполнения обязательств);

  4. на основании разработанного подхода создания сигнатуры фармакофора получателем субсидии был разработан алгоритм виртуального скринирования библиотек соединений с использованием фармакофорных моделей (пункт 1.4 Плана-графика исполнения обязательств);

  5. на основании разработанного подхода создания сигнатуры фармакофора Иностранным партнером был разработан модуль для создания разнообразной библиотеки соединений с использованием 3D фармакофорных сигнатур (пункт 1.7 Плана-графика исполнения обязательств);

  6. был разработан подход для дизайна библиотек с использованием карт GTM (пункт 1.3 Плана-графика исполнения обязательств).

Получены следующие результаты, входящие в перечень научных и научно-технических результатов, подлежащих получению при выполнении исследований получателем субсидии, раздел 2.1 Технического задания:

  1. 2.1.1 «комплекс программ и библиотек на языке Python для проведения фармакофорного моделирования на основе структур активных и неактивных молекул, проведения скрининга с использованием полученных фармакофорных моделей, создания разнообразной библиотеки, анализа молекулярно-динамических траекторий и выявления 3D фармакофоров на основании структуры биомишени» - выполнено частично, разработан модуль фармакофорного моделирования на основе структур активных и неактивных молекул, технология проведения скрининга с использованием полученных фармакофорных моделей, и модуль для создания разнообразной библиотеки. Остальные результаты запланированы на второй и третий год выполнения проекта;

  2. 2.1.2 «программный модуль для дизайна библиотек с использованием картографирования химического пространства методом GTM, а также соответствующее веб-приложение» - выполнено;

  3. 2.1.5 «база данных по скоростям реакций нуклеофильного замещения, расщепления связей и гидролиза эфирной связи» - выполнено частично, начат сбор данных, который будет продолжен во второй и третий год исполнения проекта.

Получены следующие результаты, входящие в перечень научных и научно-технических результатов, подлежащих получению при выполнении исследований Иностранным партнером, раздел 2.2 Технического задания:

  1. 2.2.1 «разработка нового подхода для фармакофорного моделирования, основанного на создании сигнатуры фармакофора» - выполнено;

  2. 2.2.2 «программа на языке Python для вычисления сигнатур 3D фармакофоров» - выполнено.

На основании проведенных исследований и полученных результатов можно сделать следующие обобщения и выводы:

  1. разработан и успешно апробирован в нескольких ретроспективных случаях новый подход к трехмерному представлению фармакофоров молекул с использованием фармакофорных сигнатур. Разработанные трехмерные сигнатуры фармакофоров могут быть использованы для создания фармакофорных моделей с использованием информации об активных/неактивных соединениях для последующего виртуального скрининга. В отличие от существующих некоммерческих продуктов в рамках данного подхода не требуется предварительно заданная геометрия активных соединений, используемых в качестве шаблона, или явное выравнивание фармакофоров. Эффективность разработанных трехмерных моделей фармакофоров была сравнимы или выше, чем производительность виртуального скрининга на основе сходства двумерных фармакофорных дескрипторов. Показано, что разработанные трехмерные фармакофоры были способны выявлять важные лиганд-белковые взаимодействия в нативных позах известных лигандов в лиганд-белковых комплексах;

  2. разработан алгоритм для выявления репрезентативной выборки структурно разнообразных соединений на основе использования карт, полученных с использованием метода Генеративного топографического отображения. Идея подхода заключается в выборке данных, максимально равномерно покрывающей карту химического пространства. Разработанный алгоритм помогает выбирать репрезентативную выборку из представленного набора данных. Показано, что с использованием одной карты или консенсуса из нескольких карт алгоритм позволяет сократить объем выборки до 1%-30% от исходного объема, при этом вероятность найти активное соединение в ней повысится на 10%. Показано, что алгоритм чувствителен к типу карты и требуется тщательный выбор карты, достаточно хорошо представляющей химическое пространство. Полученная с использованием данного подхода величина обогащения слабо зависит от размера отбираемой библиотеки и, следовательно, может использоваться для отбора любых выборок разумного размера;

  3. разработан подход, который позволяет проводить скрининг баз данных с использованием разработанного представления молекул в виде фармакофорных сигнатур. Для ускорения процесса скринирования используется трехстадийный алгоритм. На первом этапе молекулярные отпечатки фармакофора используются в качестве фильтра для быстрого определения фармакофоров, которые не подходят под данный запрос. На следующем этапе полный граф фармакофора молекулы-кандидата изоморфно вкладывают в фармакофоры молекул, прошедших первый фильтр. На последнем этапе сравниваются трехмерные фармакофорные хеши запрашиваемой модели фармакофоров и соответствующих подграфов потенциальных фармакофоров, чтобы определить, имеют ли они идентичную топологию и стерео-конфигурацию. С использованием подготовленной базы данных соединений для скринирования время работы зависит от числа молекул, проходящих фильтр, и составляет от 0.6 до 11 секунд для 1000 конформеров. Это достаточно хорошая скорость, позволяющая использовать алгоритм в последующих приложениях;

  4. проведен сбор данных из различных баз для их последующего моделирования. Из базы данных ChEMBL извлекли результаты для множества различных типов биологических испытаний. Чтобы подготовить данные для последующего моделирования, создан подход для чистки данных, который на основе информации, приведенной в базе данных выявляет тип активности и осуществляет классификацию объектов на активные и неактивные. Собрана информация для 411 биологических мишеней 6 типов. Общее число данных по биологической активности соединений составило 2 243 052. Проведен сбор данных по скоростям реакций бимолекулярного нуклеофильного замещения в водной среде и среде вода-ДМСО, используемой для проведения биологического скрининга. Полученная база данных химических реакций насчитывает 550 реакций;

  5. разработан подход для создания разнообразной библиотеки химических соединений с использованием фармакофорных сигнатур, который был реализован в виде программного модуля. Данный подход выявлял набор из минимального числа соединений, покрывающих максимально широкое фармакофорное пространство.

Работы, запланированные на первый этап выполнения проекта (2018 год) выполнены полностью, в соответствии с п. 1 Плана-графика исполнения обязательств при проведении исследований, Приложение 2 к Соглашению о предоставлении субсидии.

Официальный сайт Получателя субсидии с информацией о ходе выполнения проекта: https://cimm.site/screening2018 .

Разработанные в рамках проекта инструменты могут использоваться на этапе проведения первичного моделирования при создании библиотек химических соединений для биологического скрининга при наличии информации об активных и неактивных соединениях (подход для выявления фармакофоров, инструмент вычислительного скрининга), при отсутствии информации о биологической мишени и активных соединениях (подход для выбора разнообразной библиотеки). Этот этап является критически важным при разработке новых лекарственных препаратов. Таким образом, можно ожидать, что разработанные подходы позволят существенно повысить качество и эффективность проведения скрининга соединений. Кроме того, разработанные инструменты и собранные данные можно использовать для рационального дизайна лекарств, а именно как инструменты виртуального скрининга на основе структуры лигандов. Сочетание разработанных подходов с имеющимися может позволить улучшить качество предсказаний и расширить область применения. Созданные инструменты доступны широкому кругу исследователей и являются бесплатными альтернативами дорогостоящим коммерческим продуктам, используемым при рационально дизайне лекарственных препаратов.

Сравнение результатов анализа литературы и патентного поиска с полученными результатами показывает, что разработанные продукты являются конкурентоспособными и не уступающими лучшим достижениям в данной области. Так, разработанная технология поиска фармакофоров в отличие от существующих некоммерческих аналогов не требует знания о «биологически активной» конформации молекулы. В отличие от имеющихся коммерческих аналогов не проводится попарного выравнивания и сравнения молекул в обучающей выборке при создании фармакофора. Это позволяет потенциально обнаружить лучший возможный фармакофор в выборке, то есть наиболее часто встречающийся в активных и редко встречающийся в неактивных, если объем выборки не слишком велик. Кроме того, разработанный подход моделирования является универсальным, и может быть использован в виртуальном скрининге на основе структуры биомишени. Это недоступно для существующих коммерческих инструментов. Предложенный подход является открытым, с открытым исходным кодом, может быть использован для дальнейшей валидации и применения широкой научной общественностью для решения собственных задач. Разработанный инструмент для поиска разнообразной библиотеки с использованием карт GTM позволяет улучшить выбор соединений по сравнению со случайным подходом даже в отсутствие информации о биомишени и активных лигандах. При этом, в отличие от существующих подходов, использованием карт дает ему интуитивную ясность, возможность интерпретации или ручного анализа при необходимости. Разработанный инструмент скрининга по заданному фармакофору достаточно быстр, уступает существующему подходу Pharmer, сопоставим по скорости работы с другими инструментами. Однако наши фармакофорные модели могут быть преобразованы в формат, используемый Pharmer, за счет чего можно использовать преимущества обеих технологий. Кроме того, Pharmer специально создавался для сверхскоростного виртуального скринирования библиотек: проводилась специальная работа по оптимизации кода, для ускорения использовались компилируемые языки программирования и низкоуровневое программирование – что не было нашей задачей на данном этапе. Мы уверены, что при некоторой оптимизации программной реализации наших инструментов можно добиться существенного ускорения скрининга.

Таким образом, в рамках данного этапа выполнения проекта был разработан ключевой алгоритм генерации фармакофоров и скрининга с их использованием, что необходимо для решения остальных задач по проекту. Были разработаны технологии отбора соединений с использованием виртуального скрининга, основанного на структурах лигандов с использованием данного фармакофора, а также технология отбора разнообразных библиотек. Иностранным партнером был разработан способ создания разнообразной библиотеки с помощью фармакофорного подхода. В этой связи задачу 1 проекта «разработка алгоритмов для выбора разнообразных и сфокусированных библиотек химических соединений с использованием подхода генерации сигнатуры трехмерного фармакофора, а также с использованием картографирования с использованием метода Генеративного топографического отображения», приведенной во введении, можно считать решенной в полном объеме. Сбор данных для моделирования, завершенный на данном этапе проекта, а также разработка инструмента скрининга библиотек соединений, требуется для решения задачи 2 «разработки алгоритмов для генерации сфокусированной библиотеки соединений с использованием предсказания количественных изменений активности при замещении одних фрагментов на другие» и задачи 3 «разработки алгоритмов для отбора соединений на основе анализа профиля биологической активности соединений и анализа их стабильности в растворителях, используемых для высокопроизводительного скрининга», предпосылки для решения которых были созданы на данном этапе выполнения проекта.

Этап №2 - 01.01.2019-31.12.2019

В ходе выполнения проекта по Соглашению о предоставлении субсидии от 12.02.2018 № 14.587.21.0049 с Минобрнауки России в рамках федеральной целевой программы «Исследования и разработки по приоритетным направлениям развития научно-технологического комплекса России на 2014-2020 годы» план исследований второго этапа выполнения проекта был выполнен в полном объеме, все запланированные на второй этап исполнения проекта (2019 год) задачи были решены в полном объеме, а именно:

  1. было изучено качество дизайне разнообразных библиотек химических соединений с помощью подходов, основанных на представлении молекул в виде 3D фармакофоров и объектов на карте GTM (пункт 2.1 Плана-графика исполнения обязательств), а также с использованием метода исключенной сферы (пункт 2.2 Плана-графика исполнения обязательств);

  2. Иностранным партнером и Получателем субсидии был совместно разработан подход фармакофорного моделирования на основе структуры биомишени с использованием молекулярно-динамических траекторий. Иностранным партнером проведено молекулярно-динамическое моделирование комплексов белок-лиганд (пункт 2.7 Плана-графика исполнения обязательств), Получателем субсидии бал реализован программный модуль для выявления фармакофоров из полученных траекторий (пункт 2.3 Плана-графика исполнения обязательств) и проведен анализ траекторий и предсказательной способности полученных моделей (пункт 2.5 Плана-графика исполнения обязательств),

  3. Получателем субсидии собраны данные по константам скорости реакций гидролиза эфирных связей (пункт 2.4 Плана-графика исполнения обязательств), а также данных по изменению биоактивности в ходе ММР трансформаций (пункт 2.6 Плана-графика исполнения обязательств),

  4. Иностранным партнером разработан подход и программный инструмент для проведения профилирования спектра биологической активности (пункт 2.8 Плана-графика исполнения обязательств) и собран комплекс фармакофорных моделей, необходимый для его работы (пункт 2.9 Плана-графика исполнения обязательств).

Получены следующие результаты, входящие в перечень научных и научно-технических результатов, подлежащих получению при выполнении исследований получателем субсидии, раздел 2.1 Технического задания:

  1. 2.1.1 «комплекс программ и библиотек на языке Python для проведения фармакофорного моделирования на основе структур активных и неактивных молекул, проведения скрининга с использованием полученных фармакофорных моделей, создания разнообразной библиотеки, анализа молекулярно-динамических траекторий и выявления 3D фармакофоров на основании структуры биомишени» - выполнен частично, разработан модуль для создания фармакофоров на основе молекулярно-динамических траекторий, валидирован подход для создания разнообразной библиотеки на основе представления молекул в виде 3D фармакофоров. С учетом результатов первого года исполнения проекта данный пункт исполнен полностью;

  2. 2.1.2 «программный модуль для дизайна библиотек с использованием картографирования химического пространства методом GTM, а также соответствующее веб-приложение» - выполнен частично, проведена валидация и оптимизация модуля разработанного на первом этапе проекта. С учетом результатов первого года исполнения проекта данный пункт исполнен полностью;

  3. 2.1.5 «база данных по скоростям реакций нуклеофильного замещения, расщепления связей и гидролиза эфирной связи» - выполнено частично, собраны данные по гидролизу эфирных связей и бимолекулярному замещению.

Получены следующие результаты, входящие в перечень научных и научно-технических результатов, подлежащих получению при выполнении исследований Иностранным партнером, раздел 2.2 Технического задания:

  1. 2.2.3 «комплекс фармакофорных моделей для проведения профилирования биологической активности» - выполнено;

  2. 2.2.4 «молекулярно-динамические траектории комплексов с наиболее активными лигандами киназ MARK4 и рецепторов CB1» - выполнено.

В 2018 году Иностранным партнером были дополнительно выполнены работы по пунктам 2.2.1 «разработка нового подхода для фармакофорного моделирования, основанного на создании сигнатуры фармакофора», а также 2.2.2 «программа на языке Python для вычисления сигнатур 3D фармакофоров».

На основании проведенных исследований и полученных результатов можно сделать следующие обобщения и выводы:

  1. имплементировано и валидировано три подхода создания разнообразных библиотек соединений: с использованием фармакофорных сигнатур, с использованием карт GTM и на основе метода исключенной сферы как метода сравнения. Сравнение обогащения выборки активными соединениями, полученных с помощью двух первых методов, показывает, что метод отбора на основании покрытия 3D фармакофорными сигнатурами значительно превосходит по качеству метод отбора разнообразных библиотек с использованием карт GTM. Так, доля активных соединений в отобранной разнообразной библиотеке, полученной с использованием первого, может на 70% превосходить таковую, полученную случайным отбором, если отбирается относительно небольшая доля соединений. Обогащение выборки активными соединениями, создаваемое методом исключенной сферы, достигает 70% при определенных установках, но в основном находится около 20%. Таким образом, подход дизайна разнообразных библиотек, основанный на использовании фармакофорных сигнатур, превосходит и случайный отбор и метод отбора на основе исключенной сферы, в то время как метод, основанный на картировании GTM, не превосходит подход исключенной сферы;

  2. разработан алгоритм для выявления фармакофоров для скрининга на основе структуры биомишени с использованием фармакофоров, извлеченных из молекулярно-динамических траекторий. Для этого Иностранным партнером проведено молекулярно-динамическое моделирование различных комплексов белок-лиганд, а Получателем субсидии разработан программный модуль для создания на их основе фармакофорных моделей, который был применен для анализа траекторий. Получателем субсидии был имплементирован подход «общих хитов» для проведения скрининга, а Иностранным партнером предложен новый подход – «покрытия конформеров». Проведение ретроспективной валидации разработанного подхода с использованием данных базы ChEMBL показало, что оба подхода показывают высокое качество скрининга, особенно на этапе раннего обогащения. Использование только сложных моделей позволяет дальше повысить качество скрининга. Подход «покрытия конформеров» в целом показывает более высокое качество скрининга нежели метод «общих хитов». Оба подхода позволяют существенно обогатить отобранную выборку активными соединениями и рекомендуются как эффективный инструмент виртуального скрининга на основе структуры биомишени. Иностранным партнером проведена работа по созданию фармакофорных моделей для использования в проспективных исследованиях в 2020 году;

  3. разработан подход для профилирования спектра биологической активности. Предложенный подход основан в целом на использовании разработанного в 2018 году инструмента виртуального скрининга. Для целей профилирования этот инструмент был доработан и существенно ускорен. С использованием специальным образом подготовленных данных базы ChEMBL был создан комплекс фармакофорных моделей, соответствующий 108 биомишеням. Проведенная валидация созданных фармакофорных моделей с помощью данных базы ChEMBL и DUD-E показала, что достаточное качество полученных результатов достигается только при использовании достаточно сложных моделей. На основе этой информации был подготовлен комплекс фармакофорных моделей для профилирования биологической активности, способный достаточно надежно предсказывать 90 видов биоактивности. С использованием данных по кристаллическим структурам комплексов белок-лиганд аденозиновых рецепторов показано, что созданные модели могут выявлять молекулы в биологически активных конформациях из кристаллографических структур, то есть подход обладают высокой надежностью;

  4. были собраны данные, необходимые для моделирования различных свойств на следующем этапе выполнения проекта. Так, собраны данные по константам скорости гидролиза эфирных связей для создания модели предсказания гидролитической устойчивости соединений, что запланировано на следующий этап выполнения проекта. Собраны данные по изменению биологической активности соединений в ходе ММР трансформации, который будет использован на следующем этапе выполнения проекта для создания подхода генерации сфокусированных библиотек. Проведено молекулярно-динамическое моделирование с последующим извлечением фармакофоров для MARK4 киназ и каннабиноидных рецепторов, а также создание моделей для аденозиновых рецепторов для создания сфокусированных библиотек соединений, требующихся для проспективной валидации разработанных подходов, а также разработки новых биологически-активных молекул.

Работы, запланированные на второй этап выполнения проекта (2019 год) выполнены полностью, в соответствии с п. 2 Плана-графика исполнения обязательств при проведении исследований, Приложение 2 к Соглашению о предоставлении субсидии.

Работы проводились в тесном взаимодействии с Иностранным партнером, которое заключалось в:

  1. совместной разработке инструмента для извлечения фармакофора на молекулярно-динамических траекторий (генерация молекулярно-динамических траекторий Иностранным партнером, подход для выявления фармакофоров, разработанный и валидированный Получателем субсидии);

  2. разработке и валидации инструментов для профилирования спектра биоактивности. Иностранный партнер провел модернизацию алгоритма для виртуального скрининга и использовал программный модуль для поиска общего фармакофора на основании структур активных и неактивных молекул, разработанных Получателем субсидии в 2018 году);

  3. валидации инструментов дизайна разнообразных библиотек. Получатель субсидии использовал разработанный в 2018 году Иностранным партнером модуль для создания разнообразной библиотеки соединений с использованием 3D фармакофорных сигнатур.