ХОД ВЫПОЛНЕНИЯ ПРОЕКТА

Заявочная документация к проекту

  1. Пояснительная записка (pdf)

  2. Календарный план-график исполнения обязательств при проведении исследований (выполнении проекта) (pdf)

Отчетная документация

Этап №1 - 12.02.2018-31.12.2018 (Основные результаты)

В ходе выполнения проекта по Соглашению о предоставлении субсидии от 12.02.2018 № 14.587.21.0049 с Минобрнауки России в рамках федеральной целевой программы «Исследования и разработки по приоритетным направлениям развития научно-технологического комплекса России на 2014-2020 годы» на этапе № 1 в период с 12.02.2018 по 31.12.2018 выполнялись следующие работы:

Получателем субсидии за счет средств субсидии:

1.1 Проведение патентного поиска и поиска по литературе.

1.2 Разработка программного модуля для поиска общего фармакофора на основании структур активных и неактивных молекул.

1.3 Разработка подхода для дизайна библиотек с использованием карт GTM.

1.4 Разработка алгоритма виртуального скринирования библиотек соединений с использованием фармакофорных моделей.

Иностранным партнером за счет собственных средств:

1.5 Литературно-патентный поиск, поиск данных в открытой литературе.

1.6 разработка нового подхода для фармакофорного моделирования, основанного на создании сигнатуры фармакофора.

1.7 Разработка модуля для создания разнообразной библиотеки соединений с использованием 3D фармакофорных сигнатур.

План исследований первого этапа выполнения проекта был выполнен в полном объеме, все запланированные на первый этап (2018 год) задачи были решены в полном объеме.

При этом были получены следующие результаты:

  1. был проведен патентный поиск и поиск по патентной литературе как получателем субсидии (пункт 1.1 Плана-графика исполнения обязательств), так и Иностранным партнером (пункт 1.5 Плана-графика исполнения обязательств);

  2. Иностранным партнером был разработан подход и реализован программный продукт для фармакофорного моделирования, основанного на создании сигнатуры фармакофора (пункт 1.6 Плана-графика исполнения обязательств);

  3. на основании разработанного подхода создания сигнатуры фармакофора получателем субсидии был разработан модуль для поиска общего фармакофора на основании структур активных и неактивных молекул (пункт 1.2 Плана-графика исполнения обязательств);

  4. на основании разработанного подхода создания сигнатуры фармакофора получателем субсидии был разработан алгоритм виртуального скринирования библиотек соединений с использованием фармакофорных моделей (пункт 1.4 Плана-графика исполнения обязательств);

  5. на основании разработанного подхода создания сигнатуры фармакофора Иностранным партнером был разработан модуль для создания разнообразной библиотеки соединений с использованием 3D фармакофорных сигнатур (пункт 1.7 Плана-графика исполнения обязательств);

  6. был разработан подход для дизайна библиотек с использованием карт GTM (пункт 1.3 Плана-графика исполнения обязательств).

Получены следующие результаты, входящие в перечень научных и научно-технических результатов, подлежащих получению при выполнении исследований получателем субсидии, раздел 2.1 Технического задания:

  1. 2.1.1 «комплекс программ и библиотек на языке Python для проведения фармакофорного моделирования на основе структур активных и неактивных молекул, проведения скрининга с использованием полученных фармакофорных моделей, создания разнообразной библиотеки, анализа молекулярно-динамических траекторий и выявления 3D фармакофоров на основании структуры биомишени» - выполнено частично, разработан модуль фармакофорного моделирования на основе структур активных и неактивных молекул, технология проведения скрининга с использованием полученных фармакофорных моделей, и модуль для создания разнообразной библиотеки. Остальные результаты запланированы на второй и третий год выполнения проекта;

  2. 2.1.2 «программный модуль для дизайна библиотек с использованием картографирования химического пространства методом GTM, а также соответствующее веб-приложение» - выполнено;

  3. 2.1.5 «база данных по скоростям реакций нуклеофильного замещения, расщепления связей и гидролиза эфирной связи» - выполнено частично, начат сбор данных, который будет продолжен во второй и третий год исполнения проекта.

Получены следующие результаты, входящие в перечень научных и научно-технических результатов, подлежащих получению при выполнении исследований Иностранным партнером, раздел 2.2 Технического задания:

  1. 2.2.1 «разработка нового подхода для фармакофорного моделирования, основанного на создании сигнатуры фармакофора» - выполнено;

  2. 2.2.2 «программа на языке Python для вычисления сигнатур 3D фармакофоров» - выполнено.

На основании проведенных исследований и полученных результатов можно сделать следующие обобщения и выводы:

  1. разработан и успешно апробирован в нескольких ретроспективных случаях новый подход к трехмерному представлению фармакофоров молекул с использованием фармакофорных сигнатур. Разработанные трехмерные сигнатуры фармакофоров могут быть использованы для создания фармакофорных моделей с использованием информации об активных/неактивных соединениях для последующего виртуального скрининга. В отличие от существующих некоммерческих продуктов в рамках данного подхода не требуется предварительно заданная геометрия активных соединений, используемых в качестве шаблона, или явное выравнивание фармакофоров. Эффективность разработанных трехмерных моделей фармакофоров была сравнимы или выше, чем производительность виртуального скрининга на основе сходства двумерных фармакофорных дескрипторов. Показано, что разработанные трехмерные фармакофоры были способны выявлять важные лиганд-белковые взаимодействия в нативных позах известных лигандов в лиганд-белковых комплексах;

  2. разработан алгоритм для выявления репрезентативной выборки структурно разнообразных соединений на основе использования карт, полученных с использованием метода Генеративного топографического отображения. Идея подхода заключается в выборке данных, максимально равномерно покрывающей карту химического пространства. Разработанный алгоритм помогает выбирать репрезентативную выборку из представленного набора данных. Показано, что с использованием одной карты или консенсуса из нескольких карт алгоритм позволяет сократить объем выборки до 1%-30% от исходного объема, при этом вероятность найти активное соединение в ней повысится на 10%. Показано, что алгоритм чувствителен к типу карты и требуется тщательный выбор карты, достаточно хорошо представляющей химическое пространство. Полученная с использованием данного подхода величина обогащения слабо зависит от размера отбираемой библиотеки и, следовательно, может использоваться для отбора любых выборок разумного размера;

  3. разработан подход, который позволяет проводить скрининг баз данных с использованием разработанного представления молекул в виде фармакофорных сигнатур. Для ускорения процесса скринирования используется трехстадийный алгоритм. На первом этапе молекулярные отпечатки фармакофора используются в качестве фильтра для быстрого определения фармакофоров, которые не подходят под данный запрос. На следующем этапе полный граф фармакофора молекулы-кандидата изоморфно вкладывают в фармакофоры молекул, прошедших первый фильтр. На последнем этапе сравниваются трехмерные фармакофорные хеши запрашиваемой модели фармакофоров и соответствующих подграфов потенциальных фармакофоров, чтобы определить, имеют ли они идентичную топологию и стерео-конфигурацию. С использованием подготовленной базы данных соединений для скринирования время работы зависит от числа молекул, проходящих фильтр, и составляет от 0.6 до 11 секунд для 1000 конформеров. Это достаточно хорошая скорость, позволяющая использовать алгоритм в последующих приложениях;

  4. проведен сбор данных из различных баз для их последующего моделирования. Из базы данных ChEMBL извлекли результаты для множества различных типов биологических испытаний. Чтобы подготовить данные для последующего моделирования, создан подход для чистки данных, который на основе информации, приведенной в базе данных выявляет тип активности и осуществляет классификацию объектов на активные и неактивные. Собрана информация для 411 биологических мишеней 6 типов. Общее число данных по биологической активности соединений составило 2 243 052. Проведен сбор данных по скоростям реакций бимолекулярного нуклеофильного замещения в водной среде и среде вода-ДМСО, используемой для проведения биологического скрининга. Полученная база данных химических реакций насчитывает 550 реакций;

  5. разработан подход для создания разнообразной библиотеки химических соединений с использованием фармакофорных сигнатур, который был реализован в виде программного модуля. Данный подход выявлял набор из минимального числа соединений, покрывающих максимально широкое фармакофорное пространство.

Работы, запланированные на первый этап выполнения проекта (2018 год) выполнены полностью, в соответствии с п. 1 Плана-графика исполнения обязательств при проведении исследований, Приложение 2 к Соглашению о предоставлении субсидии.

Официальный сайт Получателя субсидии с информацией о ходе выполнения проекта: https://cimm.site/screening2018 .

Разработанные в рамках проекта инструменты могут использоваться на этапе проведения первичного моделирования при создании библиотек химических соединений для биологического скрининга при наличии информации об активных и неактивных соединениях (подход для выявления фармакофоров, инструмент вычислительного скрининга), при отсутствии информации о биологической мишени и активных соединениях (подход для выбора разнообразной библиотеки). Этот этап является критически важным при разработке новых лекарственных препаратов. Таким образом, можно ожидать, что разработанные подходы позволят существенно повысить качество и эффективность проведения скрининга соединений. Кроме того, разработанные инструменты и собранные данные можно использовать для рационального дизайна лекарств, а именно как инструменты виртуального скрининга на основе структуры лигандов. Сочетание разработанных подходов с имеющимися может позволить улучшить качество предсказаний и расширить область применения. Созданные инструменты доступны широкому кругу исследователей и являются бесплатными альтернативами дорогостоящим коммерческим продуктам, используемым при рационально дизайне лекарственных препаратов.

Сравнение результатов анализа литературы и патентного поиска с полученными результатами показывает, что разработанные продукты являются конкурентоспособными и не уступающими лучшим достижениям в данной области. Так, разработанная технология поиска фармакофоров в отличие от существующих некоммерческих аналогов не требует знания о «биологически активной» конформации молекулы. В отличие от имеющихся коммерческих аналогов не проводится попарного выравнивания и сравнения молекул в обучающей выборке при создании фармакофора. Это позволяет потенциально обнаружить лучший возможный фармакофор в выборке, то есть наиболее часто встречающийся в активных и редко встречающийся в неактивных, если объем выборки не слишком велик. Кроме того, разработанный подход моделирования является универсальным, и может быть использован в виртуальном скрининге на основе структуры биомишени. Это недоступно для существующих коммерческих инструментов. Предложенный подход является открытым, с открытым исходным кодом, может быть использован для дальнейшей валидации и применения широкой научной общественностью для решения собственных задач. Разработанный инструмент для поиска разнообразной библиотеки с использованием карт GTM позволяет улучшить выбор соединений по сравнению со случайным подходом даже в отсутствие информации о биомишени и активных лигандах. При этом, в отличие от существующих подходов, использованием карт дает ему интуитивную ясность, возможность интерпретации или ручного анализа при необходимости. Разработанный инструмент скрининга по заданному фармакофору достаточно быстр, уступает существующему подходу Pharmer, сопоставим по скорости работы с другими инструментами. Однако наши фармакофорные модели могут быть преобразованы в формат, используемый Pharmer, за счет чего можно использовать преимущества обеих технологий. Кроме того, Pharmer специально создавался для сверхскоростного виртуального скринирования библиотек: проводилась специальная работа по оптимизации кода, для ускорения использовались компилируемые языки программирования и низкоуровневое программирование – что не было нашей задачей на данном этапе. Мы уверены, что при некоторой оптимизации программной реализации наших инструментов можно добиться существенного ускорения скрининга.

Таким образом, в рамках данного этапа выполнения проекта был разработан ключевой алгоритм генерации фармакофоров и скрининга с их использованием, что необходимо для решения остальных задач по проекту. Были разработаны технологии отбора соединений с использованием виртуального скрининга, основанного на структурах лигандов с использованием данного фармакофора, а также технология отбора разнообразных библиотек. Иностранным партнером был разработан способ создания разнообразной библиотеки с помощью фармакофорного подхода. В этой связи задачу 1 проекта «разработка алгоритмов для выбора разнообразных и сфокусированных библиотек химических соединений с использованием подхода генерации сигнатуры трехмерного фармакофора, а также с использованием картографирования с использованием метода Генеративного топографического отображения», приведенной во введении, можно считать решенной в полном объеме. Сбор данных для моделирования, завершенный на данном этапе проекта, а также разработка инструмента скрининга библиотек соединений, требуется для решения задачи 2 «разработки алгоритмов для генерации сфокусированной библиотеки соединений с использованием предсказания количественных изменений активности при замещении одних фрагментов на другие» и задачи 3 «разработки алгоритмов для отбора соединений на основе анализа профиля биологической активности соединений и анализа их стабильности в растворителях, используемых для высокопроизводительного скрининга», предпосылки для решения которых были созданы на данном этапе выполнения проекта.

Этап №2 - 01.01.2019-31.12.2019

В ходе выполнения проекта по Соглашению о предоставлении субсидии от 12.02.2018 № 14.587.21.0049 с Минобрнауки России в рамках федеральной целевой программы «Исследования и разработки по приоритетным направлениям развития научно-технологического комплекса России на 2014-2020 годы» план исследований второго этапа выполнения проекта был выполнен в полном объеме, все запланированные на второй этап исполнения проекта (2019 год) задачи были решены в полном объеме, а именно:

  1. было изучено качество дизайне разнообразных библиотек химических соединений с помощью подходов, основанных на представлении молекул в виде 3D фармакофоров и объектов на карте GTM (пункт 2.1 Плана-графика исполнения обязательств), а также с использованием метода исключенной сферы (пункт 2.2 Плана-графика исполнения обязательств);

  2. Иностранным партнером и Получателем субсидии был совместно разработан подход фармакофорного моделирования на основе структуры биомишени с использованием молекулярно-динамических траекторий. Иностранным партнером проведено молекулярно-динамическое моделирование комплексов белок-лиганд (пункт 2.7 Плана-графика исполнения обязательств), Получателем субсидии бал реализован программный модуль для выявления фармакофоров из полученных траекторий (пункт 2.3 Плана-графика исполнения обязательств) и проведен анализ траекторий и предсказательной способности полученных моделей (пункт 2.5 Плана-графика исполнения обязательств),

  3. Получателем субсидии собраны данные по константам скорости реакций гидролиза эфирных связей (пункт 2.4 Плана-графика исполнения обязательств), а также данных по изменению биоактивности в ходе ММР трансформаций (пункт 2.6 Плана-графика исполнения обязательств),

  4. Иностранным партнером разработан подход и программный инструмент для проведения профилирования спектра биологической активности (пункт 2.8 Плана-графика исполнения обязательств) и собран комплекс фармакофорных моделей, необходимый для его работы (пункт 2.9 Плана-графика исполнения обязательств).

Получены следующие результаты, входящие в перечень научных и научно-технических результатов, подлежащих получению при выполнении исследований получателем субсидии, раздел 2.1 Технического задания:

  1. 2.1.1 «комплекс программ и библиотек на языке Python для проведения фармакофорного моделирования на основе структур активных и неактивных молекул, проведения скрининга с использованием полученных фармакофорных моделей, создания разнообразной библиотеки, анализа молекулярно-динамических траекторий и выявления 3D фармакофоров на основании структуры биомишени» - выполнен частично, разработан модуль для создания фармакофоров на основе молекулярно-динамических траекторий, валидирован подход для создания разнообразной библиотеки на основе представления молекул в виде 3D фармакофоров. С учетом результатов первого года исполнения проекта данный пункт исполнен полностью;

  2. 2.1.2 «программный модуль для дизайна библиотек с использованием картографирования химического пространства методом GTM, а также соответствующее веб-приложение» - выполнен частично, проведена валидация и оптимизация модуля разработанного на первом этапе проекта. С учетом результатов первого года исполнения проекта данный пункт исполнен полностью;

  3. 2.1.5 «база данных по скоростям реакций нуклеофильного замещения, расщепления связей и гидролиза эфирной связи» - выполнено частично, собраны данные по гидролизу эфирных связей и бимолекулярному замещению.

Получены следующие результаты, входящие в перечень научных и научно-технических результатов, подлежащих получению при выполнении исследований Иностранным партнером, раздел 2.2 Технического задания:

  1. 2.2.3 «комплекс фармакофорных моделей для проведения профилирования биологической активности» - выполнено;

  2. 2.2.4 «молекулярно-динамические траектории комплексов с наиболее активными лигандами киназ MARK4 и рецепторов CB1» - выполнено.

В 2018 году Иностранным партнером были дополнительно выполнены работы по пунктам 2.2.1 «разработка нового подхода для фармакофорного моделирования, основанного на создании сигнатуры фармакофора», а также 2.2.2 «программа на языке Python для вычисления сигнатур 3D фармакофоров».

На основании проведенных исследований и полученных результатов можно сделать следующие обобщения и выводы:

  1. имплементировано и валидировано три подхода создания разнообразных библиотек соединений: с использованием фармакофорных сигнатур, с использованием карт GTM и на основе метода исключенной сферы как метода сравнения. Сравнение обогащения выборки активными соединениями, полученных с помощью двух первых методов, показывает, что метод отбора на основании покрытия 3D фармакофорными сигнатурами значительно превосходит по качеству метод отбора разнообразных библиотек с использованием карт GTM. Так, доля активных соединений в отобранной разнообразной библиотеке, полученной с использованием первого, может на 70% превосходить таковую, полученную случайным отбором, если отбирается относительно небольшая доля соединений. Обогащение выборки активными соединениями, создаваемое методом исключенной сферы, достигает 70% при определенных установках, но в основном находится около 20%. Таким образом, подход дизайна разнообразных библиотек, основанный на использовании фармакофорных сигнатур, превосходит и случайный отбор и метод отбора на основе исключенной сферы, в то время как метод, основанный на картировании GTM, не превосходит подход исключенной сферы;

  2. разработан алгоритм для выявления фармакофоров для скрининга на основе структуры биомишени с использованием фармакофоров, извлеченных из молекулярно-динамических траекторий. Для этого Иностранным партнером проведено молекулярно-динамическое моделирование различных комплексов белок-лиганд, а Получателем субсидии разработан программный модуль для создания на их основе фармакофорных моделей, который был применен для анализа траекторий. Получателем субсидии был имплементирован подход «общих хитов» для проведения скрининга, а Иностранным партнером предложен новый подход – «покрытия конформеров». Проведение ретроспективной валидации разработанного подхода с использованием данных базы ChEMBL показало, что оба подхода показывают высокое качество скрининга, особенно на этапе раннего обогащения. Использование только сложных моделей позволяет дальше повысить качество скрининга. Подход «покрытия конформеров» в целом показывает более высокое качество скрининга нежели метод «общих хитов». Оба подхода позволяют существенно обогатить отобранную выборку активными соединениями и рекомендуются как эффективный инструмент виртуального скрининга на основе структуры биомишени. Иностранным партнером проведена работа по созданию фармакофорных моделей для использования в проспективных исследованиях в 2020 году;

  3. разработан подход для профилирования спектра биологической активности. Предложенный подход основан в целом на использовании разработанного в 2018 году инструмента виртуального скрининга. Для целей профилирования этот инструмент был доработан и существенно ускорен. С использованием специальным образом подготовленных данных базы ChEMBL был создан комплекс фармакофорных моделей, соответствующий 108 биомишеням. Проведенная валидация созданных фармакофорных моделей с помощью данных базы ChEMBL и DUD-E показала, что достаточное качество полученных результатов достигается только при использовании достаточно сложных моделей. На основе этой информации был подготовлен комплекс фармакофорных моделей для профилирования биологической активности, способный достаточно надежно предсказывать 90 видов биоактивности. С использованием данных по кристаллическим структурам комплексов белок-лиганд аденозиновых рецепторов показано, что созданные модели могут выявлять молекулы в биологически активных конформациях из кристаллографических структур, то есть подход обладают высокой надежностью;

  4. были собраны данные, необходимые для моделирования различных свойств на следующем этапе выполнения проекта. Так, собраны данные по константам скорости гидролиза эфирных связей для создания модели предсказания гидролитической устойчивости соединений, что запланировано на следующий этап выполнения проекта. Собраны данные по изменению биологической активности соединений в ходе ММР трансформации, который будет использован на следующем этапе выполнения проекта для создания подхода генерации сфокусированных библиотек. Проведено молекулярно-динамическое моделирование с последующим извлечением фармакофоров для MARK4 киназ и каннабиноидных рецепторов, а также создание моделей для аденозиновых рецепторов для создания сфокусированных библиотек соединений, требующихся для проспективной валидации разработанных подходов, а также разработки новых биологически-активных молекул.

Работы, запланированные на второй этап выполнения проекта (2019 год) выполнены полностью, в соответствии с п. 2 Плана-графика исполнения обязательств при проведении исследований, Приложение 2 к Соглашению о предоставлении субсидии.

Работы проводились в тесном взаимодействии с Иностранным партнером, которое заключалось в:

  1. совместной разработке инструмента для извлечения фармакофора на молекулярно-динамических траекторий (генерация молекулярно-динамических траекторий Иностранным партнером, подход для выявления фармакофоров, разработанный и валидированный Получателем субсидии);

  2. разработке и валидации инструментов для профилирования спектра биоактивности. Иностранный партнер провел модернизацию алгоритма для виртуального скрининга и использовал программный модуль для поиска общего фармакофора на основании структур активных и неактивных молекул, разработанных Получателем субсидии в 2018 году);

  3. валидации инструментов дизайна разнообразных библиотек. Получатель субсидии использовал разработанный в 2018 году Иностранным партнером модуль для создания разнообразной библиотеки соединений с использованием 3D фармакофорных сигнатур.

Этап №3 - 01.01.2020-31.12.2020

В ходе выполнения проекта по Соглашению о предоставлении субсидии от 12.02.2018 № 14.587.21.0049 с Минобрнауки России в рамках федеральной целевой программы «Исследования и разработки по приоритетным направлениям развития научно-технологического комплекса России на 2014-2020 годы» план исследований третьего этапа выполнения проекта был выполнен в полном объеме, все запланированные на третий этап исполнения проекта (2020 год) задачи были решены в полном объеме, а именно:

  1. была создана модель предсказания константы скорости разложения соединений в водных растворах и смесях вода-ДМСО (пункт 3.1 Плана-графика исполнения обязательств), и создано соответствующее веб-приложение (пункт 3.2 Плана-графика исполнения обязательств);

  2. была разработана модель для предсказания количественных изменений в активности соединений в ходе ММР трансформаций для чего было опробовано 4 различных технологии (пункт 3.3 Плана-графика исполнения обязательств), на основе чего был разработан инструмент для создания сфокусированной библиотеки соединений с использованием количественных предсказаний активности в ходе ММР трансформации (пункт 3.4 Плана-графика исполнения обязательств);

  3. разработанные в рамках проекта подходы были использованы для виртуального скрининга библиотеки соединений Университета Палацкого с целью создания сфокусированных библиотек соединений, активных против MARK4 киназ, аденозиновых и каннабиноидных рецепторов (пункт 3.7 Плана-графика исполнения обязательств). Полученные библиотеки были протестированы с использованием высокопроизводительного скрининга и выявлены наиболее перспективные молекулы (пункт 3.8 и 3.10 Плана-графика исполнения обязательств). На основе полученных данных сделаны выводы об эффективности предложенных подходов. Некоторые из подходов были внедрены для использования в НОЦ Фармацевтика ФГАОУ ВО КФУ.

  4. проведена имплементация разработанных подходов предсказания стабильности соединений, создания сфокусированных библиотек на основе ММР трансформаций и инструмента профилирования в виде веб-приложений (пункт 3.2, 3.4 и 3.9 Плана-графика исполнения обязательств). Инструменты фармакофорного моделирования на основе структур активных и неактивных молекул, а также наиболее удачный подход создания разнообразных библиотек соединений были внедрены в библиотеку инструментов для хемоинформатики RDKit (пункт 3.5 и 3.11 Плана-графика исполнения обязательств). Большинство инструментов реализованы в виде программ с открытым исходным кодом – сами разработки в виде исходных кодов и инструкции по их применению доступны на сайте проекта https://cimm.kpfu.ru/screening2018 в разделе «Разработки».

Получены следующие результаты, входящие в перечень научных и научно-технических результатов, подлежащих получению при выполнении исследований Получателем субсидии, раздел 2.1 Технического задания:

  1. 2.1.3 «вычислительная модель и соответствующее веб-приложение для предсказания стабильности соединений в растворителях, используемых для высокопроизводительного скрининга» - выполнен в полном объеме, разработана модель предсказания стабильности соединений в воде и смесях вода-ДМСО, разработано соответствующее веб-приложение;

  2. 2.1.4 «модель для предсказания количественных изменений активности соединений в ходе ММР трансформации» - выполнен в полном объеме, разработана модель для предсказания изменений биологической активности в ходе ММР трансформации, на основе которой создан инструмент создания сфокусированных библиотек;

  3. 2.1.5 «база данных по скоростям реакций нуклеофильного замещения, расщепления связей и гидролиза эфирной связи» - выполнено в полном объеме, завершен сбор данных всех указанных типов, данные использованы для разработки модели предсказания стабильности соединений.

Получены следующие результаты, входящие в перечень научных и научно-технических результатов, подлежащих получению при выполнении исследований Иностранным партнером, раздел 2.2 Технического задания:

  1. 2.2.3 «комплекс фармакофорных моделей для проведения профилирования биологической активности» - выполнено в полном объеме. Разработан комплекс моделей, на основе которых был разработан инструмент профилирования спектра биологической активности химических соединений;

  2. 2.2.4 «молекулярно-динамические траектории комплексов с наиболее активными лигандами киназ MARK4 и рецепторов CB1» - выполнено в полном объеме. Все модели были перестроены с использованием внутренних данных Университета Палацкого, и полученные модели использованы для виртуального скрининга и создания сфокусированных библиотек;

  3. 2.2.5 «данные высокопроизводительного скрининга библиотек соединений для киназ MARK4, рецепторов СВ1 и аденозиновых рецепторов» - выполнен в полном объеме. Проведен высокопроизводительный скрининг сфокусированных библиотек соединений, созданных с использованием разработанных в проекте инструментов, для самых интересных соединений была измерена константа ингибирования с использованием построения зависимости доза-ответ.

На основании проведенных исследований и полученных результатов можно сделать следующие обобщения и выводы:

  1. была разработана, валидирована и имплементирована в виде веб-приложения модель для предсказания стабильности химических соединений в растворах в воде и смесях вода-ДМСО. Модели отличаются достаточно высоким качеством предсказания константы скорости как в обычной кросс-валидации, так и в ситуации, когда предсказываются реакции с участием новых соединений. На основе полученных данных по константам скорости были предсказаны константы полуразложения соединений в воде и смесях вода-ДМСО. Полученная модель была валидирована на независимо собранной выборке абиотической трансформации соединений в окружающей среде. Показано хорошее согласие предсказанных и экспериментальных значений – время полуразложения совпадает по порядку величины;

  2. разработаны модели для предсказания количественных изменений биологической активности в ходе ММР трансформации. Для этого было протестировано 4 различных подхода. Предложен вероятностный подход к предсказанию биологической активности на основе фармакофоров, который показал хорошее качество предсказаний в сравнении с ранее использованными подходами виртуального скрининга на основе фармакофоров. Хотя этот подход не подошел для предсказания изменений биологической активности в ходе ММР трансформации из-за низкой скорости, он был успешно применен Иностранным партнером при создании инструмента профилирования биологической активности. Было предложено два подхода, которые используют для предсказания биоактивности весь конформационный ансамбль молекулы и 3D представление молекул: один основан на глубоких нейронных сетях, другой – на сочетании различных техник машинного обучения и фармакофоров. Оба подхода были протестированы в ретроспективном сценарии, показали высокое качество предсказания, которое всегда было выше, чем у методов, использующих 3D представление энергетически самой выгодной молекулы (классический сценарий), и конкурировало с многими другими методами моделирования «структура-свойство». Однако ресурсоемкость подходов не позволила полноценно их использовать для предсказания изменений ММР трансформаций. Лучшие результаты с точки зрения качества и скорости работы показали многозадачные глубокие нейронные сети в сочетании с фрагментными дескрипторами. Средний по всем выборкам коэффициент дискриминации составил около 0.5, а среднеквадратическое отклонение не превышало 1 логарифмической единицы, что вполне достаточно для задачи предсказания изменений активности в ходе ММР трансформации. На основе полученной модели был разработан и имплементирован в виде веб-приложения инструмент создания сфокусированных библиотек перечислением соединений с помощью ММР трансформаций. На основе этого подхода Иностранный партнер дополнительно развил собственный инструмент, который создает сфокусированную библиотеку похожим образом, но при этом создание соединений проводится в полости биомишени. Таким образом, инструменты, созданные Получателем субсидии и Иностранным партнером, являются комплементарными: инструмент, созданный Получателем субсидии, может использоваться только для дизайна молекул на основе сведений об активных и неактивных молекулах, тогда как инструмент Иностранного партнера может использоваться в дизайне молекул на основе структуры биомишени;

  3. с использованием предложенных в проекте фармакофорных подходов, общедоступных и внутренних данных Университета Палацкого созданы фармакофорные модели для предсказания биологической активности химических агентов (ингибиторов, агонистов) для киназ MARK4, рецепторов СВ1 и аденозиновых рецепторов. Проведен виртуальный скрининг библиотек соединений Университета Палацкого и коммерчески доступных соединений. Использованные подходы позволили выявить относительно небольшие сфокусированные выборки соединений для испытаний биологической активности (от 2 до 30 соединений для одной биомишени). В отдельных случаях (одного из подтипов аденозиновых рецепторов) соединений найти не удалось. Был проведен экспериментальный скрининг разработанных выборок соединений. Доля хитов в выборке ингибиторов MARK4 киназ, для создания которой использовалось фармакофорное моделирование на основе структуры биомишени и молекулярно-динамических траектории комплексов биомишени с лигандом, составила 8.3%, что существенно выше случайного отбора и иных подходов. Поскольку найденные фармакофорные модели были относительно простыми, соединения отличались высокой новизной и были непохожи на молекулы обучающей выборки. Одно из соединений было наномолярным ингибитором и является очень перспективным кандидатом для последующих испытаний. Доля хитов в библиотеке ингибиторов аденозиновых рецепторов различных подтипов, собранных с помощью фармакофорного моделирования на основе структур активных и неактивны молекул, составляла от 50 до 100%. Однако из-за высокой специфичности фармакофоров структуры были весьма похожи на ранее протестированные в Университете Палацкого;

  4. на основании разработок 2019 года и опубликованного в 2020 году вероятностного подхода к виртуальному скринингу с использованием фармакофоров был реализован веб-инструмент для профилирования спектра биологической активности молекул.

  5. было уделено большое внимание оформлению разработанных в проекте подходов в виде удобных подходов и приложений. Так, было разработано 3 веб приложения (подход для предсказания стабильности соединений, создания сфокусированных библиотек на основе ММР трансформаций и инструмента профилирования спектра биологической активности). Свой подход для создания сфокусированных библиотек на основе ММР трансформаций молекул в полости биомишени Иностранный партнер оформил в виде отдельного приложения. Два подхода были имплементированы в ветку библиотеки для хемоинформатики RDKit: подход для фармакофорного моделирования на основе структур активных и неактивных молекул и инструмент дизайна разнообразных библиотек на основе предсказания индекса сходства с хитом. Была подготовлена документация по всем разработанным Получателем субсидии вычислительным подходам, веб-приложениям и алгоритмам.

  6. проведено внедрение двух подходов для использования в НОЦ Фармацевтика КФУ. Подход для предсказания гидролитической стабильности используется для поиска «мягких лекарств» - антисептиков с запрограммированным разложением в окружающей среде. Программный комплекс для дизайна лекарств на основе структур активных и неактивных молекул внедренный в библиотеку RDKit был использован для поиска новых антибиотиков. Было подтверждено соответствие заявленных характеристик программного обеспечения истинным параметрам, а также их польза в дизайне новых лекарственных препаратов.

Работы, запланированные на заключительный этап выполнения проекта (2020 год) выполнены полностью, в соответствии с п. 3 Плана-графика исполнения обязательств при проведении исследований, Приложение 2 к Соглашению о предоставлении субсидии.

Работы проводились в тесном взаимодействии с Иностранным партнером, которое заключалось в следующем:

  1. Иностранный партнер применил разработанный Исполнителем на этапе 2 проекта (в 2019 году) модуль для создания фармакофора на основе структуры биомишени с использованием молекулярно-динамических траекторий для виртуального скрининга библиотек соединений для поиска ингибиторов MARK4 киназы и каннабиноидного рецептора типа 1. Использовался алгоритм виртуального скринирования библиотек соединений с использованием фармакофорных моделей, разработанный Получателем субсидии на первом этапе выполнения проекта.

  2. Иностранный партнер применил разработанный Исполнителем на 1 этапе проекта (в 2018 году) программный модуль для поиска общего фармакофора на основании структур активных и неактивных молекул для виртуального скрининга библиотек соединений Университета Палацкого и коммерческих баз данных для поиска ингибиторов аденозиновых рецепторов, для которых не имелось сведений о структуре биологической мишени. Использовался алгоритм виртуального скринирования библиотек соединений с использованием фармакофорных моделей, разработанный Получателем субсидии на первом этапе выполнения проекта.

  3. На третьем этапе проекта Иностранный партнер существенно развил разработанный в 2020 году Исполнителем проекта инструмент для создания сфокусированной библиотеки соединений с использованием количественных предсказаний изменения активности соединений в ходе ММР трансформации, создав на его основе полноценный инструмент для de novo дизайна на основе структуры биомишени.

  4. Тестирование разработанных Получателем субсидии и Иностранным партнером в рамках проекта подходов фармакофорного моделирования проводилось совместно с Иностранным партнером на собранных им выборках данных с использованием высокопроизводительного вычислительного кластера IBM Flex System Университета Палацкого в Оломоуце.

  5. Большой объем работы был посвящен совместной доработке развитых подходов и их внедрению в библиотеку для хемоинформатики RDKit: для этого разработанные партнерами программные продукты были проверены другой стороной, имплементированы в ветку библиотеки, которую поддерживает Иностранный партнер, работоспособность проверена.

  6. Получатель субсидии проекта разработал прототип универсального инструмента для реализации веб-приложений предсказания свойств молекул. Иностранный партнер использовал и адаптировал этот код для реализации веб-инструмента для проведения профилирования биологической активности соединений. Получатель субсидии проекта адаптировал его для реализации веб-приложения для предсказания константы скорости разложения соединений в водных растворах и смесях вода-ДМСО. Получатель субсидии предложил новый вероятностный подход к предсказанию биологической активности с использованием фармакофорных моделей, который был использован Иностранным партнером для обновления существующих фармакофорных моделей и был использован при создании веб-инструмента профилирования биологической активности.