CIMM

Kazan Chemoinformatics Lab

Third International School-Seminar “From Empirical to Predictive chemistry” (E2PC2018)

TABLE OF CONTENTS
-Third International School-Seminar “From Empirical to Predictive chemistry” (E2PC2018)
-Organizers of the Third International School-Seminar “From Empirical to Predictive chemistry”
-Program
-Poster session
-Accomodation

THIRD INTERNATIONAL SCHOOL-SEMINAR “FROM EMPIRICAL TO PREDICTIVE CHEMISTRY” (E2PC2018)

The Third International School-Seminar “From Empirical to Predictive chemistry” (E2PC2018) was held in Kazan on 5-7 April, 2018.

The Book of abstracts

The Book of abstracts accepted for presentation in the Third International School-Seminar “From Empirical to Predictive chemistry” is available under the link .

About the School-seminar

The School-seminar is a regular event organized in the framework of the project 14-43-00024 funded by Russian Science Foundation that is mainly designed to establish new connections between theoretical chemists in order to make a wider overview of the field. The general conception of the event is cross-education when specialists in one field make an accessible presentation of their findings or overview of the field. This will help to access synergetic effect in developing of theoretical chemistry and molecular modeling.

The First School-Seminar , 28-29 November 2014, gathered experts in chemoinformatics, quantum chemistry and synthetic chemistry aiming to share their experience in the design of new chemical entities. 

The Second School-Seminar , 29-30 October 2015, was mainly focused on the application of QSAR approaches for modeling different chemical objects.

The Symposium “From Empirical to Predictive Chemistry ”, 26-30 September 2016, was a satellite event of the XX Mendeleev Congress on General and Applied Chemistry , the largest Russian scientific event focusing on fundamental and applied chemical research and gathered specialists in different fields of computational chemistry including chemoinformatics, molecular modeling, force field molecular mechanics and dynamics, quantum chemistry  to discuss recent trends and achievements in the field.

The main topics of the School-Seminar include:

  • Nowadays Approaches to Structure-Property Relationships,
  • Modeling of Synthetic and Metabolic Reactions,
  • Modeling in Drug Discovery,
  • Materials Design,
  • Chemical Information: Storage, Retrieval, and Knowledge Extraction,
  • Other Applications of Computational Chemistry

Program

Program includes:

  • Lectures with the review of some field of computational chemistry,
  • Key-note lectures with the presentation of particular work,
  • Oral presentations of young scientists,
  • Poster session,
  • Tutorial “Python in Chemoinformatics”, including basic Python programming (1 tutorial), RDKit usage for chemical information management (1 tutorial), Sklearn and Pandas usage for QSAR modeling (1 tutorial).

More about the program could be found at Program page where the latest changes are published.

Important dates:

Deadline for registration and abstract submission – March 1, 2018

Preliminary Scientific program  announcement – March  15, 2018

Early bird registration – March 1, 2018

Event days – April 5-7, 2018

Language:

The official language is English.

Registration fee:

School-Seminar is free for all participants

ORGANIZERS OF THE THIRD INTERNATIONAL SCHOOL-SEMINAR “FROM EMPIRICAL TO PREDICTIVE CHEMISTRY”

Organizers of the Third Kazan Summer School on Chemoinformatics:

Kazan Federal University

The Tatarstan branch of the Mendeleev Russian Chemical Society

Russian Science Foundation

Scientific supervisor:

Professor Alexandre VARNEK

Chairman of the Organizing Committee:

Professor Igor ANTIPIN

Scientific Secretary:

Dr. Timur MADZHIDOV

Local Committee:

Dr. R.I. Nugmanov

Dr. M.A. Kazymova

V.A. Afonina

T.R. Gimadiev

Dr. N.I. Ivanova

N.R. Khafizov

A. Khayrullina

Dr. S.A. Neklyudov

PROGRAM

April 5, 2018
9:00-12:00 Registration
Preconference Session Tutorial “Python in Chemoinformatics”
9:00-10:00 I. Alimova (KFU, Russia) / Basics of Python
10:00-11:00 P.Polishchuk (UoO, Czech Rep) / RDKit – molecule and reaction information operation
11:00-11:30 Coffee – break
11:30-12:30 R. Nugmanov (KFU, Russia) / Pandas and Sklearn for QSAR modeling
12:30-14:00 Lunch
14:00-14:10 Opening Ceremony
14:10-14:50 Plenary Lecture 1 / A. Varnek “CHEMOGRAPHY ANALYSIS OF DRUG-LIKE CHEMICAL SPACE”
14:50-15:30 Plenary Lecture 2 /T. Madzhidov “CONDENSED GRAPH OF REACTION – AN EFFICIENT APPROACH FOR REACTIONS MINING”
15:30-16:00 Coffee – break
16:00-16:30 Key-note Lecture 1 / V. Soloviev “THE ISIDA_NB PROGRAM: CONSENSUS NA?VE BAYESIAN MODELING ON FRAGMENT DESCRIPTORS”
16:30-16:50 Oral 1 / G. Marcou “THE GTM APPROACH TO INTERPRETATION OF CLASSIFICATION MODELS”
16:50-17:10 Oral 2 / D. Druzhilovskiy “WAY2DRUG CHEMINFORMATICS PLATFORM FOR DRUG REPURPOSING”
17:10-17:25 Short 1 / A. Kutlushina “USING A NEW PRESENTATION OF 3D PHARMACOPHORES FOR VIRTUAL SCREENING”
17:25-17:40 Short 2 / A. Lin “GENERATIVE TOPOGRAPHIC MAPPING APPROACH AS A TOOL FOR INDUSTRIAL CHEMICAL COLLECTIONS COMPARISON”
17:40-19:00 Poster Session / Coffee-break
April 6, 2018
9:00-12:00 Registration
9:00-9:40 Plenary Lecture 3 /A. Tropsha “SOCIAL AND PROFESSIONAL MEDIA MINING FOR DRUG DISCOVERY”
9:40-10:20 Plenary Lecture 4 / I. Baskin “APPLICATION OF DEEP LEARNING NEURAL NETWORKS IN CHEMOINFORMATICS: ADVANTAGES AND PROSPECTS”
10:20-10:40 Coffee – break
10:40-11:10 Key-note Lecture 2 / M. Ceccini “A LINEAR INTERACTION ENERGY MODEL FOR HOST-GUEST RECOGNITION”
11:10-11:40 Key-note Lecture 3 / M. Khrenova “BRIDGING THE GAP: COMBINING THE QM/MM AND QTAIM IN SEARCH OF DOMINATING INTERACTIONS IN BIOLOGICAL SYSTEMS”
11:40-12:10 Key-note Lecture 4 / D. Horvath “FOLDING, DOCKING, SAMPLING: THE CHALLENGE OF (FREE) ENERGY FUNCTION CALIBRATION IN 3D MOLECULAR MODELING, AND SOME ATYPICAL STRATEGIES BORROWED FROM CHEMOINFORMATICS”
12:10-14:00 Lunch
14:00-14:40 Plenary Lecture 5 / V. Poroikov “SYNTHETICALLY ACCESSIBLE VIRTUAL INVENTORY: CAN NEW ANTI-HIV AGENTS BE FOUND AMONG THE 283 MLN MOLECULES?”
14:40-15:10 Key-note Lecture 5 / I. Tetko “PREDICTING STABILITY OF CHEMICAL COMPOUNDS”
15:10-15:30 Oral 3 / F. Bonachera “ONLINE VISUALIZATION AND ANALYSIS OF CHEMICAL SPACE USING GENERATIVE TOPOGRAPHIC MAPPING”
15:30-16:00 Coffee – break
16:00-16:15 Short 3/ T. Gimadiev “PREDICTING RATE CONSTANT OF BIMOLECULAR NUCLEOPHILIC SUBSTITUTION REACTIONS BY MEANS OF CGR APROACH”
16:15-16:30 Short 4/ L. Stolbov “QSAR MODELS FOR PREDICTING HIV-1 PROTEASE INHIBITING ACTIVITY AMONG THE MOLECULES FROM SAVI”
16:30-16:45 Short 5/ S. Shermukhamedov “MOLECULAR DYNAMIC SIMULATIONS OF WATER INSIDE CARBON NANOTUBES: NEW INSIGHTS”
16:45-17:00 Short 6/ K. Shamsieva “IN SILICO STUDY AND BIOLOGICAL EVALUATION OF 12-N-METHYLCYTISINE DERIVATIVES AS POSITIVE ALLOSTERIC MODULATORS OF AMPA RECEPTORS”
17:00-17:15 Short 7 / S. Ivanov “PREDICTION OF CARDIOVASCULAR ADVERSE DRUG EFFECTS USING STRUCTURE-ACTIVITY RELATIONSHIPS”
17:15-17:30 Short 8/ V. Afonina “REACTION CONDITIONS PREDICTION BY ARTIFICIAL NEURAL NETWORKS”
17:30-17:45 Short 9/ S. Sosnin “PREDICTION OF PROPERTIES OF ORGANIC COMPOUNDS BY 3D CONVOLUTIONAL NEURAL NETWORKS”
17:45-18:00 Closing Ceremony
April 7, 2018
09:30-12:30 Round table “Chemoinformatics and relarted subjects teaching: experience of Russian and foreign universities”

POSTER SESSION

Date of poster session:

April 5, at 17:40.

The duration of session is 1 hour 20 minutes.

The posters must be displayed in the poster area at any time, but before 16:00 on April, 5. The organisers will provide to the authors the necessary material to display their posters. The posters will be attached on the pre-installed panels. The authors must be present near their presentation during the poster sessions.

The posters should be prepared in English only!

The size of the poster should be 90 cm x 120 cm. Any orientation of the poster on the panel is possible. Portrait orientation is preferable.

Note: Organizing Committee assumes no responsibility for any damage to the exhibited posters and for their safety. Posters that have not been removed by the end of the Conference will be removed and destroyed.

List of poster presentations:

  1. Amangeldiuly Nurlybek “TRENDS IN FUNDING GRANT PROJECTS DEMONSTRATED ON ARAMIDS RESEARCH EXAMPLE”
  1. Burganov Timur “STUDY OF STRUCTURES AND PHOTOPHYSICAL PROPERTIES OF THE NOVEL ENANTIOPURE PHOSPHOLES”
  1. Gordeeva Antonina “STRUCTURE OF GEL BASED ON ?-CARRAGEENAN-GELATIN POLYELECTROLYTE COMPLEXES”
  1. Ismagilova Rezeda “DFT STUDY OF MECHANISM OF THE REACTIONS OF SECONDARY PHOSPHINE CHALCOGENIDES WITH ALKENES”
  1. Ivanov Nikita “THE ESTIMATION AND APPLICATION OF FRAGMENTS’ CONTRIBUTIONS TO THE LIGAND BINDING ENERGY”
  1. Koshkarov Alexander “THE INFLUENCE OF OLIGOMERIZATION ON THE DYNAMIC STRUCTURE OF D-GLYCERALDEHYDE-3-PHOSPHATE DEHYDROGENASE”
  1. Kulkova Elena “THE ORIGIN OF THE CALIXARENE SELECTIVITY TO CESIUM CATION FROM THE BORN-OPPENHEIMER MOLECULAR DYNAMIC SIMULATIONS”
  1. Levitskaya Alina “DESIGN OF ORGANIC ELECTROOPTIC MATERIALS: FROM PREDICTIVE TO EMPIRICAL CHEMISTRY”
  1. Novikova Daria “BINDING SITE PREDICTION FOR 3-BENZYLIDENE OXINDOLES BASED ON EXPERIMENTAL DATA”
  1. Orlova Daria “COMPUTER AIDED DESIGN OF COMPOUNDS FOR THE DETERMINATION OF POTENTIAL PROTEIN TARGETS”
  1. Pats Karina “THE USAGE OF MACHINE LEARNING APPROACHES FOR GENERATION OF LIGANDS, AFFINE TO THE DEFINED BIOLOGICAL TARGET”
  1. Safarova Enzhe “INTERACTIONS OF BINASE WITH A POLYSACCHARIDE DETERMANIED BY MOLECULAR DYMANICS SIMULATIONS”
  1. Savosina Polina “INFLUENCE OF ALTERNATIVE SPLICING ON THE PROTEIN FUNCTION BY CHANGING THEIR PHOSPHORYLATION PROFILES”
  1. Scherbakov Kirill “MODELLING OF INTERACTION OF NOVEL OXAZOLINE DERIVATIVES OF 17(20)E-PREGNA-5,17(20)-DIENE WITH HUMAN ANDGROGEN RECEPTOR”
  1. Shaymardanov Arslan “SPEEDING UP CALCULATION OF EMPIRICAL ATOMIC CHARGES BY MEANS OF ITERATIVE LINEAR SYSTEM SOLVERS”
  1. Shteingolc Sergey “DIFFERENT GEOMETRIC MODELS FOR REFINEMENT OF PENTACYANOPROPENE ANION’S LOCATION IN ITS ORGANIC SALTS”
  1. Sosnina Ekaterina “INFLUENCE OF DESCRIPTOR IMPLEMENTATION ON COMPOUND ASSESSMENT”
  1. Sviridova Elizaveta “DEVELOPMENT OF COMPLEX OPTIMIZATION SYSTEM FOR INCREASING THE EFFICIENCY OF THE GASOLINE PRODUCTION”
  1. Telegin Felix “QSPR ANALYSIS OF BODIPY DYES IN CHEMISTRY AND HIGH-TECH ENGINEERING”
  1. Telegin Felix “DATABASE AND QSPR ANALYSIS OF ANIONIC DYES FOR TEXTILE COLORATION”
  1. Vasilyev Ilya “NON-COVALENT INTERACTIONS IN COMPOSITE POLYMER MATERIALS WITH QUADRATIC NONLINEAR OPTICAL ACTIVITY: ATOMISTIC MODELING AND DFT STUDY”
  1. Zankov Dmitriy “MODEL THAT COULD SIMULTANEOUSLY LEARN TAUTOMERIC EQUILIBRIUM AND ACIDITY CONSTANTS”
  1. Zharkov Dmitry “THE INFLUENCE OF POINT MUTATIONS ON THE INTRA-MOLECULAR DYNAMICS OF D-GLYCERALDEHYDE-3-PHOSPHATE DEHYDROGENASE”
  1. Shalin Nikita “THE CHOICE OF APPROPRIATE DENSITY FUNCTIONAL FOR THE CALCULATION OF FIRST HYPERPOLARIZABILITY OF CIS- AND TRANS-ISOMERIC FORMS OF AZOCHROMOPHORES”
  1. Akhmetshin Tagir “DEVELOPMENT OF A PREDICTION’ PERFORMANCE METRIC FOR CHEMICAL REACTIONS’ MODELS”
  1. Fatykhova Adeliya “ON-LINE REACTION DATABASE CARTRIDGE WITH BUILT-IN CONDENSED GRAPH OF REACTION-BASED SEARCH ENGINE”
  1. Gimadiev Timur “ASSESSMENT OF TAUTOMER DISTRIBUTION USING THE CONDENSED GRAPH OF REACTION APPROACH”
  1. Semin Maxim “IN SILICO ASSESSMENT OF ADVERSE EFFECTS OF DRUG COMBINATIONS ON THE HEPATOBILIARY SYSTEM”
  1. Nugmanov Ramil “CGRTOOLS – LIBRARY FOR CGR BASED REACTIONS MANAGEMENT AND ANALYSIS”
  1. Rakhimbekova Assima “COMPARISON OF THE APPLICABILITY DOMAIN FOR CHEMICAL REACTIONS”
  1. Khayrullina Adelya “MACHINE LEARNING METHODS TO FIND ATOM-TO-ATOM MAPPING IN REACTIONS”
  1. Glavatskikh Marta “TAUTOMERIC EQUILIBRIA: MODELING AND VISUALIZATION”

ACCOMODATION

Organizing committee proposes the following hotels for accommodation:

  • Ibis hotel , 10 minutes of walking to the venue, cost 2500 RUR (~40€) per day
  • Hayal hotel , 3 minutes of walking to the venue, cost 3000 RUR (~45€) per day
  • Regina hotel , 5-10 minutes of walking to the venue, cost 2000-2700 RUR (~30-40€) per day
16 h   e2pc2018

Third Kazan Summer School on Chemoinformatics (KSSCI2017)

TABLE OF CONTENTS
-About Third Kazan Summer School on Chemoinformatics (KSSCI2017)
-Organizers of the Third Kazan Summer School on Chemoinformatics
-Program
-Venue
-Photo
-Tutorials
-Poster session
-Visa Issues
-Accomodation
-Registration fee

ABOUT THIRD KAZAN SUMMER SCHOOL ON CHEMOINFORMATICS (KSSCI2017)

The Third Kazan Summer School on Chemoinformatics (KSSCI2017) was held in Kazan, Russia, from 5th to 7th July 2017.

The Book of abstracts accepted for presentation in 3rd Kazan Summer School
on Chemoinformatics is available under the link.

Every 2 years, Kazan Summer School on Chemoinformatics welcomes young scientists from all over the world for learning basics of chemoinformatics and related disciplines, having tutorials on “gold standard” software, and discussing the scientific and industrial achievements.

The Chemoinformatics is a new and highly demanded multidisciplinary domain of modern chemistry, that is on the intersection of chemistry, biology, mathematics and informatics. The main aims of this domain are storing and management of chemical information and its applying to create compounds, reactions and materials having desired features.

Chemoinformatics is widely used to create new drugs for medical and veterinary purposes, as well as innovative materials, catalysts, reagents for the chemical industry. Despite the large potential demand for specialists in Chemoinformatics, educational programs of this discipline in Russia are not yet quite developed. In 2012 in Kazan Federal University (KFU) the Master program of Chemoinformatics has been opened, which has now become the third active educational program of Chemoinformatics in the world. In Russia, similar programs were recently opened in ITMO University (Saint-Peterburg) and Moscow Institute of Physics and Technology (Moscow).

This School is the Third Summer School on Chemoinformatics in Kazan, the first one took place in 2013 and united about *90* participants from 7 countries. *12* lectures, *4* tutorials and *10* oral reports were presented in the School. The Second Kazan Summer School on Chemoinformatics attracted more than *100* participants from 16 countries. *19* lectures, *4* tutorials and *4* oral reports were presented there.

KSSCI2017 aimed to create the conditions for training specialists of Chemoinformatics in Russia, as well as to create educational and scientific environment for scientists, pharmaceutical and chemical industry representatives, IT specialists and software developers.

The main topics of the School are:

  • Basics of chemoinformatics and QSAR approaches,
  • Sources of chemical information, its storage and retrieval,
  • SAR/QSAR/QSPR modeling,
  • Structure-based drug design.

Program of the event includes:

  • Lectures of world-leaders in chemoinformatics
  • Plenary presentations on cutting-edge approaches
  • Oral reports about personal achievements of young participants
  • Poster session
  • Tutorials

Speakers:

  • Alex Tropsha (University of North Carolina, USA)
  • Alexandre Varnek (University of Strasbourg, France)
  • Igor Baskin (Moscow State University, Russia)
  • Vladimir Poroikov (Institute of Biomedical Chemistry, Russia)
  • Dragos Horvath (CNRS, France)
  • Hanoch Senderowitz (Bar-Ilan University, Israel)
  • Gilles Marcou (University of Strasbourg, France)
  • Pavel Polishchuk (Univerity of Olomouc, Czech Republic)
  • Pavel Yakovlev (BIOCAD, Russia)
  • Vitaly Solov’ev (Institute of Physical Chemistry and Electrochemistry, Russia)
  • Vladimir Sulimov (Moscow State University, Russia)
  • Pavel Vassiliev (Volgograd State Medical University, Russia)

Venue:

The event was held in A.M. Butlerov Institute of Chemistry, Kazan Federal University, Kazan, Russia.

Language:

English is the official language of the event.

Contact Information:

Scientific Secretary

Dr. Timur I. Madzhidov (Kazan Federal University, Russia)

E-mail: timur.madzhidov@kpfu.ru

Tel: +7 (843) 233-73-71

Participant contacts
We invite the participants of KSSCI2017 to fill the table of participants’ contacts.

ORGANIZERS OF THE THIRD KAZAN SUMMER SCHOOL ON CHEMOINFORMATICS

Kazan Federal University

The Tatarstan branch of the Mendeleev Russian Chemical Society

Russian Science Foundation

Scientific supervisor:

Professor Alexandre VARNEK

Chairman of the Organizing Committee:

Professor Igor ANTIPIN

Scientific Secretary:

Dr. Timur MADZHIDOV

Local Committee:

Dr. R.I. Nugmanov

Dr. M.A. Kazymova

V.A. Afonina

T.R. Gimadiev

Dr. N.I. Ivanova

N.R. Khafizov

B.B. Sattarov

Dr. S.A. Neklyudov

PROGRAM

July 5, 2017
9:00-9:45 Registration
9:45-10:00 Opening ceremony
10:00-10:40 Lecture 1. Alexandre Varnek (University of Strasbourg, France) CHEMOGRAPHY CONCEPT IN CHEMICAL SPACE ANALYSIS Presentation
10:40-11:20 Lecture 2. Timur Madzhidov (Kazan Federal University) MOLECULE REPRESENTATION AND DATABASING OF MOLECULES AND REACTIONS Presentation
11:20-12:00 Lecture 3. Pavel Polishchuk (Univerity of Olomouc, Czech Republic) VIRTUAL SCREENING IN DRUG DISCOVERY Presentation
12:00-14:00 Lunch
14:00-14:30 Key-Note Lecture 1. Ivan Kruglov (Moscow Institute of Physics and Technology, Russia) MACHINE LEARNING INTERATOMIC POTENTIAL FOR AL Presentation
14:30-14:45 Oral 1. Anastasia Nikitina (Lomonosov Moscow State University, Russia) ChEMBL ANTIVIRAL DATA ANALYSIS
14:45-15:00 Oral 2. Shokirbek Shermukhamedov (Kazan National Research Technological University, Russia) STRUCTURE AND DYNAMICS CARBOHYDRATE-WATER-SALT SOLUTIONS AS DERIVED FROM MOLECULAR DYNAMICS SIMULATIONS Presentation
15:00-15:15 Oral 3. Anaelle Clary (Institut de Recherches Servier, France) MOLECULAR RECOMMENDATION ENGINE FOR MULTI-PROPERTIES OPTIMIZATION
15:15-15:30 Oral 4. Karina Pats (St. Petersburg State Chemical Pharmaceutical Academy, Russia) DEVELOPMENT OF THE AFFINE MOLECULE TO CIS PROTEIN BY METHODS OF STRUCTURE-BASED DRUG DESIGN soon
15:30-16:00 Coffee – break
16:00-18:00 Tutorial 1. Andrey Khudoshin (Reaxys, Russia) CHEMOINFORMATIC APPROACH TO DRUG REPOSITIONING USING REAXYS MEDICINAL CHEMISTRY AND PATHWAY STUDIO
18:00-20:00 Poster session / Welcome party
July 6, 2017
9:00-9:40 Lecture 4. Alex Tropsha (University of North Carolina, USA) STRUCTURAL ALERTS FOR PROMISCUITY AND TOXICITY: THE GOOD, THE BAD, OR THE UGLY? Presentation
9:40-10:20 Lecture 5. Hanoch Senderowitz (Bar-Ilan University, Israel) THE MANY DIFFERENT ROLES OF MOLECULAR DYNAMICS IN DRUG DISCOVERY
10:20-10:50 Coffee – break
10:50-11:30 Lecture 6. Vladimir Sulimov (Moscow State University, Russia) DOCKING PROBLEMS: PROTEIN-LIGAND LOW ENERGY MINIMA ANALYSIS Presentation
11:30-12:00 Key-Note Lecture 2. Artem Kondyukov (BIOCAD, Russia) GRAPH DECONVOLUTION METHODS FOR DIRECTED LIGAND GENERATION
12:00-14:00 Lunch
14:00-14:30 Key-Note Lecture 3. Gilles Marcou (University of Strasbourg, France) TRANSDUCTION LEARNING IN QSAR: AN EFFICIENT WAY TO BUILD THE MODELS ON SMALL DATA SETS
14:30-14:45 Oral 5. Mariia Matveieva (Palack? University, Czech) INTERPRETATION OF QSAR MODELS: THE IMPORTANCE OF MOLECULAR CONTEXT IN MINING STRUCTURAL PATTERNS
14:45-15:00 Oral 6. Sophia Borisevich (Ufa Institute of Chemistry, Russia) LUMINESCENT CHARACTERIZATION OF INTERACTION EFFICIENCY IN THE SYSTEM “CYTISINE – AMINO ACID” AS AN INDICATOR OF ANTI-INFLAMMATORY ACTIVITY
15:00-15:30 Coffee – break
15:30-19:30 Social program
July 7, 2017
9:00-9:40 Lecture 7. Vladimir Poroikov (Institute of Biomedical Chemistry, Russia) WAY2DRUG CHEMINFORMATICS PLATFORM FOR DRUG REPURPOSING Presentation
9:40-10:20 Lecture 8. Dragos Horvath (CNRS, France) GENERATIVE TOPOGRAPHIC MAPPING OF CONFORMATIONAL SPACE
10:20-10:50 Coffee – break
10:50-11:30 Lecture 9. Igor Baskin (Moscow State University, Russia) ARTIFICIAL INTELLIGENCE IN SYNTHETIC CHEMISTRY: ACHIEVEMENTS AND PERSPECTIVES
11:30-12:00 Key-Note Lecture 4. Pavel Vassiliev (Volgograd State Medical University, Russia) CONSENSUS APPROACH IN QSAR
12:00-14:00 Lunch
14:00-14:30 Key-Note Lecture 5. Elena Tutubalina (Kazan Federal University) TEXT MINING IN BIOMEDICAL RESEARCH
14:30-14:45 Oral 7. Xavier Martin (IFP Energies nouvelles, France) A NEW APPROACH TO PREDICT OPTIMAL SALINITIES FOR SURFACTANT FORMULATIONS
14:45-15:00 Oral 8. Timur Gimadiev (Kazan Federal University, Russia) CHEMICAL SPACE ANALYSIS OF SN2 REACTIONS IN SOLUTION BASED ON THE CONDENSED REACTION GRAPH APPROACH
15:00-15:15 Oral 9. Sergey Pozdnyakov (Moscow Institute of Physics and Technology, Russia) MACHINE LEARNING POTENTIAL
15:15-15:30 Oral 10. Ivan Mayorov (Pirogov Russian National Research Medical University, Russia) INCREASING OF QSAR MODEL ACCURACY THROUGH DATA HOMOGENISATION ON A CASE STUDY FOR HIV-1 REVERSE TRANSCRIPTASE
15:30-16:00 Coffee – break
16:00-18:00 Tutorial 2. Vitaly Solov’ev (Institute of Physical Chemistry and Electrochemistry, Russia) THE ISIDA_QSPR PROGRAM: ENSEMBLE QSPR MODELING ON FRAGMENT DESCRIPTORS

VENUE

Arrival day is July 04, 2017. campus map

Interactive conference map

Kazan Federal University, founded in 1804 and located on the border of the Volga River, is a key multidisciplinary and research-oriented university of Russia. This place is associated with the beginning of Russian organic chemistry and the names of outstanding chemists such as K.K.Klaus, N.N.Zinin, A.M.Butlerov, V.V.Markovnikov, A.M.Zajtsev, A.E.Arbuzov, B.A.Arbuzov. The spirit of the chemistry of last centuries is carefully preserved in the museum of chemistry at the A.M.Butlerov Chemical Institute of Kazan Federal University.

How to reach the venue of the Seminar

By plane

Kazan International Airport (IATA: KZN) is 30km to the southeast of the city centre. Aeroflot, S7, Transaero and UTAir fly between Kazan and Moscow, and Rossiya Airlines also flies to Kazan from Saint Petersburg. Finnair, Flydubai, Turkish Airlines and Air Baltic, Azal, Air Astana are some of the international carriers flying to Kazan.

By train

Kazan is easy to reach by train, as it is a major station stop for several west-east trains. Depending on the train, travel from Moscow’s Kazan Station can be as short as 11 hours. A direct train from St. Petersburg’s Moscow Station takes 25 hours. Kazan’s train station is located close to the city center, with several hotels, restaurants, and the Kremlin within walking distance of the train station.

PHOTO
All photos from KSSCI2017

TUTORIALS

Tutorial: Chemoinformatic Approach to Drug Repositioning Using Reaxys Medicinal Chemistry and Pathway Studio

Tutorial: The ISIDA_QSPR Program: Ensemble QSPR Modeling on Fragment Descriptors

POSTER SESSION

Date of poster session:

July 5, at 18-00.

The duration of session is 2 hours.

The posters must be displayed in the poster area at any time, but before 16:00 on July, 5. The organisers will provide to the authors the necessary material to display their posters. The posters will be attached on the pre-installed panels. The authors must be present near their presentation during the poster sessions.

The posters should be prepared in English only!

The size of the poster should be 90 cm x 120 cm. Any orientation of the poster on the panel is possible. Portrait orientation is preferable.

Note: Organizing Committee assumes no responsibility for any damage to the exhibited posters and for their safety. Posters that have not been removed by the end of the Conference will be removed and destroyed.

List of poster presentations:

  1. Valentina Afonina, Kazan (Russian Federation) “AUTOMATIC SYSTEM FOR PREDICTION OF OPTIMAL CONDITION FOR HYDROGENATION REACTIONS”
    2. Tagir Akhmetshin, Kazan (Russian Federation) “DEVELOPMENT OF A PREDICTION’S PERFORMANCE METRIC FOR CHEMICAL REACTIONS’ MODELS”
    3. Natalia Burmistrova, Saratov (Russian Federation) “QUANTUM CHEMICAL STUDY OF N-SUBSTITUTED ARYLAMINES AS ANALYTICAL REAGENTS”
    4. Alexander Dmitriev, Moscow (Russian Federation) “PREDICTION OF THE METABOLIC NETWORK FOR XENOBIOTICS IN THE HUMAN ORGANISM”
    5. Marta Glavatskikh, Kazan (Russian Federation) “QSPR MODELING OF TAUTOMERIC EQUILIBRIA USING LOCAL DESCRIPTORS”
    6. Tatyana Grigoreva, St Petersburg (Russian Federation) “MDM2 N-TERMINAL DOMAIN FLEXIBILITY MODELING”
    7. Ekaterina Gubareva, Saint-Petersburg (Russian Federation) “IN SILICO TARGETS AND PATHWAYS PREDICTION FOR A NOVEL MULTICOMPONENT POLYPHENOLIC LIGNIN-DERIVED COMPOSITION BP-CX”
    8. Aigul Khakimova, Kazan (Russian Federation) “PREDICTION OF METABOLIC TRANSFORMATIONS OF ORGANIC COMPOUNDS BY CYP1A2 ISOENZYME USING СONDENSED GRAPH OF REACTIONS”
    9. Mohemmed Faraz Khan, New Delhi (India) “P38? MAP KINASE INHIBITORS: PHARMACOPHORE MODELING, 3D-QSAR, DOCKING AND DRUG LIKELINESS PREDICTION”
    10. Adelya Khayrullina, Kazan (Russian Federation) “DEVELOPMENT OF ALGORITHM FOR CREATING ATOM-ATOMIC MAPPING USING NAIVE BAYES MACHINE LEARNING METHOD”
    11. Elena Khramenkova, Saint Petersburg (Russian Federation) “A COMPUTATIONAL STUDY OF METAL-ORGANIC FRAMEWORKS OXIDATIVE DEGRADATION FOR THE DESIGN OF TUNABLE SMART DRUG DELIVERY SYSTEMS”
    12. Vladlen Klochkov, Volgograd (Russian Federation) “DIRECTED SEARCH FOR NOVEL ?-GLUCOSIDASE INHIBITORS USING STRUCTURE SIMILARITY WITH TESTED SUBSTANCES”
    13. Alexander Maleev, Nizhny Novgorod (Russian Federation) “DOCKING STUDY OF PIRROLOALLOCOLCHICINOIDS – COLCHICINE-BINDING SITE LIGANDS”
    14. Xavier Martin, Rueil-Malmaison (France) “A NEW APPROACH TO PREDICT OPTIMAL SALINITIES FOR SURFACTANT FORMULATIONS”
    15. Svetlana Mukhitdinova, Chelyabinsk (Russian Federation) “THE RELATIONSHIPS BETWEEN IODINE COVALENT AND HALOGEN BONDS FEATURES”
    16. Khalimat Murtazalieva, Moscow (Russian Federation) “COMPUTER-AIDED PREDICTION OF MULTI-TARGET PROFILES: CASE STUDIES FOR CLOZAPINE AND DASATINIB”
    17. Anastasiya Murugova, Volgograd (Russian Federation) “LD50 PREDICTION OF CONDENSED AZOLE DERIVATIVES USING MICROCOSM ADMET”
    18. Svetlana Musaeva, Kazan (Russian Federation) “ELECTRONIC GREEN’S REACTIVITY CHART BASED ON BIG DATA ANALYSIS”
    19. Ramil Nugmanov, Kazan (Russian Federation) “CGR-DB. INTERACTIVE REACTION DATABASE AND CGR-BASED SEARCH ENGINE.”
    20. Alexey Orlov, Moscow (Russian Federation) “EXPLORING CHEMICAL SPACE OF HUMIC SUBSTANCES THROUGH ESI FTICR MS ANALYSIS AND SIMILARITY SEARCHING”
    21. Karina Pats, Saint Petersburg (Russian Federation) “DEVELOPMENT OF THE AFFINE MOLECULE TO CIS PROTEIN BY METHODS OF STRUCTURE-BASED DRUG DESIGN”
    22. Pavel Pogodin, Moscow (Russian Federation) “HOW SHOULD ONE USE AVAILABLE DATA TO BE SUCCESSFUL IN COMPUTER-AIDED SEARCH FOR NOVEL KINASE INHIBITORS?”
    23. Boris Sattarov, Kazan (Russian Federation) “USING CHEMICAL VALIDATION AND STANDARDIZATION PLATFORM TO VALIDATE AND STANDARDIZE PUBLICLY AVAILABLE CHEMICAL DATA”
    24. Vitaly Solovev, Chernogolovka (Russian Federation) “3D MOLECULAR FRAGMENT DESCRIPTORS FOR STRUCTURE-PROPERTY MODELING”
    25. Mikhail Volkov, Moscow (Russian Federation) “ANALYSIS OF SMALL MOLECULES BINDING WITH DENGUE VIRUS ENVELOPE PROTEIN TRIMER”
    26. Elmira Yuryeva, Yekaterinburg (Russian Federation) “MATHEMATICAL EXPRESSIONS FOR THE INTERCONNECTION OF CONDUCTION ELECTRONS MOTION TOPOLOGY WITH SUPERCONDUCTING TRANSITION TEMPERATURE”
    27. Kate Zmievskaya, Volgograd (Russian Federation) “SEARCH FOR MAILLARD REACTION INHIBITORS BY THE SIMILARITY METHOD”

VISA ISSUES
Foreign participant need to have a visa (see Visa requirements).
The Organizing Committee can provide for the participants the official invitation letter to get Russian business visa.

The following documents should be provided:

  • filled questionnaire form.
  • scanned copy of the passport pages with photo, name, issuance data etc.

The documents should be sent by e-mail to scientific secretary Timur Madzhidov strictly before May 15, 2017. Please note that such an invitation letter can only be issued once full payment of the conference registration fee has been received.

ACCOMODATION
Organizing committee proposes the following hotels for accommodation (prices listed with discount):

  • Ibis hotel , 10 minutes of walking to the venue, cost 2500 RUR (~40€) per day
  • Hayal hotel , 3 minutes of walking to the venue, cost 3000 RUR (~45€) per day
  • Regina hotel , 5-10 minutes of walking to the venue, cost 2000-2700 RUR (~30-40€) per day
  • Osobnyak na Teatralnoy hotel, 5 minutes of walking to the venue, cost 2500 RUR (~40€) per day

Please inform us in advance if you need to reserve a room in a hotel (specify the hotel, room category, period of stay). The organizing committee has certain arrangements with hotels and can provide discounts to participants of the School if a room is reserved in advance (one month at least).

REGISTRATION FEE
Registration fee for participants of the School:

  • 2000 RUR (35$, 32€) for undergraduate and PhD students (confirming documents are to be provided)
  • 4000 RUR (65$, 62€) for participants from Universities and scientific institutes
  • 10000 RUR (165$, 155€) for participants from industry
  • 500 RUR (10$, 10€) remote (extramural) participation (includes publication of abstracts of the participant; electronic version of the book of abstracts is provided)

Participants from Kazan Federal University – please contact the Scientific Secretary about paying the fee.

Deadline for the payment of the registration fee: June 10, 2017

Registration fee could be paid at the registration desk. If you plan to pay registration fee at the registration desk, please, contact Scientific Secretary.

Registration fee for participants includes:

  • Participation in all School events
  • Participant handout
  • Book of abstracts
  • Coffee-breaks
  • Welcome party
  • Cultural (excursion) program

Registration fee does NOT include:

  • Payment for accommodation
  • Meals, excluding coffee-breaks and event held by the School
  • Transfer (city transport, transfer to the venue).

Payment details (in US Dollars)

Correspondent bank: The Bank of New York Mellon, NEW YORK NY, 10286 USA (SWIFT: IRVTUS3N)

Correspondent account: 890-0514-841

Beneficiary bank: SWIFT BINORUMM BENEFICIARY acc. n. 40703840033120200011

Intermediary Bank: MDM Bank, Moscow, (SWIFT: MOBWRUMM)

Payment description: Registration Fee KSSCI2017, Last Name, First Name

Payment details (in Euro)

Correspondent bank: Commerzbank AG, Frankfurt am Main, Germany, (SWIFT: COBADEFF)

Correspondent account: 400887073501EUR

Beneficiary Bank: SWIFT BINORUMM BENEFICIARY acc. n. 40703978633120200011

Intermediary bank: MDM Bank, Moscow, SWIFT: MOBWRUMM

Payment description: Registration Fee KSSCI2017, Last Name, First Name

Payment details (in Rubles)

Общественная организация «Республиканское химическое общество им.Д.И. Менделеева Татарстана» 420029 Казань,ул.Арбузова,8,(абон.ящик 170)

тел./факс 2-79-56-61

Р/с 40703810833120100011 в Казанском филиале ПАО «БИНБАНК»

К/с 30101810322020500746

БИК 049205746 г.Казань

ИНН 1660003183/166001001

ОКПО 27891814

ОГРН 1021600008652

ОКОНХ 95110,95120

ОКВЭД 9133

Цель платежа: Оргвзнос KSSCI2017, ФИО отправителя

Организация получатель: Общественная организация “Республиканское химическое общество им. Д.И. Менделеева Татарстана”.

Договор , Акт выполненных работ

 1   22 h   kssci2017

Проект “Повышение эффективности первичного скрининга биологически активных соединений с использованием вычислительных моделей”

Сведения о ходе выполнения проекта в рамках реализации федеральной целевой программы “Исследования и разработки по приоритетным направлениям развития научно-технологического комплекса России на 2014-2020 годы”

СОДЕРЖАНИЕ

Общие сведения по проекту
Ход выполнения проекта
Разработки
Участники проекта
Публикации по проекту

ОБЩИЕ СВЕДЕНИЯ ПО ПРОЕКТУ

Соглашение о предоставлении субсидии с Минобрнауки России: №14.587.21.0049 от 12.02.2018, уникальный идентификатор проекта RFMEFI58718X0049

Тема проекта: Повышение эффективности первичного скрининга биологически активных соединений с использованием вычислительных моделей

Приоритетное направление: Науки о жизни (НЖ)

Критическая технология: Нано-, био-, информационные, когнитивные технологии

Период выполнения: 12.02.2018 – 31.12.2020 гг.

Сроки выполнения этапов проекта:

Этап №1 – 12.02.2018-31.12.2018

Этап №2 – 01.01.2019-31.12.2019

Этап №3 – 01.01.2020-31.12.2020

Плановое финансирование проекта: 42.12 млн. руб.

Бюджетные средства 21.00 млн. руб.,

Внебюджетные средства 21,12 млн. руб.

Исполнитель: федеральное государственное автономное образовательное учреждение высшего образования “Казанский (Приволжский) федеральный университет”

Иностранный партнер: Университет Палацкого в Оломоуце(Univerzita Palack?ho v Olomouci), Чехия

Ключевые слова: биологический скрининг, дизайн лекарств, биологическая активность, фармакофоры, моделирование структура-свойство, дизайн библиотек соединений, разнообразные библиотеки, сфокусированные библиотеки, пары сопоставленных молекул, молекулярная стабильность, профиль биологической активности, киназа MARK4,рецептор СВ1, аденозиновый рецептор, конденсированный граф реакции

***

Сведения о ходе выполнения проекта на этапе №1

В ходе выполнения проекта по Соглашению о предоставлении субсидии №14.587.21.0049 от 12.02.2018 г., с Минобрнауки России в рамках федеральной целевой программы «Исследования и разработки по приоритетным направлениям развития научно-технологического комплекса России на 2014-2020 годы» на этапе №1 в период с 12.02.2018 г. по 31.12.2020 г. выполнялись следующие работы:

получателем субсидии за счет средств субсидии:

1.1 Проведение патентного поиска и поиска по литературе.

1.2 Разработка программного модуля для поиска общего фармакофора на основании структур активных и неактивных молекул.

1.3 Разработка подхода для дизайна библиотек с использованием карт GTM.

1.4 Разработка алгоритма виртуального скринирования библиотек соединений с использованием фармакофорных моделей.

иностранным партнером за счет собственных средств:

1.5 Литературно-патентный поиск, поиск данных в открытой литературе.

1.6 разработка нового подхода для фармакофорного моделирования, основанного на создании сигнатуры фармакофора.

1.7 Разработка модуля для создания разнообразной библиотеки соединений с использованием 3D фармакофорных сигнатур.

При этом были получены следующие результаты:

  1. Был разработан подход для создания 3D сигнатур фармакофоров. На основе него разработан и успешно апробирован в нескольких ретроспективных случаях подход для выявления трехмерных сигнатур фармакофоров при создании фармакофорных моделей с использованием информации об активных/неактивных соединениях для последующего виртуального скрининга. Показано, что точность моделей на внешней тестовой выборке в основном достигала значений 50%-100% при достаточно высокой полноте, достигающей 80%.
  1. Разработан алгоритм для выявления репрезентативной выборки структурно разнообразных соединений на основе использования карт, полученных с использованием метода Генеративного топографического отображения. Было разработано 7 различных карт, которые были использованы для отбора. Разработанный алгоритм помогает выбирать репрезентативную выборку из представленного набора данных. Предложенный алгоритм позволяет добиться увеличения обогащения выборки активными соединениями на 10%-15% при уменьшении объема выборки до 1%-30% от изначального объема, что достаточно высоко в сравнении с имеющимися аналогами.
  1. Разработан подход, который позволяет проводить быстрый скрининг баз данных с использованием разработанного представления молекул в виде фармакофорных сигнатур. Для ускорения процесса скринирования используется трехстадийный алгоритм, включающий скринирование фармакофорных фингерпринтов, изоморфное вложение полных графов фармакофора и генерацию трехмерных фармакофорных хешей. С использованием заранее подготовленной базы данных соединений для скринирования скорость работы составляет до 1 000 000 молекул в час.
  1. Проводился сбор данных из базы ChEMBL для последующего моделирования. Был разработан специальный подход для автоматической аннотации активности. Собрано 2 243 052 данных по биологической активности. Начат сбор данных по константам скоростей реакций бимолекулярного нуклеофильного замещения в водной среде и среде вода-ДМСО для последующего моделирования гидролитической стабильности соединений. Полученная база данных химических реакций насчитывает 550 реакций и является уникальной, не имеющей аналогов в мире. Собранные данные требуется для разработки технологий в рамках проекта в последующем.
  1. Разработан подход для дизайна разнообразной библиотеки соединений с использованием фармакофорных сигнатур. Основная идея подхода заключалась в отборе библиотек соединений, не имеющих аналогичных фармакофоров. Показано, что обогащение выборки активными соединениями может на 70% превышать долю хитов при случайном отборе.

Предложенная технология поиска фармакофоров использует принципиально новый подход к поиску фармакофоров. В отличие от существующих некоммерческих аналогов не требует знания о «биологически активной» конформации молекулы. В отличие от имеющихся коммерческих аналогов не проводится попарного выравнивания и сравнения молекул в обучающей выборке при создании фармакофора, не используются скоринг-функции. Разработанный подход моделирования является универсальным, с открытым исходным кодом, может быть использован в виртуальном скрининге на основе структуры биомишени. Качество работы подхода превышает качество часто используемого виртуального скрининга с использованием поиска по сходству на
фармакофорных фингерпринтах. Таким образом, предложенный подход по ряду параметров превосходит аналогичные работы, определяющие мировой уровень.

Новизна подхода отбора библиотеки разнообразных соединений с использованием карт заключается в принципиально новом подходе к отбору соединений с использованием снижения размерности химического пространства. В отличие от имеющихся подходов, предложенный подход к отбору отличается наглядностью и возможностью использования полученных карт для визуального анализа, построения моделей структура-свойство.

Скорость и качество работы алгоритма скринирования с использованием фармакофорных сигнатур сопоставима или превосходит аналогичные подходы, определяющих мировой уровень. В отличие от коммерческих инструментов не используются функции скоринга или времязатратные процедуры выравнивания фармакофоров. Новизна подхода заключается в использовании принципиально нового типа представления фармакофоров и новых технологий ускорения поиска.

Предложен принципиально новый метод отбора разнообразной библиотеки соединений с использованием фармакофорных сигнатур. Не имеется аналогичных инструментов, которые отбирали бы соединения по имеющимся в них фармакофорам. Качество работы алгоритма сопоставимо с имеющимися аналогами, при этом подход отличается наглядностью, скоростью и простотой интерпретации результатов.

Таким образом, предложены новые вычислительные подходы для отбора библиотек для проведения биологического скрининга.

По качеству полученных результатов предложенные технологии успешно конкурируют с основными мировыми аналогами.

Полученные результаты соответствуют техническим требованиям этапа №1 проекта и подтверждают перспективность продолжения работ по проекту.

Плановые и достигнутые значения показателей результативности реализации проекта на этапе №1 приведены в таблице.

ХОД ВЫПОЛНЕНИЯ ПРОЕКТА

Заявочная документация к проекту:

  1. Пояснительная записка (pdf)
  1. Календарный план-график исполнения обязательств при проведении исследований (выполнении проекта) (pdf)

Отчетная документация:

Этап №1 – 12.02.2018-31.12.2018

  1. Отчет о научной работе
  1. Отчет о патентных исследованиях
  1. Резюме проекта по этапу №1
  1. Основные результаты этапа №1

В ходе выполнения проекта по Соглашению о предоставлении субсидии от 12.02.2018 № 14.587.21.0049 с Минобрнауки России в рамках федеральной целевой программы «Исследования и разработки по приоритетным направлениям развития научно-технологического комплекса России на 2014-2020 годы» на этапе № 1 в период с12.02.2018 по 31.12.2018 выполнялись
следующие работы:

получателем субсидии за счет средств субсидии:

1.1 Проведение патентного поиска и поиска по литературе.

1.2 Разработка программного модуля для поиска общего фармакофора на основании структур активных и неактивных молекул.

1.3 Разработка подхода для дизайна библиотек с использованием карт GTM.

1.4 Разработка алгоритма виртуального скринирования библиотек соединений с использованием фармакофорных моделей.

иностранным партнером за счет собственных средств:

1.5 Литературно-патентный поиск, поиск данных в открытой литературе.

1.6 разработка нового подхода для фармакофорного моделирования, основанного на создании сигнатуры фармакофора.

1.7 Разработка модуля для создания разнообразной библиотеки соединений с использованием 3D фармакофорных сигнатур.

План исследований первого этапа выполнения проекта был выполнен в полном объеме, все запланированные на первый этап (2018 год) задачи были решены в полном объеме.

При этом были получены следующие результаты:

  1. был проведен патентный поиск и поиск по патентной литературе как получателем субсидии (пункт 1.1 Плана-графика исполнения обязательств), так и Иностранным партнером (пункт 1.5 Плана-графика исполнения обязательств);
  2. Иностранным партнером был разработан подход и реализован программный продукт для фармакофорного моделирования, основанного на создании сигнатуры фармакофора (пункт 1.6 Плана-графика исполнения обязательств);
  3. на основании разработанного подхода создания сигнатуры фармакофора получателем субсидии был разработан модуль для поиска общего фармакофора на основании структур активных и неактивных молекул (пункт 1.2 Плана-графика исполнения обязательств);
  4. на основании разработанного подхода создания сигнатуры фармакофора получателем субсидии был разработан алгоритм виртуального скринирования библиотек соединений с использованием фармакофорных моделей (пункт 1.4 Плана-графика исполнения обязательств);
  5. на основании разработанного подхода создания сигнатуры фармакофора Иностранным партнером был разработан модуль для создания разнообразной библиотеки соединений с использованием 3D фармакофорных сигнатур (пункт 1.7 Плана-графика исполнения обязательств);
  6. был разработан подход для дизайна библиотек с использованием карт GTM (пункт 1.3 Плана-графика исполнения обязательств).

Получены следующие результаты, входящие в перечень научных и научно-технических результатов, подлежащих получению при выполнении исследований получателем субсидии, раздел 2.1 Технического задания:

  1. 2.1.1 «комплекс программ и библиотек на языке Python для проведения фармакофорного моделирования на основе структур активных и неактивных молекул, проведения скрининга с использованием полученных фармакофорных моделей, создания разнообразной библиотеки, анализа молекулярно-динамических траекторий и выявления 3D фармакофоров на основании структуры биомишени» – выполнено частично, разработан модуль фармакофорного моделирования на основе структур активных и неактивных молекул, технология проведения скрининга с использованием полученных фармакофорных моделей, и модуль для создания разнообразной библиотеки. Остальные результаты запланированы на второй и третий год выполнения проекта;
  2. 2.1.2 «программный модуль для дизайна библиотек с использованием картографирования химического пространства методом GTM, а также соответствующее веб-приложение» – выполнено;
  3. 2.1.5 «база данных по скоростям реакций нуклеофильного замещения, расщепления связей и гидролиза эфирной связи» – выполнено частично, начат сбор данных, который будет продолжен во второй и третий год исполнения проекта.

Получены следующие результаты, входящие в перечень научных и научно-технических результатов, подлежащих получению при выполнении исследований Иностранным партнером, раздел 2.2 Технического задания:

  1. 2.2.1 «разработка нового подхода для фармакофорного моделирования, основанного на создании сигнатуры фармакофора» – выполнено;
  2. 2.2.2 «программа на языке Python для вычисления сигнатур 3D фармакофоров» – выполнено.

На основании проведенных исследований и полученных результатов можно сделать следующие обобщения и выводы:

  1. разработан и успешно апробирован в нескольких ретроспективных случаях новый подход к трехмерному представлению фармакофоров молекул с использованием фармакофорных сигнатур. Разработанные трехмерные сигнатуры фармакофоров могут быть использованы для создания фармакофорных моделей с использованием информации об активных/неактивных соединениях для последующего виртуального скрининга. В отличие от существующих некоммерческих продуктов в рамках данного подхода не требуется предварительно заданная геометрия активных соединений, используемых в качестве шаблона, или явное выравнивание фармакофоров. Эффективность разработанных трехмерных моделей фармакофоров была сравнимы или выше, чем производительность виртуального скрининга на основе сходства двумерных фармакофорных дескрипторов. Показано, что разработанные трехмерные фармакофоры были способны выявлять важные лиганд-белковые взаимодействия в нативных позах известных лигандов в лиганд-белковых комплексах;
  2. разработан алгоритм для выявления репрезентативной выборки структурно разнообразных соединений на основе использования карт, полученных с использованием метода Генеративного топографического отображения. Идея подхода заключается в выборке данных, максимально равномерно покрывающей карту химического пространства. Разработанный алгоритм помогает выбирать репрезентативную выборку из представленного набора данных. Показано, что с использованием одной карты или консенсуса из нескольких карт алгоритм позволяет сократить объем выборки до 1%-30% от исходного объема, при этом вероятность найти активное соединение в ней повысится на 10%. Показано, что алгоритм чувствителен к типу карты и требуется тщательный выбор карты, достаточно хорошо представляющей химическое пространство. Полученная с использованием данного подхода величина обогащения слабо зависит от размера отбираемой библиотеки и, следовательно, может использоваться для отбора любых выборок разумного размера;
  3. разработан подход, который позволяет проводить скрининг баз данных с использованием разработанного представления молекул в виде фармакофорных сигнатур. Для ускорения процесса скринирования используется трехстадийный алгоритм. На первом этапе молекулярные отпечатки фармакофора используются в качестве фильтра для быстрого определения фармакофоров, которые не подходят под данный запрос. На следующем этапе полный граф фармакофора молекулы-кандидата изоморфно вкладывают в фармакофоры молекул, прошедших первый фильтр. На последнем этапе сравниваются трехмерные фармакофорные хеши запрашиваемой модели фармакофоров и соответствующих подграфов потенциальных фармакофоров, чтобы определить, имеют ли они идентичную топологию и стерео-конфигурацию. С использованием подготовленной базы данных соединений для скринирования время работы зависит от числа молекул, проходящих фильтр, и составляет от 0.6 до 11 секунд для 1000 конформеров. Это достаточно хорошая скорость, позволяющая использовать алгоритм в последующих приложениях;
  4. проведен сбор данных из различных баз для их последующего моделирования. Из базы данных ChEMBL извлекли результаты для множества различных типов биологических испытаний. Чтобы подготовить данные для последующего моделирования, создан подход для чистки данных, который на основе информации, приведенной в базе данных выявляет тип активности и осуществляет классификацию объектов на активные и неактивные. Собрана информация для 411 биологических мишеней 6 типов. Общее число данных по биологической активности соединений составило 2 243 052. Проведен сбор данных по скоростям реакций бимолекулярного нуклеофильного замещения в водной среде и среде вода-ДМСО, используемой для проведения биологического скрининга. Полученная база данных химических реакций насчитывает 550 реакций;
  5. разработан подход для создания разнообразной библиотеки химических соединений с использованием фармакофорных сигнатур, который был реализован в виде программного модуля. Данный подход выявлял набор из минимального числа соединений, покрывающих максимально широкое фармакофорное пространство.

Работы, запланированные на первый этап выполнения проекта (2018 год) выполнены полностью, в соответствии с п. 1 Плана-графика исполнения обязательств при проведении исследований, Приложение 2 к Соглашению о предоставлении субсидии.

Официальный сайт Получателя субсидии с информацией о ходе выполнения проекта: http://cimm.kpfu.ru/screening2018.

Разработанные в рамках проекта инструменты могут использоваться на этапе проведения первичного моделирования при создании библиотек химических соединений для биологического скрининга при наличии информации об активных и неактивных соединениях (подход для выявления фармакофоров, инструмент вычислительного скрининга), при отсутствии информации о биологической мишени и активных соединениях (подход для выбора разнообразной библиотеки). Этот этап является критически важным при разработке новых лекарственных препаратов. Таким образом, можно ожидать, что разработанные подходы позволят существенно повысить качество и эффективность проведения скрининга соединений. Кроме того, разработанные инструменты и собранные данные можно использовать для рационального дизайна лекарств, а именно как инструменты виртуального скрининга на основе структуры лигандов. Сочетание разработанных подходов с имеющимися может позволить улучшить качество предсказаний и расширить область применения. Созданные инструменты доступны широкому кругу исследователей и являются бесплатными альтернативами дорогостоящим коммерческим продуктам, используемым при рационально дизайне лекарственных препаратов.

Сравнение результатов анализа литературы и патентного поиска с полученными результатами показывает, что разработанные продукты являются конкурентоспособными и не уступающими лучшим достижениям в данной области. Так, разработанная технология поиска фармакофоров в отличие от существующих некоммерческих аналогов не требует знания о «биологически активной» конформации молекулы. В отличие от имеющихся коммерческих аналогов не проводится попарного выравнивания и сравнения молекул в обучающей выборке при создании фармакофора. Это позволяет потенциально обнаружить лучший возможный фармакофор в выборке, то есть наиболее часто встречающийся в активных и редко встречающийся в неактивных, если объем выборки не слишком велик. Кроме того, разработанный подход моделирования является универсальным, и может быть использован в виртуальном скрининге на основе структуры биомишени. Это недоступно для существующих коммерческих инструментов. Предложенный подход является открытым, с открытым исходным кодом, может быть использован для дальнейшей валидации и применения широкой научной общественностью для решения собственных задач. Разработанный инструмент для поиска разнообразной библиотеки с использованием карт GTM позволяет улучшить выбор соединений по сравнению со случайным подходом даже в отсутствие информации о биомишени и активных лигандах. При этом, в отличие от существующих подходов, использованием карт дает ему интуитивную ясность, возможность интерпретации или ручного анализа при необходимости. Разработанный инструмент скрининга по заданному фармакофору достаточно быстр, уступает существующему подходу Pharmer, сопоставим по скорости работы с другими инструментами. Однако наши фармакофорные модели могут быть преобразованы в формат, используемый Pharmer, за счет чего можно использовать преимущества обеих технологий. Кроме того, Pharmer специально создавался для сверхскоростного виртуального скринирования библиотек: проводилась специальная работа по оптимизации кода, для ускорения использовались компилируемые языки программирования и низкоуровневое программирование – что не было нашей задачей на данном этапе. Мы уверены, что при некоторой оптимизации программной реализации наших инструментов можно добиться существенного ускорения скрининга.

Таким образом, в рамках данного этапа выполнения проекта был разработан ключевой алгоритм генерации фармакофоров и скрининга с их использованием, что необходимо для решения остальных задач по проекту. Были разработаны технологии отбора соединений с использованием виртуального скрининга, основанного на структурах лигандов с использованием данного фармакофора, а также технология отбора разнообразных библиотек. Иностранным партнером был разработан способ создания разнообразной библиотеки с помощью фармакофорного подхода. В этой связи задачу 1 проекта «разработка алгоритмов для выбора разнообразных и сфокусированных библиотек химических соединений с использованием подхода генерации сигнатуры трехмерного фармакофора, а также с использованием картографирования с использованием метода Генеративного топографического отображения», приведенной во введении, можно считать решенной в полном объеме. Сбор данных для моделирования, завершенный на данном этапе проекта, а также разработка инструмента скрининга библиотек соединений, требуется для решения задачи 2 «разработки алгоритмов для генерации сфокусированной библиотеки соединений с использованием предсказания количественных изменений активности при замещении одних фрагментов на другие» и задачи 3 «разработки алгоритмов для отбора соединений на основе анализа профиля биологической активности соединений и анализа их стабильности в растворителях, используемых для высокопроизводительного скрининга», предпосылки для решения которых были созданы на данном этапе выполнения проекта.

РАЗРАБОТКИ

  • pmapper  – базовый модуль для создания сигнатур трехмерных фармакофоров
  • psearch  – модуль для автоматической генерации трехмерных моделей фармакофоров на основе предоставленного набора соединений с измеренными значениями активности и последующего виртуального скрининга с использованием полученных моделей
  • GTM_Diverse  – модуль для дизайна разнообразных библиотек с использованием карт GTM
  • rank  – скрипт ранжирования

PMAPPER

Модуль для создания хешированных сигнатур трехмерных фармакофоров

Последняя версия модуля Pmapper (Python) доступна по ссылке: https://github.com/DrrDom/pmapper

Pmapper – это модуль, написанный на языке программирования Python, для создания сигнатур трехмерных фармакофоров и молекулярных отпечатков (фингерпринтов). Сигнатуры уникально кодируют трехмерные фармакофоры с помощью хешей, подходящих для быстрой идентификации идентичных фармакофоров.

Зависимости

  • rdkit >= 2017.09
  • networkx >= 1.11

Примеры

Загрузка модулей

from rdkit import Chem

from rdkit.Chem import AllChem, ChemicalFeatures

from pharmacophore import Pharmacophore as P, read_smarts_feature_file, load_multi_conf_mol

from pprint import pprint

Create pharmacophore from a single comformer using feature definition from SMARTS file

# load a molecule from SMILES and generate 3D coordinates

mol = Chem.MolFromSmiles('C1CC(=O)NC(=O)C1N2C(=O)C3=CC=CC=C3C2=O')  # talidomide

mol = Chem.AddHs(mol)

AllChem.EmbedMolecule(mol, randomSeed=42)

# load pharmacophore feature definitions from SMARTS file

smarts = read_smarts_feature_file('smarts_features.txt')

# create pharmacophore

p = P()

p.load_from_smarts(mol, smarts)

Get 3D pharmacophore signature

# get 3D pharmacophore signature

sig = p.get_signature_md5()

print(sig)

Output:

f2e16f52f6f6ca6e97fc5844bfd35d36

Get 3D pharmacophore signature with non-zero tolerance

sig = p.get_signature_md5(tol=5)

print(sig)

Output:

fb535302db2e5d624aa979b6e8dfbdf2

Create pharmacophore from a single conformer using RDKit feature factory

# load pharmacophore using RDKit factory and get 3D pharmacophore signature

factory = ChemicalFeatures.BuildFeatureFactory('smarts_features.fdef')

p.load_from_feature_factory(mol, factory)

sig = p.get_signature_md5()

print(sig)

Output:

f2e16f52f6f6ca6e97fc5844bfd35d36

Create pharmacophores for a multiple conformer compound

# create multiple conformer molecule

AllChem.EmbedMultipleConfs(mol, numConfs=10, randomSeed=1024)

ps = load_multi_conf_mol(mol, smarts_features=smarts)

sig = [p.get_signature_md5() for p in ps]

pprint(sorted(sig))  # identical signatures occur

Output:

['13d168458ab1f251157f2422efcce312',

 '13d168458ab1f251157f2422efcce312',

 '182a4cfa756fe8b7f736a7f7ac0e8e0a',

 '182a4cfa756fe8b7f736a7f7ac0e8e0a',

 '4234e9d249874a5009f1e312dd885d80',

 'ab273dd083c4f2e3424ba917b121b846',

 'b6ec58553d2984bd398b4520bd1545cc',

 'bfc43365b2657d08b6bb888e4d8ec71b',

 'f5ca8e406dae31182e2b06fde7452b75',

 'fc4a85e818fc0b3f034a7af42fa5ca69']

Generate 3D pharmacophore fingerprint

# generate 3D pharmacophore fingerprint which takes into account stereoconfiguration

b = p.get_fp(min_features=4, max_features=4)   # set of activated bits

print(b)

Output (a set of activated bit numbers):

{1922, 1795, 779, 1040, 528, 920, 154, 1437, 287, 1313, 1447, 1961, 941, 690, 1203, 65, 1346, 709, 1486, 1366, 2006, 1750, 1016, 346, 603, 1116, 354, 995, 228, 2024, 1900, 1524, 888, 2043}

Change settings:

b = p.get_fp(min_features=4, max_features=4, nbits=1024, activate_bits=2)

print(b)

Output (a set of activated bit numbers):

{897, 514, 259, 389, 520, 264, 143, 16, 529, 656, 787, 660, 24, 285, 157, 32, 673, 550, 683, 173, 301, 558, 45, 945, 177, 692, 950, 443, 444, 61, 960, 961, 448, 321, 709, 197, 587, 460, 77, 718, 720, 80, 339, 596, 723, 470, 980, 345, 601, 476, 354, 614, 743, 1003, 875, 494, 367, 497, 114, 1012, 244, 630, 377, 762, 507, 508, 1021}

Save/load pharmacophore

p.save_to_pma('filename.pma')

# Output is a text file having json format.

p = P()

p.load_from_pma('filename.pma')

Support LigandScout pml-files

LigandScout models saved as pml-files can be read using p.load_ls_model. Also a pharmacophore can be stored in this format in order to export to LigandScout (p.save_ls_model).

Speed tests

Generation of pharmacopohre signatures (hashes) is a CPU-bound task. The computation speed depends on the number of features in pharmacophores.
Tests were run on 500 compounds (a random subset from Drugbank). Up to 50 conformers were generated for each compound. Up to 100 pharmacophores having a particular number of features were chosen randomly from the whole number of 25000 pharmacophores to generate pharmacophore signatures.

Laptop configuration:

  • Intel(R) Core(TM) i7-5500U CPU @ 2.40GHz
  • 12 GB RAM
  • calculation was run in 1 thread (the module is thread safe and calculations can be parallelized)

pharmacophore generation: 19.21 s

total number of pharmacophores: 25000

pharmacophore hash generation:

50 pharmacophores having 2 features: 0.00 s; time per pharmacophore: 0.00000 s

100 pharmacophores having 3 features: 0.01 s; time per pharmacophore: 0.00010 s

100 pharmacophores having 4 features: 0.01 s; time per pharmacophore: 0.00010 s

100 pharmacophores having 5 features: 0.04 s; time per pharmacophore: 0.00040 s

100 pharmacophores having 6 features: 0.12 s; time per pharmacophore: 0.00120 s

100 pharmacophores having 7 features: 0.24 s; time per pharmacophore: 0.00240 s

100 pharmacophores having 8 features: 0.51 s; time per pharmacophore: 0.00510 s

100 pharmacophores having 9 features: 0.94 s; time per pharmacophore: 0.00940 s

100 pharmacophores having 10 features: 1.86 s; time per pharmacophore: 0.01860 s

100 pharmacophores having 11 features: 3.02 s; time per pharmacophore: 0.03020 s

100 pharmacophores having 12 features: 4.17 s; time per pharmacophore: 0.04170 s

100 pharmacophores having 13 features: 7.04 s; time per pharmacophore: 0.07040 s

100 pharmacophores having 14 features: 9.29 s; time per pharmacophore: 0.09290 s

100 pharmacophores having 15 features: 12.94 s; time per pharmacophore: 0.12940 s

100 pharmacophores having 16 features: 17.79 s; time per pharmacophore: 0.17790 s

100 pharmacophores having 17 features: 23.58 s; time per pharmacophore: 0.23580 s

100 pharmacophores having 18 features: 33.83 s; time per pharmacophore: 0.33830 s

100 pharmacophores having 19 features: 40.43 s; time per pharmacophore: 0.40430 s

100 pharmacophores having 20 features: 58.30 s; time per pharmacophore: 0.58300 s

Citation

Ligand-Based Pharmacophore Modeling Using Novel 3D Pharmacophore Signatures

Alina Kutlushina, Aigul Khakimova, Timur Madzhidov, Pavel Polishchuk

Molecules 2018, 23(12), 3094

https://doi.org/10.3390/molecules23123094

PSEARCH

Модуль для автоматической генерации трехмерных моделей фармакофоров и последующего виртуального скрининга

Последняя версия модуля psearch (Python) доступна по ссылке: https://github.com/meddwl/psearch

Подготовка данных

В данном контексте под подготовкой данных подразумевается разделение набора данных по активности, генерация стереоизомеров и конформеров для каждой молекулы и генерация базы данных с фармакофорным представлением соединений. Фармакофорное представление соединения – это полный граф, вершинами которого являются все возможные фармакофорные центры соединения, а ребрами – расстояния между ними.

Запускает процесс подготовки данных модуль prepare_dataset.py . На вход он принимает файл формата .smi (содержащий SMILES
Пример:

prepare_dataset.py -i test/input.smi --label -n 100 -e 100 -r 0.5 -c 4

Фармакофорное моделирование и виртуальный скрининг

  1. Генерация фармакофоров осуществляется в 2 этапа:

(а) сначала генерируются все возможные квадруплеты,

(б) после создаются наиболее сложные фармакофорные модели, количество и качество которых регулируются статистикой.

(а) Для генерации квадруплетов используется модуль create_subpharm.py .

Параметры:

-d/--input_db

, путь к базе данных, в которой хранится информация о всех молекулах (тренировочного и тестового наборов), обязательный параметр.

-ts/--file_trainset

, путь к файлу со списком молекул тренировочного набора, обязательный параметр.

-tol/--tolerance

, параметр, который используется для генерации знака стереоконфигурации соединения, по умолчанию этот параметр равен 0.

-l/--lower

, число фармакофорных центров, с которым будут сгенерированы фармакофорные модели, по умолчанию этот параметр равен 4.

Пример:

psearch/scripts/create_subpharm.py -d test/compounds/active.db -ts test/trainset/active_tr1.txt -tol 0 -l 4

(б) Генерация фармакофорных моделей. На этом этапе генерируется статистика, с помощью которой оценивается качество полученных моделей, и лучшие фармакофорные модели сохраняются в папку models с расширением .pma.

Эту функцию выполняет модуль gen_subph.py .

Параметры:

-a/--in_subph_active

, путь к файлу с активными квадруплетами, полученные на предыдущем шаге.

-i/--in_subph_inactive

, путь к файлу с неактивными квадруплетами, полученные на предыдущем шаге.

-adb/--in_active_database

, путь к базе данных с активными соединениями.

-idb/--in_inactive_database

, путь к базе данных с неактивными соединениями.

-ats/--in_active_trainset

, путь к файлу со списком активных молекул тренировочного набора.

-l/--lower

, число фармакофорных центров, которые имеют фармакофорные модели на входе.

Пример:

psearch/scripts/gen_subph.py -a test/trainset/ph_active_tr1.txt -i test/trainset/ph_inactive_tr1.txt -adb test/compounds/active.db -idb test/compounds/inactive.db -ats test/trainset/active_tr1.txt -l 4
  1. Виртуальный скрининг с использованием полученных фармакофорных моделей осуществляется модулем screen_db.py .

Параметры:

-d/--database

, путь к базе данных.

-q/--query

, путь к фармакофорной модели (.pma файл).

-o/--output

, путь к файлу, куда бдут сохранены результаты виртуального скрининга.

Пример:

psearch/scripts/screen_db.py -d test/compounds/active.db -q models/model1.pma -o screen/screen_active_model1.txt

GTM_DIVERSE

Последняя версия модуля GTM subset selection (Python) доступна для скачивания по ссылке: download

GTM subset selection – это модуль, написанный на языке программирования Python, для выборки минимального набора данных с равномерным покрытием карты GTM. Данный подход позволяет отобрать наиболее разнообразные молекулы в выборку. Для работы алгоритма нужны проекции молекул на карту GTM (file.svm or file.rsvm) и специально форматированный файл с биологическими активностями(y.txt).

Зависимости

  • CIMtools >= 3.0
  • CGRtools >=3.0
  • jupyter last version
  • python 3.7

УЧАСТНИКИ ПРОЕКТА

  1. Антипин Игорь Сергеевич, ведущий научный сотрудник, д.х.н.
  2. Афонина Валентина Александровна, младший научный сотрудник, без ученой степени
  3. Баскин Игорь Иосифович, ведущий научный сотрудник, д. ф.-м. н.
  4. Батыршин Динар Салихович, инженер, без ученой степени
  5. Гимадиев Тимур Рустемович, младший научный сотрудник, без ученой степени
  6. Занков Дмитрий Владимирович, лаборант, без ученой степени
  7. Кутлушина Алина Ураловна, лаборант, без ученой степени
  8. Маджидов Тимур Исмаилович, старший научный сотрудник, к.х.н.
  9. Мухаметгалеев Равиль Наилевич, лаборант, без ученой степени
  10. Назмиев Ильдар Анасович, ведущий инженер, без ученой степени
  11. Неклюдов Сергей Александрович, старший научный сотрудник , к.х.н.
  12. Рахимбекова Асима, младший научный сотрудник, без ученой степени
  13. Фатыхова Аделия Альбертовна, инженер, без ученой степени

ПУБЛИКАЦИИ ПО ПРОЕКТУ

2018

  1. Kutlushina, A. Ligand-Based Pharmacophore Modeling Using Novel 3D Pharmacophore Signatures / A. Khakimova, T. Madzhidov, P. Polishchuk // Molecules](https://www.mdpi.com/journal/molecules). – 2018. – V. 23, Iss. 12. – Art.№ 3094. – doi: 10.3390/molecules23123094. – Q1 (Analytical Chemistry, Chemistry (miscellaneous), Pharmaceutical Science)
 3   1 d   screening2018

About Us

Chemoinformatics and Molecular Modeling Laboratory was established in 2014. The main purpose of our laboratory is to use data mining tools and variety of molecular modeling technologies for solving practical problems of chemistry.

Researches

The following areas are studied in Chemoinformatics and Molecular Modeling Laboratory:

  • using and development of chemoinformatics and molecular modeling tools for drug design and design of new materials;
  • modeling of organic and metabolic reactions by methods of chemoinformatics: from empirical to predictive chemistry;
  • data mining for translational medicine.

Research work: Using and development of chemoinformatics and molecular modeling tools for drug design and design of new materials

The aim of the project: using data mining tools and the variety of molecular modeling technologies for solving practical problems of chemistry.

The task of the project: investigation of the nature of the chemical bonds and the reactivity of the compounds by means of quantum chemistry tools, development of non-classical analysis approaches “structure-property”, including capable of working with complex chemical entities (such as mixtures of compounds, solutions and materials), computer-aided design of new drugs on the basis of ligand and biological target structure.

Methods and Approaches:

  • development of the methodology of the continuous fields method for three-dimensional “structure-property” modeling (3DQSAR);
  • models development for the simulation of the properties which are important in terms of antimalarial activity;
  • development of the methodology for modeling of molecular properties in solutions for reactions of bimolecular substitution;
  • study the nature of intermolecular bonds by the approaches from “Atoms in Molecules” theory and “interacting quantum atom” approach.

The results of these researches have fundamental importance for modern organic chemistry and are found to be of great interest for chemists, theoreticians and experimentalists. The methodology of modeling of the properties of the compounds in solutions has been developed and tested, nature of binding of selenium atom with IIIA group acceptors which are important in terms of creation of new materials for semiconductors has been studied, the method “3DQSAR” has been developed – these are our theoretical results in the framework of this project. The model that allows predicting the redox potential of organic molecules (it is an important descriptor of antimalarial activity) has been obtained and made available – this is the practical result.

Research work: Chemoinformatics approaches to organic and metabolic reactions: from empirical to predictive chemistry

This project is carried out in the framework of the project of Russian Science Foundation 14-43-00024.

The aim of the project: the development of data mining methods for chemical reactions, including predictive modeling of parameters of chemical reactions and their conditions and analysis of large databases.

The task of the project: the development of the common methodology for data mining approach for reactions on the basis of the condensed graph of a reaction (CGR), which allows using multiple cheminformatics approaches designed for individual molecules on  reactions data.

Methods and Approaches:

  • representation of complex reactions (including uncompleted and multi-step) by CGR;
  • development of property enriched fragment descriptors for reactions;
  • reaction similarity approach based on CGR;
  • inductive Learning Transfer methods for improving predictive performance of QSRR models;
  • method of visualization and analysis of large chemical reaction spaces.

The research results are fundamentally important for the modern organic chemistry and are found to be of great interest for chemists, theoreticians and experimentalists. The theorists will have new approaches and algorithms for chemical reactions data mining, and experimenters will have access through the Internet to the service with a user-friendly interface, which will help get answers to questions arising in the synthesis planning.

Research work Data mining for translational medicine

This project aims at the development and implementation of integrated computational methods for the reprofiling of drugs, using a variety of online available data sets. These arrays include unstructured texts (social media networking, biomedical literature, and electronic medical records) and electronic databases of the biological interactions of chemical compounds (including a biological screening of large chemical libraries). Furthermore, the translation of data into a format suitable for quantitative modeling of drug effect will allow integrating the text and laboratory data for creation a large amount of meta-data, suitable for building quantitative models linking the chemical structure and biological activity.

The proposed project links together the methods for the analysis of text data in information networks, the results of the study of biological networks, modeling the interaction of chemical drugs with their biological targets, and analysis of specialized biomedical literature and electronic data obtained from patients. The proposed computer system uniquely integrates a range of data (and related techniques) from person to molecules and again to the person in order to establish a previously unknown drug-protein and drug-disease bonds.

 27   2014