Analyses de données et Drug Design (3 ECTS)
(Responsables: A-C CAMPROUX & L. REGAD)
Program :
Optimiser et combiner différentes méthodes d’apprentissage sur des jeux de données de
drug design Exemple sur espace de molécules
• Méthodes non supervisées : descriptives ou exploratoires qui proposent des groupements en
classes d'objets à la suite de calculs algorithmiques
Méthodes factorielles (Analyse en Composantes Principales) et Méthodes de classification (hiérarchique ou de partitionnement)
• Méthodes supervisées : explicatives et/ou prédictives :
Protocole de validation croisée, critère d’optimisation.
Modèle linéaire et PLS, knn, CART, Régression logistique
Présentation des SVM et ouverture vers le deep learning
Objectifs en termes de connaissances :
Apprendre aux étudiants à combiner et optimiser différentes
méthodes d’apprentissage non supervisées et supervisées pour analyser des données de drug design.
Aussi bien dans l’espace des cibles (application en structure-based) et des molécules (application en ligand-based) avec les problèmes particuliers associés, sélection de descripteurs et critère de sélection, optimisation, comparaison et robustesse des modèle en cross-validation.
Les applications et projets seront effectués avec différents packages du logiciel statistique R.
Evaluation : Des comptes-rendus bilans (comparaison) sur les méthodes non supervisés d‘une part et sur les méthodes supervisées d’autre part + une présentation d’articles ou de chapitres de livre.