Programme :
Quels sont les grands axes du programme ? :
Axe 1 : Web des données, données liées et web sémantique pour la représentation des connaissances Axe 2 : Apprentissage automatique et science des données, l’enjeu de la préparation des données et de leur sémantisation Axe 3 : Méthode pour la recherche, cas d’études Axe 4 : Mise en œuvre technologiques (source et interopérabilité des données, architectures SOA/WOA/ROA, architecture de service versus architecture de données, intégration des toolkit de machine learning, chaîne de traitement, …)
Dans le cas où le projet est suffisamment avancé ou récurrent quel serait le programme prévisionnel ?
La dernière version du programme : http://devlog.cnrs.fr/apsem2018
Analyse statistique et de l'apprentissage automatique pour la prédiction
- Principes et toolkits - Leur interfaçage - Les outils de workflow
Pour l'instant un premier découpage. Nous verrons si nous ne pouvons pas faire un découpage plus orientés sur les pratiques.
Intérêt, représentation et usage des données orientées graphes. Quel langage pour manipuler les données graphes? Convertir le données graphe en un format pour l'apprentissage (matrices, …).
Utilisation des techniques d'apprentissage pour
Mise en œuvre technologiques (source et interopérabilité des données, architectures SOA/WOA/ROA, architecture de service versus architecture de données, intégration des toolkit de machine learning, chaîne de traitement, …)
- Qualité des données - Sélection des données d’apprentissage Intérêt, représentation et usage des données orientées graphes. Quel langage pour manipuler les données graphes? Convertir les données graphe en un format pour l'apprentissage (matrices, …).
Retour de Yves sur JDEV2017/t2:
Mise en œuvre technologiques (source et interopérabilité des données, architectures SOA/WOA/ROA, architecture de service versus architecture de données, intégration des toolkit de machine learning, chaîne de traitement, …)
Module | Intervenants (nom et qualité) | Modalités pédagogiques | |
---|---|---|---|
La problématique en science expérimentale (observatoire, INRA, …): science reproductive, passage à l'échelle - , systèmes complexes, évolution du paradigme de la science modelistion mathématique à une modélisation algorithmique) | Yves Auda et Etienne Gondet | Cours | |
Méthode pour la recherche/ création de connaissance | Pascal ? | ||
Les différentes approches pour l'exploitation des données : des statistiques descriptives à l'apprentissage | |||
Les différentes solutions en préparation des données (analyse statistique) | Sébastien Dejean, Laurent Risser | ||
La préparation des données pour l'apprentissage (l'annotation de corpus) | |||
Réseaux de neurone | Pascal Dayre | Cours et atelier | |
Deep learning | Cours et atelier | ||
Préparer ses données pour les analyses | Sébastien Dejean, Laurent Risser | Cours et Atelier (R/Python/Julia) | |
Comment rendre robuste son algorithme ? (méthode symbolique / qualitative versus méthode quantitative) | |||
Le web sémantique pour l’interopérabilité | Franck Michel | Cours et atelier Web des données | |
Le LOD, le LED et les solutions d’ingénierie : Ontologies descriptives de domaine | Franck Michel | ||
Architecture des SI : SOA-WOA-ROA | Pascal Dayre | ||
Le web sémantique pour la préparation des données: description des données: méta-données et description de corpus | |||
Le web des données pour des analyses quantitatives et qualitatives | |||
Accéder à une source de données sur internet : qualifier | Franck Michel | ||
Application sur etude de cas (Méthode pour la recherche) | Dominique Desbois / Yves Auda, Tout le monde | ||
Etude de cas |
Exemple de cas d’étude : Explorer les relations entre la sémantique des données (structuration/modélisation des données d'enquête et/ou d'expérimentation) et les méthodologies d'apprentissage (algorithmes de fouille de données, techniques stochastiques de modélisation) en présentant les outils disponibles et au moins un exemple d'application à discuter par les participant(e)s.