APSEM2018 : page de travail

l’apport croisé et les nouvelles perspectives des technologies du web des données et de la recherche par les données.

  • Lieu: - Toulouse
  • Date: - Semaine 46 du 12-16 novembre. , 4-5 jours
  • Nb personne: 30-40

Les pages des journées:

Proposition de valorisation de l'action

  • Captation des screencast
  • Cahier des techniques de l'INRA
  • Ouvrage

Feuille de route

  • 20180413 - Finaliser les contours du programme / recherche d'intervenant / lancement de l'appel à contribution (DEVLOG / CALCUL / RGBD / thématiciens / GDR …)
  • 20180504 : Etude des propositions en compléments
  • 20180520 - reponse et invitation à une visio
  • 20180611 - Finalisation de la logistique ⇒ nb max de personne
  • 20180618 - Inscription complémentaire

Visios

Description courte

Contexte et objectif

L’apprentissage automatique et la statistique sont au coeur de la production des connaissance. En science expérimentale, avec l’afflux des données, les nouveaux moyens de calcul et les nouvelles techniques d’apprentissage, le paradigme de construction de la connaissance est inversé.

Préalablement, le scientifique partait d’une conceptualisation de son domaine puis collectait des données pour valider ou non son modèle (cf. méthode directe, méthode du modèle inverse).

L’ étape initiale de modélisation du phénomène est maintenant remplacée par une exploration des données qui aboutit à une émergence du modèle. Nous sommes à l’ère de la science par les données.

L'objectif est de faire se rencontrer la communauté des développeurs, des statisticiens, de l'apprentissage, du web sémantique, des expérimentateurs et des chrcheurs thématiques (producteurs de données) pour étudier l’apport de la structuration des données par les technologies du web sémantiques pour leur intégration, leur interopérabilité, leur sélection contextuelle afin d’améliorer la robustesse des apprentissages.

Nous nous intéresserons donc à l'apport du web sémantique pour formaliser et capturer les connaissances a priori pour structurer et optimiser une analyse des données et également l'enrichissement progressif de cette description émergente du domaine apporté par l'analyse.

Objectif de formation

Il y a plusieurs enjeux scientifiques :

  • maîtriser ces nouveaux paradigmes/méthodes pour la recherche et la création de connaissance en sciences expérimentales
  • offrir des terrains expérimentaux pour des statisticiens, la recherche en informatique sur l’apprentissage (Intelligence Artificielle),
  • Expérimenter le web sémantique/données liées pour structurer les océans de données (ontologies descriptives, méthodes itératives, …)
  • identifier et développer les savoir-faire pour les ingénieurs en science des données

Objectifs pédagogiques

  • Comprendre les problématiques en science expérimentale (observatoires, producteurs de données, …)
  • Comprendre les différents paradigmes de création de connaissance
  • Faire le point sur les différentes solutions d’analyse
  • Préparer/structurer ses données pour les analyses (apprentissage automtique/analyses statistiques)
  • Comprendre à modéliser son domaine avec des ontologies descriptives
  • Sélectionner les données pour l’apprentissage
  • Appliquer une méthode d’apprentissage
  • Comprendre les outils et leur évolution et leurs limitations

Oui, lors de l’action ISS2016 (http://devlog.cnrs.fr/iss2016), nous avons étudié comme l’information spatialisée, information pivot de beaucoup d’études scientifique, pouvaient être sémantisées et portées sur le web ainsi que les Systèmes d’Information Géographique (SIG). Cette proposition cherche à faire également une synthèse entre les thématiques T2, T7 et T5 des JDEV2017:

Version 201803 revisitée le 20180329 puis le 20180410-13

puis le 20180410 avec Nathalie H. et Mouna K. et Pascal pour le J2

Catherine, Franck (Sofia): 2 aspects:

  • découverte d'ontologie (ontology learning) à partir de données et/ou de textes, apprentissage automatique pour l'Ingénierie des Connaissances
  • ajout de sémantique dans les représentations pour améliorer l'apprentissage automatique : comment les outils d'apprentissage peuvent-ils utiliser non seulement les signaux “brutes” (images, textes etc.), mais aussi des données symboliques qui explicitent la sémantique des ces signaux

Jour 1/4 : La problématique et les généralités

Jour 2/4 : L'Ingénierie des Connaissances pour les infrastructures de recherche et les ENTC

ENTC ??

Objectifs du jour:

  • Aperçu de l’ingénierie des connaissance set du web sémantique
  • Explorer les différents vocabulaires pour outiller la modélisation et l'apprentissage
  • Apprendre à construire une ontologie descriptive du domaine et définir les méta-données pour indexer ses données et optimiser l'apprentissage

Voir page dédiée.

Jour 3/4 : la convergence

J3.am : Apports croisés des domaines

J3.pm : les nouvelles approches basées topologie des graphes

Jour 4/4 : Outils de la convergence et cas d'etude

Cas d'étude problématiques

 
travail/apsem2017.txt · Dernière modification: 2018/07/18 15:20 par pascal.dayre@enseeiht.fr
 
Recent changes RSS feed Powered by PHP Powered by Pxxo Driven by DokuWiki