Table des matières

ANF APSEM2018 : Apprentissage et sémantique

l’apport croisé et les nouvelles perspectives des technologies du web des données et de la recherche par les données.

Inscription et appel à contribution

====== Appel à contribution ======

L'organisation se fait en collaboration avec l'Inra avec le soutien financier d'Ingenum pour la prise en charge des frais d'inscription pour les agents Inra.

Objectifs et enjeux

Il y a plusieurs enjeux scientifiques et techniques:

Description

L’apprentissage automatique et la statistique sont au coeur de la production des connaissance. En science expérimentale, avec l’afflux des données, les nouveaux moyens de calcul et les nouvelles techniques d’apprentissage, le paradigme de construction de la connaissance est inversé.

Préalablement, le scientifique partait d’une conceptualisation de son domaine puis collectait des données pour valider ou non son modèle (cf. méthode directe, méthode du modèle inverse).

L’ étape initiale de modélisation du phénomène est maintenant remplacée par une exploration des données qui aboutit à une émergence du modèle. Nous sommes à l’ère de la science par les données.

L'objectif est de faire se rencontrer la communauté des développeurs, des statisticiens, de l'apprentissage, du web sémantique et des expérimentateurs (producteurs de données) pour étudier l’apport de la structuration des données pour leur intégration, leur interopérabilité, leur sélection contextuelle pour améliorer la robustesse des apprentissages.

Nous nous intéresserons donc:

Comité d'organisation

Comité de programme

Programme

Jour1

Jour2

Objectifs :

Planning

Quel apport du web des données pour la préparation, la structuration et l'usage des données dans un processus d'apprentissage? Quels intérêts pour les infrastructures de recherche et les ENTC? ou comment les e-infrastructures se saisissent de la problématique de l'ouverture des données, de l'apprentissage et de l'IA.

Jour3

Convergence apprentissage et sémantique c'est à dire représentation des connaissances.

Atelier de programmation GRAMINEES (GRAphe data Mining In Natural, Ecological and Environnemental Sciences, Responsables Romain David, IMBE, INEE, Nathan Cohen, I3S, INS2i)

Cet atelier GRAMINEES, labellisé et soutenu par le GDR MaDICS, est proposé par le consortium IndexMEED. Organisé en marge de APSEM2018 ,il est néanmoins ouvert aux participants à l’ANF, et a pour objectif de préparer les étapes et la répartition des rôles nécessaires à l’élaboration d’un programme de recherche concernant la fouille de données environnementale hétérogènes et réparties basée sur la visualisation et la fouille de graphe. Les défis à relever sont le passage à l'échelle et l’utilisation simultanée de bases de données de disciplines différentes : des données thématiques (exemple : biodiversité) et des bases de données dites “de contexte” (exemple : altitude, température, pluviométrie) administrées par des organismes différents. A l’issu de ces échanges, l'élaboration d’une première version d’un arbre de décision pour les choix d'algorithmes de fouille dépendant de la typologie des données sera proposé. Cet arbre doit permettre de classer les différents graphes en fonction de leur contenu et de la manière dont ils sont construits.Il doit aussi mettre en évidence les différents axes de recherche sur ces données et leurs interdépendances, et faire émerger des questionnements scientifiques.

Jour4

Le matin :3 REX : 45 min de présentation puis 15 minutes d'échange