Jour 3/4 : la convergence

Contact: romain.david@imbe.fr

Proposition :

Reprendre les 3 cas d'usage principal du jour 2 ? ou autres:

  • Gérer/préparer les données : Structurer, décrire, enrichir, fédérer les données. - avant l'apprentissage -
  • Accéder, Sélectionner ses données d'apprentissage à l'aide du web des données - pour l'apprentissage -
  • Capitaliser/Enrichir un graphe avec de nouvelles données (instances et classes) - pendant l'apprentissage -

Quels apprentissages?

Liens entre représentations des connaissance et leurs traitements:

  • Comment sélectionner ses données dans son graphe pour l'apprentissage (combien de sous-ensemble, communauté, volumétrie, nature des images, …)(comment utiliser els représentation pour optimiser l'apprentissage)?
  • Comment réinjecter les résultats d'apprentissage dans le graphe des données (comment enrichir les représentation)?
  • Convergence qualitatif, quantitatif

J3.am : Apports croisés des domaines

En utilisant ce qu'on a vu au J2 (rentrer dans les outils, …, TP)

* Les web semantique (activités, but): questionner le pourquoi et le comment?

  • activités:
  • but: structuration des données, à mieux les sélectionner pour les analyser, …
  • Les analyses de données: questionner le pourquoi et le comment?
  • activités: selectionner les paramètres (apport du web sémantique) (requeter le modele conceptuel)
  • but: prédictions et explorer (classification, réduire la dimension (parcimonie))
  • ⇒ Apports croisés des domaines
  • Le web sémantique pour les analyses(apprentissage)
  • Les analyses pour le sémantique ou la structuration des données ⇒ enrichir le modèle conceptuel

⇒ construire/peupler les ontologies, alignement. Mouna Kamel ⇒ apprentissage de regles/axiomes pour enrichir la base de connaissance (Franck Michel??) ⇒ apprentissage sur des données décrits

Catherine “Je suis intéressée par les 2 aspects: aspects ontology learning à partir de données et/ou de textes et donc les aspects apprentissage automatique pour l'IC (anciens travaux avec Alexandre Delteil et récents travaux avec Andrea Tettamanzi sur le sujet) et ajout de sémantique dans les représentations pour améliorer l'apprentissage automatique (thèse de Molka Tounsi et de Raphael Gazzotti). Andrea pourrait être intéressé par participer également.”

  • 09h00-10h30 : Construction de graphes valués à partir des données
    • Méthodes pour la construction de graphes valués: aperçu des méthodes et illustration par l'approche PLS-PM sur des données reliant agriculture et environnement - Dominique Desbois (INRA/Versailles)
    • Construction de graphes à partir des variables décrivant l'environnement et la biodiversité - /IndexMEED - Romain David
  • 10h30-11h00 : Pause
  • 11h00-12h30 : Gestion et intégration de connaissance -Sémantique des Données génomiques des plantes et phénotypage - Pascal Neveu. Utilisation de graphes pour l'apprentissage “classique”
  • TODO ??? Rechercher intervenant Phénologie des plantes (alain franc - Bordeaux cf. Romain David Pascal Neuveu IRSTEA)
  • 12h30-14h00 : Déjeuner

J3.pm : les nouvelles approches basées topologie des graphes

  • 14h00-15h00 : Table ronde sur la convergence - Pascal Neveu +
    • 14h00-15h00 : Les panélistes : donnez votre point du vue sur la convergence en 2 slides et en 5 minutes (Donner une série de question sur la convergence: 10*5min)
    • 15h00-15h30 : Les questions (Demander les questions à l'inscription)
  • 15h30-16h00 : Pause café
  • 16h-16h30 : * Quel apport de l'Approche bio-div pour l'apprentissage : mélanger des objets de différentes natures dans le même graphe. - Romain David et GDR Madics (curation et fouille en fonction des différents contextes) Génération de graphes de décision. ou autre?
  • 16h30-18h - Atelier Graminé / pub vers Madics

Atelier de programmation GRAMINEES (GRAphe data Mining In Natural, Ecological and Environnemental Sciences, Responsables Romain David, IMBE, INEE, Luc Hogie, I3S, INS2i durée 1h30 à 2 h) http://www.madics.fr/actions/actions-en-cours/graminees/ https://www6.bordeaux-aquitaine.inra.fr/biogeco/Personnel/Annuaire/D-F/Franc-Alain

OLD:

* https://www6.bordeaux-aquitaine.inra.fr/biogeco/Personnel/Annuaire/D-F/Franc-Alain

Comment faire le lien entre la recherche théorique des graphes, la recherche appliquée et thématique ainsi que le lien avec les outils et solutions logicielles.

Interface web semantic/apprentissage/graphe ⇒ alberto. Approche, méthodes d'analyses et outillage avec le web sémantique

Bertrand Jouve - spécialiste des graphes? Romain David IMBE (retour d'expérience et exprience de l'IMBE) TODO(Pascal) - Clement Jonquet? (LIRMM, Montpellier, Agrovoc, GDR SEMANDIV - GDR bio-diversité / semandiv?) TODO(Pascal) - contrib JDEV2018 ; graphe/publi

  • 13h30 - Approche générale puis application en remote sensing . Apprentissage sur les graphes - Proposition Nathalie Abadie : extraction d'objet géographique à partir de points. https://loiclandrieu.com/ (TODO contact Nathalie)
  • 14h00-14h30: Gestion et intégration de données de connaissance en phénotipage (REX) - (Pascal Neveu / UMR NISTEA) - Python/R/Scilab (contacter par Dominique)
  • 14h30-15h00: (Explainable AI à mettre sur le jour 3 - Mathieu Serrurier / IRIT (est-ce que Matthieu peut en faire 2??)
  • 15h30-16h00: Travailler sur les grands graphes: Interface web semantic/apprentissage/graphe

⇒ alberto. Retour d'expérience sur l'apprentissage/étude de la topologie à partir de grand graphe sous forme de matrice (sur un cas d'étude sur les transports?). - alberto.lumbreras@irit.fr ? Approche, méthodes d'analyses et outillage avec le web sémantique

  • 16h00-16h30: Web sémantique et ingénierie des connaissances - inférence.
  • 16h30-17h30: Atelier : donnez votre point sur la convergence en 2 slides et en 5 minutes.
  • 14h00-14h30:
  • Proposition Nathalie Abadie : extraction d'objet géographique à partir de points.

?? clement Mallet IGN : classification/apprentissage et occupation du sol

Les nouveaux modèles et méthodes

  • Exposé théorie sur les analyses topologiques / graphes? (un membre de l'équipe de Luc HOGIE?)
  • Approche graphe et topologique (cf. contacts Yves /laurent): recherche de topologie dans les graphes
  • Analyse graphe supportées par le web sémantique (graphe mining, …)
  • Questionnement du web sémantique: créer son graphe/ontologie descriptive

* Quel apport de l'Approche bio-div pour l'apprentissage : mélanger des objets de différentes natures dans le même graphe. - Romain David et GDR Madics (curation et fouille en fonction des différents contextes) Génération de graphes de décision.

Atelier Graminé / pub vers Madics

Atelier de programmation GRAMINEES (GRAphe data Mining In Natural, Ecological and Environnemental Sciences, Responsables Romain David, IMBE, INEE, Luc Hogie, I3S, INS2i durée 1h30 à 2 h) http://www.madics.fr/actions/actions-en-cours/graminees/

Cet atelier GRAMINEES, labellisé et soutenu par le GDR MaDICS, est proposé par le consortium IndexMEED. Organisé en marge de APSEM2018 ,il est néanmoins ouvert aux participants à l’ANF, et a pour objectif de préparer les étapes et la répartition des rôles nécessaires à l’élaboration d’un programme de recherche concernant la fouille de données environnementale hétérogènes et réparties basée sur la visualisation et la fouille de graphe. Les défis à relever sont le passage à l'échelle et l’utilisation simultanée de bases de données de disciplines différentes : des données thématiques (exemple : biodiversité) et des bases de données dites “de contexte” (exemple : altitude, température, pluviométrie) administrées par des organismes différents. A l’issu de ces échanges, l'élaboration d’une première version d’un arbre de décision pour les choix d'algorithmes de fouille dépendant de la typologie des données sera proposé. Cet arbre doit permettre de classer les différents graphes en fonction de leur contenu et de la manière dont ils sont construits.Il doit aussi mettre en évidence les différents axes de recherche sur ces données et leurs interdépendances, et faire émerger des questionnements scientifiques.


REX Centres de données - LIENS? -

  • Facilité l'accès aux données. Accès aux différents silos. par l'usage
  • scoring des données d'apprentissage
  • Sémantisation des données
  • Utilisation des données pour l'apprentissage
  • Capitalisation sur la structure: cad explicitation des données

10h20-10h45 : - Les infrastructures de recherche en émergence - Pascal Dayre? Ou alors solution pour l'IA?


Autre plan:

  • Journée 1 Besoin en données pour appliquer l'IA dans tous les autres domaines
  • Journée 2 Web sémantique l'environnement du futur pour

l’exécution des IA

  • Journée 3 Mettre en oeuvre une ingénierie des connaissances pour déployer le

Web des données scientifiques (le SI dont a besoin le Web sémantique pour exister un jour)

  • Journée 4 Retour d'expériences etc…
 
travail/apsem2017.j3.txt · Dernière modification: 2018/09/24 15:21 par romain.david@imbe.fr
 
Recent changes RSS feed Powered by PHP Powered by Pxxo Driven by DokuWiki