Table des matières

APSEM2019 : éco-systèmes pour la science ouverte et recherche par les données

Objectifs: Étudier les nouvelles perspectives et l'apport croisé des technologies du web des données et de la recherche par les données, pour la construction d'éco-systèmes pour la science ouverte. Le fil conducteur de cette action sera le support à l'utilisateur pour l'accès aux ressources, le processus de traitement et d'analyse des données, et la mise en place de chaines de traitement pour l'apprentissage automatique.

Cette action fait suite à l'édition APSEM 2018

MOTS-CLEFS  :

Constat

De plus en plus de données sont disponibles et la recherche par les données connaît un intérêt croissant dans un objectif de valorisation ou de réutilisation des données dans de très nombreux domaines.

Lors de l'édition APSEM 2018, nous avons étudié l'apport croisé et l'intérêt de l'apprentissage automatique et du web des données pour conduire une analyse.

Conduire une analyse valide nécessite une grande expertise mathématique et informatique. Les experts en science des données sont rares en rapport aux besoins.

La mise en place d'un environnement opérationnel, facilement accessible et utilisable par le plus grand nombre est également un fort enjeu.

Il importe de pouvoir:

Objectifs scientifiques et techniques

Nous étudierons le support à l'utilisateur dans le processus de traitement et d'analyse des données, et dans le processus d'apprentissage automatique. Cette étude se fera sous différents angles :

Plus spécifiquement, les les aspects suivants seront abordés :

Comité d'organisation

Comité de programme

Programme

Attention ce programme est provisoire et susceptible d'évoluer.

J1: Le processus de traitement et d'analyse des données, et le processus d'apprentissage automatique

Programme :

J2: Usages et besoins en science des données ouverte - Supports aux chercheurs

Programme :

J3: Les Environnement Virtuel de Recherche (EVR)

ou encore les ENT / ERV / VRE (Virtual Research Environment)

Programme:

J4: Les éco-systèmes pour la science ouverte

Objectifs:

Les plateformes de big data se développent mais sont souvent synonymes de solutions centralisées. Nous nous intéresserons ici aux solutions ouvertes et distribuées que sont les éco-systèmes pour la science ouverte intégrant : des e-infrastructures pour l'hébergement des données et fournissant un socle de services de traitement, et les couches d'intermédiations que sont les EVR (Environnement Virtuel de Recherche).

Nous sommes à la convergence entre calcul et données, et HPC et cloud. Nous avons d'un côté des centres de calcul et de l'autre des e-infrastructure de données. Allons-nous vers une architecture centralisée sous la forme d'une solution intégrée et bornée type plateforme ? Ou bien allons-nous vers des architectures distribuées, évolutives, basées sur des standards ouverts, des e-infrastructures et des socles de calcul pour le backbone/“back office”, et des VRE pour le “front office” assurant l’intermédiation pour l'accès aux services de traitement et d'analyse des données ?

Nous nous poserons également comme question lors de ces journées la mise en place de ces éco-systèmes, de l'offre des GAFAM tel que Google Earth Engine à des environnements co-construits par des communautés utilisatrices comme celle des sciences de la terre avec Pangeo. Nous nous intéresserons également à l'apport du web sémantique dans ces solutions.

Mots clés: éco-systèmes, communautés, e-infrastructures, services de données, services de calcul, communauté, big data, IA, CLOUD, EOSC.

Programme provisoire: