Table des matières

Jour 1/4 : La problématique et les généralités

APSEM2018.J1

La démarche à explorer lors de ces journées: modèle descriptif des données < —– > apprentissage

Questions: méthodes quantitative et qualitative (et textuelles)

J1.am : Généralités : recherche par les données

exposés de 30 minutes: débroussailler les différentes méthodes et les contextes d'utilisation/application?

TODO

Objectifs

Programme prévisionnel

<del>* **10h20-10h45 :** - Les infrastructures de recherche en émergence - Pascal Dayre? ou solution pour l'IA mis en J3 Rafes?</del>

?? SEEDOO, Alexia Audevart / Equito -Toulouse data science meetup https://www.meetup.com/Tlse-Data-Science/pages/19238072/Rencontres_pass%C3%A9es_%28vid%C3%A9os_et_slides%29 https://www.meetup.com/Tlse-Data-Science/members/116879732/ (cf. Etienne)

Le processus d'analyse de données - Frank Cotton?? Sébastien Dejean / IMT

Les processus de travail / plan d'expérience (ex: PPDAC model)

* 14h45-15h30 : - Les choix que doivent faire les data scientists pour les outils - Balazs Kegl (IN2P3,Paris-Saclay). Diapos ??

CERFACS? Méthodes supervisée par graphe? PB du taggage des données d'apprentissage?

Brainstorming

Comment structurer les données pour leur utilisation?

Comment utiliser les utilisateurs à construire leur modèle?

Note: Les processus de travail / plan d'expérience

P1: ex: PPDAC model ou

use to analyse the data

Iterate, if necessary

J1.pm : les différents types d'analyse / données

(Laurent Rissler IMT ⇒ TODO: contact de Matthieu Serrurier pour l'apprentissage (pratique+didactique) IRIT.Melody: Tim Van-de-Cruys (Big data / Deep learning) et Stergos Afantenos. Philippe Muller (TAL)

Question: données textuelles?

Objectif: catalogue: Quelles sont les outils mathématiques, méthodes et usages par rapport aux types/caractéristiques de données/communautés ? (et quelles sont leurs implémentations informatiques / mise en oeuvre ?) ⇒ J4

Quelles méthodes impactées et à retenir. Quelle est l'évolution des outils et les pratiques? Quelles sont les limitations dans les méthodes, les outils et les pratiques actuelles? (description insuffisante des données, …)?