Table des matières

T7.GT01 : Préparation des données pour l'analyse statistique et le machine learning (mise en oeuvre avec R).

Porteurs

Sébastien Dejean (IMT, Toulouse).

Mots Clés :

R, statistique, données, machine learning, apprentissage automatique.

OBJECTIF

Sensibiliser les participants à ce qui se passe avant d'analyser des données

DESCRIPTION

Ce groupe de travail a pour but d'échanger sur la nécessaire préparation des données en vue d'entreprendre une analyse statistique. Les échanges se baseront notamment sur l'article “Tidy data” de H. Wickham (Journal of Statistical Software, 59(10), 2014.) qui propose un certain nombre de règles à respecter pour disposer de données “tidy” et ainsi gagner du temps dans un processus d'analyse de données.

FORMAT

* Présentations de synthèse, retours d'expériences de 10-15 minutes.

Retours d'EXpérience

PREREQUIS

Intérêt pour l'analyse de données

PAD COLLABORATIF

https://etherpad.in2p3.fr/p/JDEV2017.T7.GT01

Vous pouvez vous servir de ce pad collaboratif pour y inscrire vos commentaires, un résumé / restitution en sera fait qui sera inclus dans le compte rendu du GT.

Attention, les PADs sont détruits après quelques semaines d'inactivité.

DOCUMENTS/RESS0URCES