T7.GT03 : Préparation des données avec Pandas, Python Data Analysis Library.

T7.GT03 : Préparation des données avec Pandas, Python Data Analysis Library.

Porteurs

Laurent Risser (IMT, Toulouse), Yves Auda (GET, Toulouse) .

Mots Clés :

Python, R, prétraitement de données, statistique, analyse de données, machine learning

OBJECTIF

Échanger sur l’utilisation du module Pandas et le comparer avec R pour le pré-traitement des données.

Le module Pandas pour Python s’est établi en quelques années comme un standard pour le pré-traitement de données sous Python. Il permet notamment de lire de nombreux formats de données et d’organiser efficacement les données via l’utilisation de dataframes, comme en R. Un exposé introductif présentera ce module et le comparera à R. L’essentiel du groupe de travail se focalisera sur des discutions et des retours d’expérience.

PREREQUIS

Intérêt pour l’analyse de données, connaissances générales en Python ou en R.

PAD COLLABORATIF

https://etherpad.in2p3.fr/p/JDEV2017.T7.GT03

Vous pouvez vous servir de ce pad collaboratif pour y inscrire vos commentaires, un résumé / restitution en sera fait qui sera inclus dans le compte rendu du GT.

Préalablement au jour J: L'idée est de faire remonter les attentes et les questionnements.
Jour J: Prendre des notes et des réflexions collaborativement.

Attention, les PADs sont détruits après quelques semaines d'inactivité.