Table des matières

T7.GT03 : Préparation des données avec Pandas, Python Data Analysis Library.

Porteurs

Laurent Risser (IMT, Toulouse), Yves Auda (GET, Toulouse) .

Mots Clés :

Python, R, prétraitement de données, statistique, analyse de données, machine learning

OBJECTIF

Échanger sur l’utilisation du module Pandas et le comparer avec R pour le pré-traitement des données.

DESCRIPTION

Le module Pandas pour Python s’est établi en quelques années comme un standard pour le pré-traitement de données sous Python. Il permet notamment de lire de nombreux formats de données et d’organiser efficacement les données via l’utilisation de dataframes, comme en R. Un exposé introductif présentera ce module et le comparera à R. L’essentiel du groupe de travail se focalisera sur des discutions et des retours d’expérience.

PREREQUIS

Intérêt pour l’analyse de données, connaissances générales en Python ou en R.

PAD COLLABORATIF

https://etherpad.in2p3.fr/p/JDEV2017.T7.GT03

Vous pouvez vous servir de ce pad collaboratif pour y inscrire vos commentaires, un résumé / restitution en sera fait qui sera inclus dans le compte rendu du GT.

Attention, les PADs sont détruits après quelques semaines d'inactivité.

DOCUMENTS/RESS0URCES