Laurent Risser (IMT, Toulouse), Yves Auda (GET, Toulouse) .
Python, R, prétraitement de données, statistique, analyse de données, machine learning
Échanger sur l’utilisation du module Pandas et le comparer avec R pour le pré-traitement des données.
Le module Pandas pour Python s’est établi en quelques années comme un standard pour le pré-traitement de données sous Python. Il permet notamment de lire de nombreux formats de données et d’organiser efficacement les données via l’utilisation de dataframes, comme en R. Un exposé introductif présentera ce module et le comparera à R. L’essentiel du groupe de travail se focalisera sur des discutions et des retours d’expérience.
Intérêt pour l’analyse de données, connaissances générales en Python ou en R.
https://etherpad.in2p3.fr/p/JDEV2017.T7.GT03
Vous pouvez vous servir de ce pad collaboratif pour y inscrire vos commentaires, un résumé / restitution en sera fait qui sera inclus dans le compte rendu du GT.
Attention, les PADs sont détruits après quelques semaines d'inactivité.