Table des matières
Retour DescriptionMots clésPresentationsAteliers préparatoiresAteliersGroupes de travail

T3 - Données massives scientifiques (Big data), recherche par les données

Description

En cette époque de ruée vers la donnée, les données massives (big data) résultant de l'explosion des capteurs, de l'open-data, de la complexité et de l'interdisciplinarité des recherches actuelles deviennent centrales.

Dans cette thématique, nous expliciterons les masses de données et leurs enjeux. Nous ferons le point sur les outils et méthodes qui vous sont nécessaires dans le contexte de votre projet de développement logiciel et de recherche par les données. Nous ferons un tour d'horizon pour identifier si selon le contexte recherche, les limites des technologies en matière de traitement et de stockage de haute volumétrie sont atteintes et si alors il faut utiliser des technologies adhoc labélisées “big data” ou si des techniques plus “traditionnelles” suffisent.

Mots clés

données ouvertes (open data), base de données, masse de données (big data), persistance des données, structuration des données, map-reduce, NoSQL, R, Julia, Python

Présentations

Ateliers préparatoires

Ateliers

–> 4 ateliers sur les bases NoSQL pour étudier les différentes familles:

Oracle (Modélisation, Opération CRUD, Tests sur machines) Descriptif :

  1. Installation d'Oracle
  2. Création d'un programme Java / Oracle NoSQL
  3. Exemple de modélisation
  4. Tests
    • Prérequis : Des bases en Java
    • Environnement : Netbeans

Descriptif :

  1. Installation de l'environnement
  2. Introduction à la modélisation en graphes
  3. Introduction au langage Cypher
    • Prérequis : Des bases en Java et en Cypher son un plus
    • Environnement : Navigateur web et Neo4j (Ide java facultatif)

Mongo DB (Modélisation, Opération CRUD, Tests sur machines) Descriptif :

  1. Installation Mongo DB
  2. Création d'un programme Java / Oracle NoSQL
  3. Exemple de modélisation
  4. Tests
    • Prérequis : base de Java
    • Environnement : Netbeans

Cassandra (Modélisation, Opération CRUD, Tests sur machines) Descriptif :

  1. Installation Cassandra
  2. Création d'un programme Java / Oracle NoSQL
  3. Exemple de modélisation
  4. Tests
    • Prérequis : base de Java
    • Environnement : Netbeans

Groupes de travail

Echange et retour d'expérience. Extension des bibliothèques de références numpy, scipy, matplotlib à sa thématique scientifique. Ouverture à d'autres langages (fortran, C, R, julia, …) , intégration de l'existant par le côté glue du langage. - Mickael Canouil (GIM3, Lille)