- Intitulé du Master : Master Académique, Intelligence artificielle
- Semestre : 03
- Intitulé de l’UE : UED (O/P)
- Intitulé de la matière : Big data
- Crédits : 1
- Coefficients : 2
_____________________________________________________________________
Objectifs
- Comprendre la problématique de traitement de données massives et hétérogènes.
- Comprendre et appliquer le paradigme MapReduce.
- Comprendre les approches d'intégration de données.
- Découvrir la palette d'outils d'analyse de données.
- Acquérir des notions sur les bases de données NoSQL (NotOnly SQL) et leur utilisation.
_____________________________________________________________________
Programme
- Introduction au Big Data.
- Introduction aux bases de données NoSQL.
- Framework Hadoop (HDFS et MapReduce)
- Analyse de données : Pig et Hive.
- Traitement de données : Apache Spark.
- Intégration de données : Flume et Sqoop.
- Big Data et machine learning:Mahout.
_____________________________________________________________________
Prérequis
- Bases de données.
- Machine learning.
_____________________________________________________________________
Références :
- R. Bruchez. Les bases de données NoSQL et le Big Data. Eyrolles, 2ème edition, 2016.
- K. Chodorow. MongoDB, the Definitive Guide. O’Reilly, 2ème edition, 2013.
- H. Karau, A. Konwinski, P.Wendell, and M.Zaharia. Learning Spark. O’Reilly, 1st edition, 2015.
- P. Lemberger, M. Batty, M. Morel, and J-L. Raffaelli. Big Data et Machine Learning. Dunod, 2015.
- D. Miner and A. Shook. MapReduce Design Patterns. O’Reilly, 2013.
_____________________________________________________________________