Netflix
Le projet consiste à analyser et visualiser un jeu de données de NETFLIX, cette entreprise spécialisée dans la distribution et l'exploitation d'œuvres cinématographiques pour traiter les différents aspects d'un projet d'analyse de données. Dans le cadre de ce projet, on va explorer la façon dont les langages SQL, PLSQL et PYTHON s'intègrent à chaque étape du cycle de vie de l'analyse des données. Dans un premier temps, on va voir comment collecter, nettoyer et analyser des données avec les langages PLSQL et SQL d'Oracle. Dans un deuxième temps, on reprendra les mêmes étapes avec la librairie PANDAS du langage Python. De plus, les librairies Matplotlib et Seaborn seront utilisés pour visualiser les données. En fin, des rapports, un tableau de bord et une application seront réalisés avec Power BI Desktop et Power BI Service de Microsoft
SGBD:Oracle 19C
Langage SQL
Langage PL/SQL
Oracle SQL Developer
Langage Python
Power BI Desktop
Power BI Service
1 | La présentation du jeu des données |
2 | La collecte des données |
3 | La compréhension des données |
4 | L'importation des librairies |
5 | Le traitement des données avec pls/ql et sql |
6 | Le traitement des données avec pandas |
6 | L'analyse des données avec pandas |
7 | Créations des rapports de visualisation des données avec Power BI |
8 | Publication des rapports avec Power BI Sercice |
9 | Création du tableau de bord avec Power BI Sercice |
10 | Création du tableau de bord pour appareils mobiles |
11 | Création de l'application mobile avec Power BI Sercice |
L'écran suivant affiche l'histogramme et le pie chart du top 5 des catégories ajoutées.
L'écran suivant affiche la tendance des ajouts sur Netflix à partir de 2011.
L'écran suivant affiche les distibutions countplot et boxplot de la variable release_year
L'écran suivant affiche la distribution de la variable Rating par release_year..
L'écran suivant affiche la répartition des shows par pays et types
L'écran suivant affiche la répartition des shows par classification et type
L'écran suivant affiche la répartition des shows par année d'ajout et type.
L'écran suivant affiche la répartition des show par durée et type.
L'écran suivant affiche la répartition des show par durée et type.
L'écran suivant affiche la répartition de l'ajout des shows par trimestre.
L'écran suivant affiche le tableau de bord créé avec Power BI Service.
L'écran suivant affiche l'application créée avec Power BI Service.
1 | La majorité du contenu sur Netflix est classée comme "Films"(70%) par rapport aux "Séries télévisées"(30%); |
2 | Les États-Unis possèdent le plus grand nombre de titres, suivis par l'Inde; |
3 | Les genres les plus fréquents sont International Movies, Dramas et comrdie; |
4 | Les classifications "TV-MA" et "TV-14" sont très fréquentes, cela indique une forte présence de contenu destiné à un public adulte sur Netflix; |
5 | La distribution des années de sortie culmine au cours des dernières années; |
6 | Les années avec le plus de shows sont 2019 et 2020. |