Application Streamlit
Architecture
Application web interactive développée avec Streamlit pour présenter les analyses issues des notebooks EDA.
Structure
Page principale avec navigation sidebar
4 modules d’analyse indépendants
Widgets interactifs (sliders, selectbox, filtres)
Cache données (TTL 1h) pour performance
Les 4 Analyses
1. Analyse des Tendances Long-Terme
Source : 01_long_term/recipe_analysis_trendline.ipynb
Présente l’évolution 1999-2018 de :
Volume d’interactions
Durée de préparation
Complexité des recettes
Profils nutritionnels
Visualisations : 6 graphiques temporels synchronisés avec régression linéaire.
2. Analyse de Saisonnalité
Source : 02_seasonality/recipe_analysis_seasonality.ipynb
Identifie les patterns saisonniers :
Distribution recettes par saison
Variations mensuelles nutritionnelles
Pics d’activité saisonniers
Visualisations : Histogrammes, heatmaps mensuelles, palette couleurs thématique.
3. Analyse Effet Weekend
Source : 03_week_end_effect/recipe_analysis_weekend.ipynb
Compare publications jour ouvré vs weekend :
Volume par jour de semaine
Impact sur complexité/durée
Tests statistiques (Chi-2)
Visualisations : 3 panels comparatifs avec p-values affichées.
4. Analyse des Ratings
Source : 01_long_term/rating_analysis.ipynb
Étudie la distribution des notes utilisateurs :
Distribution 0-5 étoiles
Statistiques agrégées
Détection biais positif
Visualisations : Histogrammes interactifs, boxplots, métriques satisfaction.
Chargement des Données
Les données sont chargées depuis S3 au démarrage via :
DataLoader (gestion erreurs)
cached_loaders (cache Streamlit TTL 1h)
178K recettes + 1.1M ratings (~450 MB Parquet)
Performance
Premier chargement : 5-10 secondes (S3)
Chargements suivants : <0.1 seconde (cache)
Optimisation DNAT : 500+ MB/s