Notebooks
Last update of this page: May 2019
Notebooks et tips
Here is a list of useful notebooks to handle different use cases:
- Gérer les gros datasets qui ne passent pas en mémoire
- Modèle complexe ou modèle simple ?
- Chemin le plus court
- Exemple d’analyse de données sur dataset déséquilibré et rapport d’analyse associé - Crédit: Erdi Olmezogullari
- Régression linéaire avec Tensorflow
- Classification avec Tensorflow
- Underfitting and overfitting
Spark recommandation engine example:
Compétitions Kaggle et kernels associés
Here is a list of notebooks I studied and find interesting coming from Kaggle and having a MIT licence. I keep them here as inspirational sources or knowledge base.
Kaggle Winning solutions
Kernels sur le sujet “titanic”
- Good data exploration
- Framework to achieve 99% accuracy
- End to end Machine Learning pipeline
- Exploratory data analysis and feature extraction
Kernels sur le sujet “iris”
Kernels autour du customer churn
Kernels autour du jeu populaire battle royale
Kernels autour Google Analytics Customer Revenue Prediction
Kernels autour des sales forecast
Kernels sur le sujet “Porto Seguro’s Safe Driver Prediction”
Recruit Restaurant Visitor Forecasting.
Sujets autour du sujet “House Pricing”
Sujets autour de la compétition “home-credit-default-risk”
URL: https://www.kaggle.com/c/home-credit-default-risk
To understand the data feel free to access the “Data” chapter in this notebook of this notebook:
Read-only Kernels:
-
Très bonnes explications sur la métrique ROC AUC et quelle métrique utiliser pour mesurer la performance d’un modèle lorsque des classes ne sont pas équilibrées ? Traite du One Hot Encoding et du problème pour les features ayant trop de catégories (réduction de dimension). Explication sur le feature engineering et en particulier la construction de nouvelles features avec les méthodes Polynomial Features et Domain Knowledge Features. Home Credit Default Risk Competition - Full process - Part 1
-
On continue à améliorer le modèle de la compétition home-credit-default-risk en créant de nouvelles features. On analyse si elles ont un impact sur la performance du modèle avec le coefficient de Pearson ou la Kernel Density Exploration (KDE). Home Credit Default Risk Competition - Full process - Part 2
-
(WIP) On continue encore à améliorer le modèle de la compétition home-credit-default-risk en utilisant toutes les données à disposition. Home Credit Default Risk Competition - Full process - Part 3
LUNA16 competition
NYC taxi trip duration
Kernal autour du sujet Pokemon-Weedle’s Cave
Other kernels
-
Fraud detection in Insurance