Notebooks

Last update of this page: May 2019

Notebooks et tips

Here is a list of useful notebooks to handle different use cases:

Spark recommandation engine example:

Compétitions Kaggle et kernels associés

Here is a list of notebooks I studied and find interesting coming from Kaggle and having a MIT licence. I keep them here as inspirational sources or knowledge base.

Kaggle Winning solutions

Kernels sur le sujet “titanic”

Kernels sur le sujet “iris”

Full analysis

Kernels autour du customer churn

Full analysis

Kernels autour du jeu populaire battle royale

Fun EDA

Kernels autour Google Analytics Customer Revenue Prediction

Simple Exploration+Baseline

Kernels autour des sales forecast

Sales Forecast ecommerce

Kernels sur le sujet “Porto Seguro’s Safe Driver Prediction”

Data preparation & exploration

Recruit Restaurant Visitor Forecasting.

Top 25 solution

Sujets autour du sujet “House Pricing”

Sujets autour de la compétition “home-credit-default-risk”

URL: https://www.kaggle.com/c/home-credit-default-risk

To understand the data feel free to access the “Data” chapter in this notebook of this notebook:

Read-only Kernels:

Basic end-to-end training of a LightGBM model
Très bonnes explications sur la métrique ROC AUC et quelle métrique utiliser pour mesurer la performance d’un modèle lorsque des classes ne sont pas équilibrées ? Traite du One Hot Encoding et du problème pour les features ayant trop de catégories (réduction de dimension). Explication sur le feature engineering et en particulier la construction de nouvelles features avec les méthodes Polynomial Features et Domain Knowledge Features. Home Credit Default Risk Competition - Full process - Part 1
On continue à améliorer le modèle de la compétition home-credit-default-risk en créant de nouvelles features. On analyse si elles ont un impact sur la performance du modèle avec le coefficient de Pearson ou la Kernel Density Exploration (KDE). Home Credit Default Risk Competition - Full process - Part 2
(WIP) On continue encore à améliorer le modèle de la compétition home-credit-default-risk en utilisant toutes les données à disposition. Home Credit Default Risk Competition - Full process - Part 3

LUNA16 competition

Full preprocessing

NYC taxi trip duration

Last cab to new york animated heatmap

Kernal autour du sujet Pokemon-Weedle’s Cave

Full tutorial

Other kernels

3.1. Part 1
3.2. with Keras Part 2