Pré-requis

pip install numpy pandas
# va installer numpy 1.19.1 et pandas 1.1.0

Charger les librairies

import numpy as np
import pandas as pd

Création d’une matrice de données

# Création de la feature matrice
X = np.array([[1, 2], 
              [6, 3], 
              [8, 4], 
              [9, 5], 
              [np.nan, 4]])

Effacer les données manquantes

Avec Numpy

X[~np.isnan(X).any(axis=1)]

Résultat:

array([[1., 2.],
       [6., 3.],
       [8., 4.],
       [9., 5.]])

Avec Pandas

# On transforme les données en dataframe Pandas
df = pd.DataFrame(X, columns=['feature_1', 'feature_2'])

# On efface les observations avec des données manquantes
df.dropna()

Résultat:

   feature_1  feature_2
0        1.0        2.0
1        6.0        3.0
2        8.0        4.0
3        9.0        5.0