Une minute
Effacer les données manquantes
Pré-requis
pip install numpy pandas
# va installer numpy 1.19.1 et pandas 1.1.0
Charger les librairies
import numpy as np
import pandas as pd
Création d’une matrice de données
# Création de la feature matrice
X = np.array([[1, 2],
[6, 3],
[8, 4],
[9, 5],
[np.nan, 4]])
Effacer les données manquantes
Avec Numpy
X[~np.isnan(X).any(axis=1)]
Résultat:
array([[1., 2.],
[6., 3.],
[8., 4.],
[9., 5.]])
Avec Pandas
# On transforme les données en dataframe Pandas
df = pd.DataFrame(X, columns=['feature_1', 'feature_2'])
# On efface les observations avec des données manquantes
df.dropna()
Résultat:
feature_1 feature_2
0 1.0 2.0
1 6.0 3.0
2 8.0 4.0
3 9.0 5.0