πΌ Pandas inf: ΠΊΠ°ΠΊ ΡΠ±ΡΠ°ΡΡ? ΠΠ΅Π³ΠΊΠΈΠ΅ ΡΠΏΠΎΡΠΎΠ±Ρ ΠΈΠ·Π±Π°Π²ΠΈΡΡΡΡ ΠΎΡ Π½Π΅ΠΎΠ±Ρ ΠΎΠ΄ΠΈΠΌΠΎΡΡΠΈ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°Π½ΠΈΡ Π±ΠΈΠ±Π»ΠΈΠΎΡΠ΅ΠΊΠΈ Pandas
Π§ΡΠΎΠ±Ρ ΡΠ΄Π°Π»ΠΈΡΡ Π·Π½Π°ΡΠ΅Π½ΠΈΡ Π² ΡΡΠΎΠ»Π±ΡΠ΅ inf
Π² pandas, Π²Ρ ΠΌΠΎΠΆΠ΅ΡΠ΅ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°ΡΡ ΠΌΠ΅ΡΠΎΠ΄ replace()
Ρ Π°ΡΠ³ΡΠΌΠ΅Π½ΡΠΎΠΌ np.inf
. ΠΠΎΡ ΠΏΡΠΈΠΌΠ΅Ρ:
import pandas as pd
import numpy as np
# Π‘ΠΎΠ·Π΄Π°Π½ΠΈΠ΅ DataFrame
data = {'A': [1, 2, np.inf, 4, 5],
'B': [np.inf, 2, 3, 4, 5]}
df = pd.DataFrame(data)
# ΠΠ°ΠΌΠ΅Π½Π° Π·Π½Π°ΡΠ΅Π½ΠΈΡ np.inf Π½Π° NaN
df = df.replace(np.inf, np.nan)
print(df)
ΠΠ΅ΡΠ°Π»ΡΠ½ΡΠΉ ΠΎΡΠ²Π΅Ρ
ΠΠ°ΠΊ ΡΠ±ΡΠ°ΡΡ NaN Π·Π½Π°ΡΠ΅Π½ΠΈΡ Π² Pandas DataFrame: pandas.inf
ΠΠΎΠ³Π΄Π° ΠΌΡ ΡΠ°Π±ΠΎΡΠ°Π΅ΠΌ Ρ Π΄Π°Π½Π½ΡΠΌΠΈ Π² Pandas DataFrame, ΠΈΠ½ΠΎΠ³Π΄Π° ΠΌΡ ΡΡΠ°Π»ΠΊΠΈΠ²Π°Π΅ΠΌΡΡ Ρ ΠΏΡΠΎΠΏΡΡΠ΅Π½Π½ΡΠΌΠΈ Π·Π½Π°ΡΠ΅Π½ΠΈΡΠΌΠΈ (NaN). ΠΡΠΈ Π·Π½Π°ΡΠ΅Π½ΠΈΡ ΠΌΠΎΠ³ΡΡ Π²ΠΎΠ·Π½ΠΈΠΊΠ½ΡΡΡ ΠΈΠ· ΡΠ°Π·Π»ΠΈΡΠ½ΡΡ ΠΏΡΠΈΡΠΈΠ½, Π½Π°ΠΏΡΠΈΠΌΠ΅Ρ, ΠΈΠ·-Π·Π° ΠΎΡΡΡΡΡΡΠ²ΠΈΡ Π΄Π°Π½Π½ΡΡ ΠΈΠ»ΠΈ ΠΎΡΠΈΠ±ΠΎΠΊ Π² ΠΏΡΠΎΡΠ΅ΡΡΠ΅ ΠΎΠ±ΡΠ°Π±ΠΎΡΠΊΠΈ. ΠΡΠ»ΠΈ ΠΎΠ½ΠΈ Π½Π΅ ΠΎΠ±ΡΠ°Π±Π°ΡΡΠ²Π°ΡΡΡΡ ΠΏΡΠ°Π²ΠΈΠ»ΡΠ½ΠΎ, ΠΎΠ½ΠΈ ΠΌΠΎΠ³ΡΡ ΠΏΡΠΈΠ²Π΅ΡΡΠΈ ΠΊ ΠΎΡΠΈΠ±ΠΊΠ°ΠΌ Π² Π°Π½Π°Π»ΠΈΠ·Π΅ Π΄Π°Π½Π½ΡΡ ΠΈΠ»ΠΈ ΠΌΠΎΠ΄Π΅Π»ΠΈΡΠΎΠ²Π°Π½ΠΈΠΈ.
ΠΠ»Ρ ΡΠ΄Π°Π»Π΅Π½ΠΈΡ NaN Π·Π½Π°ΡΠ΅Π½ΠΈΠΉ Π² Pandas DataFrame ΠΌΠΎΠΆΠ½ΠΎ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°ΡΡ ΠΌΠ΅ΡΠΎΠ΄ dropna(). ΠΡΠΎΡ ΠΌΠ΅ΡΠΎΠ΄ ΠΏΠΎΠ·Π²ΠΎΠ»ΡΠ΅Ρ ΡΠ΄Π°Π»ΠΈΡΡ ΡΡΡΠΎΠΊΠΈ ΠΈΠ»ΠΈ ΡΡΠΎΠ»Π±ΡΡ, ΡΠΎΠ΄Π΅ΡΠΆΠ°ΡΠΈΠ΅ NaN Π·Π½Π°ΡΠ΅Π½ΠΈΡ.
ΠΠΈΠΆΠ΅ ΠΏΡΠΈΠ²Π΅Π΄Π΅Π½ ΠΏΡΠΈΠΌΠ΅Ρ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°Π½ΠΈΡ ΠΌΠ΅ΡΠΎΠ΄Π° dropna() Π΄Π»Ρ ΡΠ΄Π°Π»Π΅Π½ΠΈΡ ΡΡΡΠΎΠΊ, ΡΠΎΠ΄Π΅ΡΠΆΠ°ΡΠΈΡ NaN Π·Π½Π°ΡΠ΅Π½ΠΈΡ:
import pandas as pd
# Π‘ΠΎΠ·Π΄Π°Π΅ΠΌ DataFrame Ρ NaN Π·Π½Π°ΡΠ΅Π½ΠΈΡΠΌΠΈ
data = {'Column1': [1, 2, NaN, 4, 5],
'Column2': [NaN, 2, 3, 4, 5]}
df = pd.DataFrame(data)
# Π£Π΄Π°Π»ΡΠ΅ΠΌ ΡΡΡΠΎΠΊΠΈ Ρ NaN Π·Π½Π°ΡΠ΅Π½ΠΈΡΠΌΠΈ
df = df.dropna()
print(df)
Π ΡΡΠΎΠΌ ΠΏΡΠΈΠΌΠ΅ΡΠ΅ ΠΌΡ ΡΠΎΠ·Π΄Π°Π΅ΠΌ DataFrame Ρ NaN Π·Π½Π°ΡΠ΅Π½ΠΈΡΠΌΠΈ Π² ΡΡΠΎΠ»Π±ΡΠ°Ρ "Column1" ΠΈ "Column2". ΠΠ°ΡΠ΅ΠΌ ΠΌΡ ΠΈΡΠΏΠΎΠ»ΡΠ·ΡΠ΅ΠΌ ΠΌΠ΅ΡΠΎΠ΄ dropna() Π΄Π»Ρ ΡΠ΄Π°Π»Π΅Π½ΠΈΡ ΡΡΡΠΎΠΊ Ρ NaN Π·Π½Π°ΡΠ΅Π½ΠΈΡΠΌΠΈ. Π Π΅Π·ΡΠ»ΡΡΠ°ΡΠΎΠΌ Π±ΡΠ΄Π΅Ρ Π½ΠΎΠ²ΡΠΉ DataFrame, Π² ΠΊΠΎΡΠΎΡΠΎΠΌ Π²ΡΠ΅ ΡΡΡΠΎΠΊΠΈ Ρ NaN Π·Π½Π°ΡΠ΅Π½ΠΈΡΠΌΠΈ Π±ΡΠ΄ΡΡ ΡΠ΄Π°Π»Π΅Π½Ρ.
ΠΡΠ»ΠΈ Π²Π°ΠΌ Π½ΡΠΆΠ½ΠΎ ΡΠ΄Π°Π»ΠΈΡΡ ΡΡΠΎΠ»Π±ΡΡ, ΡΠΎΠ΄Π΅ΡΠΆΠ°ΡΠΈΠ΅ NaN Π·Π½Π°ΡΠ΅Π½ΠΈΡ, Π²Ρ ΠΌΠΎΠΆΠ΅ΡΠ΅ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°ΡΡ ΠΏΠ°ΡΠ°ΠΌΠ΅ΡΡ axis ΠΌΠ΅ΡΠΎΠ΄Π° dropna(). Π£ΡΡΠ°Π½ΠΎΠ²ΠΈΡΠ΅ Π·Π½Π°ΡΠ΅Π½ΠΈΠ΅ axis=1, ΡΡΠΎΠ±Ρ ΡΠ΄Π°Π»ΠΈΡΡ ΡΡΠΎΠ»Π±ΡΡ:
import pandas as pd
# Π‘ΠΎΠ·Π΄Π°Π΅ΠΌ DataFrame Ρ NaN Π·Π½Π°ΡΠ΅Π½ΠΈΡΠΌΠΈ
data = {'Column1': [1, 2, NaN, 4, 5],
'Column2': [NaN, 2, 3, 4, 5]}
df = pd.DataFrame(data)
# Π£Π΄Π°Π»ΡΠ΅ΠΌ ΡΡΠΎΠ»Π±ΡΡ Ρ NaN Π·Π½Π°ΡΠ΅Π½ΠΈΡΠΌΠΈ
df = df.dropna(axis=1)
print(df)
Π ΡΡΠΎΠΌ ΠΏΡΠΈΠΌΠ΅ΡΠ΅ ΠΌΡ ΡΠ΄Π°Π»ΡΠ΅ΠΌ ΡΡΠΎΠ»Π±ΡΡ Ρ NaN Π·Π½Π°ΡΠ΅Π½ΠΈΡΠΌΠΈ, ΠΈΡΠΏΠΎΠ»ΡΠ·ΡΡ ΠΏΠ°ΡΠ°ΠΌΠ΅ΡΡ axis=1. Π Π΅Π·ΡΠ»ΡΡΠ°ΡΠΎΠΌ Π±ΡΠ΄Π΅Ρ Π½ΠΎΠ²ΡΠΉ DataFrame, Π² ΠΊΠΎΡΠΎΡΠΎΠΌ Π²ΡΠ΅ ΡΡΠΎΠ»Π±ΡΡ Ρ NaN Π·Π½Π°ΡΠ΅Π½ΠΈΡΠΌΠΈ Π±ΡΠ΄ΡΡ ΡΠ΄Π°Π»Π΅Π½Ρ.
ΠΡΠΎΠΌΠ΅ ΠΌΠ΅ΡΠΎΠ΄Π° dropna(), Π²Ρ ΡΠ°ΠΊΠΆΠ΅ ΠΌΠΎΠΆΠ΅ΡΠ΅ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°ΡΡ ΠΌΠ΅ΡΠΎΠ΄Ρ fillna() ΠΈ replace() Π΄Π»Ρ ΠΎΠ±ΡΠ°Π±ΠΎΡΠΊΠΈ NaN Π·Π½Π°ΡΠ΅Π½ΠΈΠΉ. ΠΠ΅ΡΠΎΠ΄ fillna() ΠΏΠΎΠ·Π²ΠΎΠ»ΡΠ΅Ρ Π·Π°ΠΌΠ΅Π½ΠΈΡΡ NaN Π·Π½Π°ΡΠ΅Π½ΠΈΡ Π΄ΡΡΠ³ΠΈΠΌΠΈ Π·Π½Π°ΡΠ΅Π½ΠΈΡΠΌΠΈ, Π½Π°ΠΏΡΠΈΠΌΠ΅Ρ, ΡΡΠ΅Π΄Π½ΠΈΠΌ ΠΈΠ»ΠΈ ΠΌΠ΅Π΄ΠΈΠ°Π½ΠΎΠΉ, Π° ΠΌΠ΅ΡΠΎΠ΄ replace() ΠΏΠΎΠ·Π²ΠΎΠ»ΡΠ΅Ρ Π·Π°ΠΌΠ΅Π½ΠΈΡΡ NaN Π·Π½Π°ΡΠ΅Π½ΠΈΡ Π½Π° Π·Π°Π΄Π°Π½Π½ΠΎΠ΅ Π·Π½Π°ΡΠ΅Π½ΠΈΠ΅.
ΠΠΈΠΆΠ΅ ΠΏΡΠΈΠ²Π΅Π΄Π΅Π½Ρ ΠΏΡΠΈΠΌΠ΅ΡΡ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°Π½ΠΈΡ ΠΌΠ΅ΡΠΎΠ΄ΠΎΠ² fillna() ΠΈ replace():
import pandas as pd
import numpy as np
# Π‘ΠΎΠ·Π΄Π°Π΅ΠΌ DataFrame Ρ NaN Π·Π½Π°ΡΠ΅Π½ΠΈΡΠΌΠΈ
data = {'Column1': [1, 2, NaN, 4, 5],
'Column2': [NaN, 2, 3, 4, 5]}
df = pd.DataFrame(data)
# ΠΠ°ΠΌΠ΅Π½ΡΠ΅ΠΌ NaN Π·Π½Π°ΡΠ΅Π½ΠΈΡ ΡΡΠ΅Π΄Π½ΠΈΠΌ
df = df.fillna(df.mean())
print(df)
# ΠΠ°ΠΌΠ΅Π½ΡΠ΅ΠΌ NaN Π·Π½Π°ΡΠ΅Π½ΠΈΡ Π½Π° -1
df = df.replace(np.nan, -1)
print(df)
Π ΠΏΠ΅ΡΠ²ΠΎΠΌ ΠΏΡΠΈΠΌΠ΅ΡΠ΅ ΠΌΡ ΠΈΡΠΏΠΎΠ»ΡΠ·ΡΠ΅ΠΌ ΠΌΠ΅ΡΠΎΠ΄ fillna(), ΡΡΠΎΠ±Ρ Π·Π°ΠΌΠ΅Π½ΠΈΡΡ NaN Π·Π½Π°ΡΠ΅Π½ΠΈΡ ΡΡΠ΅Π΄Π½ΠΈΠΌ Π·Π½Π°ΡΠ΅Π½ΠΈΠ΅ΠΌ ΡΡΠΎΠ»Π±ΡΠΎΠ². Π ΡΠ΅Π·ΡΠ»ΡΡΠ°ΡΠ΅ NaN Π·Π½Π°ΡΠ΅Π½ΠΈΡ Π·Π°ΠΌΠ΅Π½ΡΡΡΡΡ ΡΡΠ΅Π΄Π½ΠΈΠΌ Π·Π½Π°ΡΠ΅Π½ΠΈΠ΅ΠΌ ΡΡΠΎΠ»Π±ΡΠΎΠ².
ΠΠΎ Π²ΡΠΎΡΠΎΠΌ ΠΏΡΠΈΠΌΠ΅ΡΠ΅ ΠΌΡ ΠΈΡΠΏΠΎΠ»ΡΠ·ΡΠ΅ΠΌ ΠΌΠ΅ΡΠΎΠ΄ replace(), ΡΡΠΎΠ±Ρ Π·Π°ΠΌΠ΅Π½ΠΈΡΡ NaN Π·Π½Π°ΡΠ΅Π½ΠΈΡ Π½Π° -1. Π ΡΠ΅Π·ΡΠ»ΡΡΠ°ΡΠ΅ NaN Π·Π½Π°ΡΠ΅Π½ΠΈΡ Π·Π°ΠΌΠ΅Π½ΡΡΡΡΡ Π½Π° -1.
Π’Π°ΠΊΠΈΠΌ ΠΎΠ±ΡΠ°Π·ΠΎΠΌ, Ρ ΠΏΠΎΠΌΠΎΡΡΡ ΠΌΠ΅ΡΠΎΠ΄ΠΎΠ² dropna(), fillna() ΠΈ replace() Π²Ρ ΠΌΠΎΠΆΠ΅ΡΠ΅ ΡΠ±ΡΠ°ΡΡ NaN Π·Π½Π°ΡΠ΅Π½ΠΈΡ Π² Pandas DataFrame ΠΈ ΠΎΠ±ΡΠ°Π±ΠΎΡΠ°ΡΡ ΠΈΡ Π² ΡΠΎΠΎΡΠ²Π΅ΡΡΡΠ²ΠΈΠΈ Ρ Π²Π°ΡΠΈΠΌΠΈ Π½ΡΠΆΠ΄Π°ΠΌΠΈ.