π§ ΠΠ°ΠΊ ΠΈΠ·ΠΌΠ΅Π½ΠΈΡΡ dataframe pandas: ΠΏΡΠΎΡΡΡΠ΅ ΡΠ°Π³ΠΈ Π΄Π»Ρ ΡΡΠΏΠ΅ΡΠ½ΠΎΠΉ ΠΎΠ±ΡΠ°Π±ΠΎΡΠΊΠΈ Π΄Π°Π½Π½ΡΡ
Π§ΡΠΎΠ±Ρ ΠΈΠ·ΠΌΠ΅Π½ΠΈΡΡ DataFrame Π² Pandas, Π²Ρ ΠΌΠΎΠΆΠ΅ΡΠ΅ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°ΡΡ ΡΠ°Π·Π»ΠΈΡΠ½ΡΠ΅ ΠΌΠ΅ΡΠΎΠ΄Ρ ΠΈ ΡΡΠ½ΠΊΡΠΈΠΈ.
ΠΠΎΡ Π½Π΅ΡΠΊΠΎΠ»ΡΠΊΠΎ ΠΏΡΠΈΠΌΠ΅ΡΠΎΠ²:
ΠΠΎΠ±Π°Π²Π»Π΅Π½ΠΈΠ΅ Π½ΠΎΠ²ΠΎΠ³ΠΎ ΡΡΠΎΠ»Π±ΡΠ°:
df['Π½ΠΎΠ²ΡΠΉ_ΡΡΠΎΠ»Π±Π΅Ρ'] = Π·Π½Π°ΡΠ΅Π½ΠΈΠ΅
Π£Π΄Π°Π»Π΅Π½ΠΈΠ΅ ΡΡΠΎΠ»Π±ΡΠ°:
del df['ΡΡΠΎΠ»Π±Π΅Ρ']
ΠΠ΅ΡΠ΅ΠΈΠΌΠ΅Π½ΠΎΠ²Π°Π½ΠΈΠ΅ ΡΡΠΎΠ»Π±ΡΠ°:
df.rename(columns={'ΡΡΠ°ΡΠΎΠ΅_Π½Π°Π·Π²Π°Π½ΠΈΠ΅': 'Π½ΠΎΠ²ΠΎΠ΅_Π½Π°Π·Π²Π°Π½ΠΈΠ΅'}, inplace=True)
ΠΠ·ΠΌΠ΅Π½Π΅Π½ΠΈΠ΅ Π·Π½Π°ΡΠ΅Π½ΠΈΡ Π² ΡΡΠ΅ΠΉΠΊΠ΅:
df.at[ΠΈΠ½Π΄Π΅ΠΊΡ, 'ΡΡΠΎΠ»Π±Π΅Ρ'] = Π½ΠΎΠ²ΠΎΠ΅_Π·Π½Π°ΡΠ΅Π½ΠΈΠ΅
ΠΠ·ΠΌΠ΅Π½Π΅Π½ΠΈΠ΅ ΡΠΈΠΏΠ° Π΄Π°Π½Π½ΡΡ ΡΡΠΎΠ»Π±ΡΠ°:
df['ΡΡΠΎΠ»Π±Π΅Ρ'] = df['ΡΡΠΎΠ»Π±Π΅Ρ'].astype(Π½ΠΎΠ²ΡΠΉ_ΡΠΈΠΏ)
ΠΠ°Π΄Π΅ΡΡΡ, ΡΡΠΈ ΠΏΡΠΈΠΌΠ΅ΡΡ ΠΏΠΎΠΌΠΎΠ³ΡΡ Π²Π°ΠΌ ΠΈΠ·ΠΌΠ΅Π½ΠΈΡΡ DataFrame Π² Pandas!
ΠΠ΅ΡΠ°Π»ΡΠ½ΡΠΉ ΠΎΡΠ²Π΅Ρ
ΠΠ°ΠΊ ΠΈΠ·ΠΌΠ΅Π½ΠΈΡΡ dataframe pandas
ΠΠΎΠ±ΡΠΎ ΠΏΠΎΠΆΠ°Π»ΠΎΠ²Π°ΡΡ Π² ΡΠ²Π»Π΅ΠΊΠ°ΡΠ΅Π»ΡΠ½ΡΠΉ ΠΌΠΈΡ ΠΎΠ±ΡΠ°Π±ΠΎΡΠΊΠΈ Π΄Π°Π½Π½ΡΡ Ρ ΠΏΠΎΠΌΠΎΡΡΡ Π±ΠΈΠ±Π»ΠΈΠΎΡΠ΅ΠΊΠΈ pandas! DataFrame - ΡΡΠΎ ΠΎΠ΄Π½Π° ΠΈΠ· ΠΎΡΠ½ΠΎΠ²Π½ΡΡ ΡΡΡΡΠΊΡΡΡ Π΄Π°Π½Π½ΡΡ Π² pandas, ΠΈ Π² ΡΡΠΎΠΉ ΡΡΠ°ΡΡΠ΅ Ρ ΡΠ°ΡΡΠΊΠ°ΠΆΡ Π²Π°ΠΌ, ΠΊΠ°ΠΊ ΠΈΠ·ΠΌΠ΅Π½ΠΈΡΡ DataFrame Π² ΡΠ°Π·Π»ΠΈΡΠ½ΡΡ Π°ΡΠΏΠ΅ΠΊΡΠ°Ρ . ΠΠ°Π²Π°ΠΉΡΠ΅ Π½Π°ΡΠ½Π΅ΠΌ!
ΠΠΎΠ±Π°Π²Π»Π΅Π½ΠΈΠ΅ ΡΡΠΎΠ»Π±ΡΠ°
ΠΠΎΠ±Π°Π²Π»Π΅Π½ΠΈΠ΅ Π½ΠΎΠ²ΠΎΠ³ΠΎ ΡΡΠΎΠ»Π±ΡΠ° Π² DataFrame - ΡΡΠΎ ΠΏΡΠΎΡΡΠΎΠΉ ΡΠΏΠΎΡΠΎΠ± Π΄ΠΎΠ±Π°Π²ΠΈΡΡ Π΄ΠΎΠΏΠΎΠ»Π½ΠΈΡΠ΅Π»ΡΠ½ΡΠ΅ Π΄Π°Π½Π½ΡΠ΅. ΠΠ»Ρ ΡΡΠΎΠ³ΠΎ ΠΌΡ ΠΌΠΎΠΆΠ΅ΠΌ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°ΡΡ ΡΠ°Π·Π»ΠΈΡΠ½ΡΠ΅ ΠΌΠ΅ΡΠΎΠ΄Ρ, ΡΠ°ΠΊΠΈΠ΅ ΠΊΠ°ΠΊ assign()
ΠΈΠ»ΠΈ ΠΏΡΠΈΡΠ²Π°ΠΈΠ²Π°Π½ΠΈΠ΅ Π·Π½Π°ΡΠ΅Π½ΠΈΡ Π½Π΅ΠΏΠΎΡΡΠ΅Π΄ΡΡΠ²Π΅Π½Π½ΠΎ Π² ΡΡΠΎΠ»Π±Π΅Ρ.
import pandas as pd
# Π‘ΠΎΠ·Π΄Π°Π΅ΠΌ DataFrame
df = pd.DataFrame({'ΠΈΠΌΡ':['ΠΠ²Π°Π½', 'ΠΠ°ΡΠΈΡ', 'ΠΠ»Π΅ΠΊΡΠ΅ΠΉ'],
'Π²ΠΎΠ·ΡΠ°ΡΡ':[25, 30, 35]})
# ΠΡΠΏΠΎΠ»ΡΠ·ΡΠ΅ΠΌ assign() Π΄Π»Ρ Π΄ΠΎΠ±Π°Π²Π»Π΅Π½ΠΈΡ Π½ΠΎΠ²ΠΎΠ³ΠΎ ΡΡΠΎΠ»Π±ΡΠ°
df = df.assign(Π·Π°ΡΠΏΠ»Π°ΡΠ°=[50000, 60000, 70000])
# ΠΡΠΈΡΠ²Π°ΠΈΠ²Π°Π΅ΠΌ Π·Π½Π°ΡΠ΅Π½ΠΈΠ΅ ΡΡΠΎΠ»Π±ΡΠ° Π½Π°ΠΏΡΡΠΌΡΡ
df['ΠΏΠΎΠ»'] = ['Π', 'Π', 'Π']
print(df)
Π Π΅Π·ΡΠ»ΡΡΠ°Ρ:
ΠΈΠΌΡ Π²ΠΎΠ·ΡΠ°ΡΡ Π·Π°ΡΠΏΠ»Π°ΡΠ° ΠΏΠΎΠ»
0 ΠΠ²Π°Π½ 25 50000 Π
1 ΠΠ°ΡΠΈΡ 30 60000 Π
2 ΠΠ»Π΅ΠΊΡΠ΅ΠΉ 35 70000 Π
ΠΠ·ΠΌΠ΅Π½Π΅Π½ΠΈΠ΅ Π·Π½Π°ΡΠ΅Π½ΠΈΡ Π² ΡΡΠ΅ΠΉΠΊΠ΅
Π§ΡΠΎΠ±Ρ ΠΈΠ·ΠΌΠ΅Π½ΠΈΡΡ Π·Π½Π°ΡΠ΅Π½ΠΈΠ΅ Π² ΠΎΠΏΡΠ΅Π΄Π΅Π»Π΅Π½Π½ΠΎΠΉ ΡΡΠ΅ΠΉΠΊΠ΅ DataFrame, ΠΌΡ ΠΌΠΎΠΆΠ΅ΠΌ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°ΡΡ ΠΈΠ½Π΄Π΅ΠΊΡΠ°ΡΠΈΡ ΠΈ ΠΏΡΠΈΡΠ²Π°ΠΈΠ²Π°Π½ΠΈΠ΅ Π·Π½Π°ΡΠ΅Π½ΠΈΡ ΡΡΠΎΠΉ ΡΡΠ΅ΠΉΠΊΠ΅.
import pandas as pd
# Π‘ΠΎΠ·Π΄Π°Π΅ΠΌ DataFrame
df = pd.DataFrame({'ΠΈΠΌΡ':['ΠΠ²Π°Π½', 'ΠΠ°ΡΠΈΡ', 'ΠΠ»Π΅ΠΊΡΠ΅ΠΉ'],
'Π²ΠΎΠ·ΡΠ°ΡΡ':[25, 30, 35]})
# ΠΠ·ΠΌΠ΅Π½ΡΠ΅ΠΌ Π·Π½Π°ΡΠ΅Π½ΠΈΠ΅ Π² ΡΡΠ΅ΠΉΠΊΠ΅
df.at[0, 'Π²ΠΎΠ·ΡΠ°ΡΡ'] = 26
print(df)
Π Π΅Π·ΡΠ»ΡΡΠ°Ρ:
ΠΈΠΌΡ Π²ΠΎΠ·ΡΠ°ΡΡ
0 ΠΠ²Π°Π½ 26
1 ΠΠ°ΡΠΈΡ 30
2 ΠΠ»Π΅ΠΊΡΠ΅ΠΉ 35
ΠΠ·ΠΌΠ΅Π½Π΅Π½ΠΈΠ΅ ΡΡΡΡΠΊΡΡΡΡ DataFrame
ΠΡ ΠΌΠΎΠΆΠ΅ΠΌ ΠΈΠ·ΠΌΠ΅Π½ΠΈΡΡ ΡΡΡΡΠΊΡΡΡΡ DataFrame, Π΄ΠΎΠ±Π°Π²Π»ΡΡ ΠΈΠ»ΠΈ ΡΠ΄Π°Π»ΡΡ ΡΡΠΎΠ»Π±ΡΡ ΠΈ ΡΡΡΠΎΠΊΠΈ.
ΠΠΎΠ±Π°Π²Π»Π΅Π½ΠΈΠ΅ ΡΡΡΠΎΠΊΠΈ
ΠΠ»Ρ Π΄ΠΎΠ±Π°Π²Π»Π΅Π½ΠΈΡ Π½ΠΎΠ²ΠΎΠΉ ΡΡΡΠΎΠΊΠΈ Π² DataFrame ΠΌΡ ΠΌΠΎΠΆΠ΅ΠΌ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°ΡΡ ΠΌΠ΅ΡΠΎΠ΄ append()
ΠΈΠ»ΠΈ ΡΠΎΠ·Π΄Π°ΡΡ Π½ΠΎΠ²ΡΠΉ DataFrame ΠΈ ΠΎΠ±ΡΠ΅Π΄ΠΈΠ½ΠΈΡΡ Π΅Π³ΠΎ Ρ ΡΡΡΠ΅ΡΡΠ²ΡΡΡΠΈΠΌ DataFrame.
import pandas as pd
# Π‘ΠΎΠ·Π΄Π°Π΅ΠΌ DataFrame
df = pd.DataFrame({'ΠΈΠΌΡ':['ΠΠ²Π°Π½', 'ΠΠ°ΡΠΈΡ'],
'Π²ΠΎΠ·ΡΠ°ΡΡ':[25, 30]})
# Π‘ΠΎΠ·Π΄Π°Π΅ΠΌ Π½ΠΎΠ²ΡΡ ΡΡΡΠΎΠΊΡ
new_row = pd.DataFrame({'ΠΈΠΌΡ':'ΠΠ»Π΅ΠΊΡΠ΅ΠΉ',
'Π²ΠΎΠ·ΡΠ°ΡΡ':35}, index=[2])
# ΠΡΠΏΠΎΠ»ΡΠ·ΡΠ΅ΠΌ append() Π΄Π»Ρ Π΄ΠΎΠ±Π°Π²Π»Π΅Π½ΠΈΡ ΡΡΡΠΎΠΊΠΈ
df = df.append(new_row)
print(df)
Π Π΅Π·ΡΠ»ΡΡΠ°Ρ:
ΠΈΠΌΡ Π²ΠΎΠ·ΡΠ°ΡΡ
0 ΠΠ²Π°Π½ 25
1 ΠΠ°ΡΠΈΡ 30
2 ΠΠ»Π΅ΠΊΡΠ΅ΠΉ 35
Π£Π΄Π°Π»Π΅Π½ΠΈΠ΅ ΡΡΠΎΠ»Π±ΡΠ° ΠΈΠ»ΠΈ ΡΡΡΠΎΠΊΠΈ
Π§ΡΠΎΠ±Ρ ΡΠ΄Π°Π»ΠΈΡΡ ΡΡΠΎΠ»Π±Π΅Ρ ΠΈΠ»ΠΈ ΡΡΡΠΎΠΊΡ ΠΈΠ· DataFrame, ΠΌΡ ΠΌΠΎΠΆΠ΅ΠΌ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°ΡΡ ΠΌΠ΅ΡΠΎΠ΄ drop()
.
import pandas as pd
# Π‘ΠΎΠ·Π΄Π°Π΅ΠΌ DataFrame
df = pd.DataFrame({'ΠΈΠΌΡ':['ΠΠ²Π°Π½', 'ΠΠ°ΡΠΈΡ', 'ΠΠ»Π΅ΠΊΡΠ΅ΠΉ'],
'Π²ΠΎΠ·ΡΠ°ΡΡ':[25, 30, 35]})
# Π£Π΄Π°Π»ΡΠ΅ΠΌ ΡΡΠΎΠ»Π±Π΅Ρ 'Π²ΠΎΠ·ΡΠ°ΡΡ'
df = df.drop('Π²ΠΎΠ·ΡΠ°ΡΡ', axis=1)
# Π£Π΄Π°Π»ΡΠ΅ΠΌ ΡΡΡΠΎΠΊΡ Ρ ΠΈΠ½Π΄Π΅ΠΊΡΠΎΠΌ 1
df = df.drop(1)
print(df)
Π Π΅Π·ΡΠ»ΡΡΠ°Ρ:
ΠΈΠΌΡ
0 ΠΠ²Π°Π½
2 ΠΠ»Π΅ΠΊΡΠ΅ΠΉ
ΠΡΠΈΠΌΠ΅Π½Π΅Π½ΠΈΠ΅ ΡΡΠ½ΠΊΡΠΈΠΉ ΠΊ ΡΡΠΎΠ»Π±ΡΠ°ΠΌ ΠΈΠ»ΠΈ ΡΡΡΠΎΠΊΠ°ΠΌ
Π pandas ΠΌΡ ΠΌΠΎΠΆΠ΅ΠΌ Π»Π΅Π³ΠΊΠΎ ΠΏΡΠΈΠΌΠ΅Π½ΡΡΡ ΡΡΠ½ΠΊΡΠΈΠΈ ΠΊ ΡΡΠΎΠ»Π±ΡΠ°ΠΌ ΠΈΠ»ΠΈ ΡΡΡΠΎΠΊΠ°ΠΌ DataFrame Ρ ΠΏΠΎΠΌΠΎΡΡΡ ΠΌΠ΅ΡΠΎΠ΄ΠΎΠ² apply()
ΠΈΠ»ΠΈ applymap()
.
ΠΡΠΈΠΌΠ΅Π½Π΅Π½ΠΈΠ΅ ΡΡΠ½ΠΊΡΠΈΠΈ ΠΊ ΡΡΠΎΠ»Π±ΡΡ
ΠΠ°Π²Π°ΠΉΡΠ΅ ΠΏΡΠ΅Π΄ΠΏΠΎΠ»ΠΎΠΆΠΈΠΌ, ΡΡΠΎ Ρ Π½Π°Ρ Π΅ΡΡΡ ΡΡΠΎΠ»Π±Π΅Ρ 'Π²ΠΎΠ·ΡΠ°ΡΡ', ΠΈ ΠΌΡ Ρ ΠΎΡΠΈΠΌ ΡΠ²Π΅Π»ΠΈΡΠΈΡΡ ΠΊΠ°ΠΆΠ΄ΠΎΠ΅ Π·Π½Π°ΡΠ΅Π½ΠΈΠ΅ Π² ΡΡΠΎΠΌ ΡΡΠΎΠ»Π±ΡΠ΅ Π½Π° 1.
import pandas as pd
# Π‘ΠΎΠ·Π΄Π°Π΅ΠΌ DataFrame
df = pd.DataFrame({'ΠΈΠΌΡ':['ΠΠ²Π°Π½', 'ΠΠ°ΡΠΈΡ', 'ΠΠ»Π΅ΠΊΡΠ΅ΠΉ'],
'Π²ΠΎΠ·ΡΠ°ΡΡ':[25, 30, 35]})
# Π€ΡΠ½ΠΊΡΠΈΡ Π΄Π»Ρ ΡΠ²Π΅Π»ΠΈΡΠ΅Π½ΠΈΡ Π·Π½Π°ΡΠ΅Π½ΠΈΡ Π½Π° 1
def increment_age(age):
return age + 1
# ΠΡΠΈΠΌΠ΅Π½ΡΠ΅ΠΌ ΡΡΠ½ΠΊΡΠΈΡ ΠΊ ΡΡΠΎΠ»Π±ΡΡ 'Π²ΠΎΠ·ΡΠ°ΡΡ'
df['Π²ΠΎΠ·ΡΠ°ΡΡ'] = df['Π²ΠΎΠ·ΡΠ°ΡΡ'].apply(increment_age)
print(df)
Π Π΅Π·ΡΠ»ΡΡΠ°Ρ:
ΠΈΠΌΡ Π²ΠΎΠ·ΡΠ°ΡΡ
0 ΠΠ²Π°Π½ 26
1 ΠΠ°ΡΠΈΡ 31
2 ΠΠ»Π΅ΠΊΡΠ΅ΠΉ 36
ΠΡΠΈΠΌΠ΅Π½Π΅Π½ΠΈΠ΅ ΡΡΠ½ΠΊΡΠΈΠΈ ΠΊ ΠΊΠ°ΠΆΠ΄ΠΎΠΌΡ ΡΠ»Π΅ΠΌΠ΅Π½ΡΡ DataFrame
ΠΡΠ»ΠΈ ΠΌΡ Ρ
ΠΎΡΠΈΠΌ ΠΏΡΠΈΠΌΠ΅Π½ΠΈΡΡ ΡΡΠ½ΠΊΡΠΈΡ ΠΊ ΠΊΠ°ΠΆΠ΄ΠΎΠΌΡ ΡΠ»Π΅ΠΌΠ΅Π½ΡΡ DataFrame, ΠΌΡ ΠΌΠΎΠΆΠ΅ΠΌ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°ΡΡ ΠΌΠ΅ΡΠΎΠ΄ applymap()
.
import pandas as pd
# Π‘ΠΎΠ·Π΄Π°Π΅ΠΌ DataFrame
df = pd.DataFrame({'ΠΈΠΌΡ':['ΠΠ²Π°Π½', 'ΠΠ°ΡΠΈΡ', 'ΠΠ»Π΅ΠΊΡΠ΅ΠΉ'],
'Π²ΠΎΠ·ΡΠ°ΡΡ':[25, 30, 35]})
# Π€ΡΠ½ΠΊΡΠΈΡ Π΄Π»Ρ Π΄ΠΎΠ±Π°Π²Π»Π΅Π½ΠΈΡ ΡΡΡΡΠΈΠΊΡΠ° ΠΊ ΠΊΠ°ΠΆΠ΄ΠΎΠΌΡ ΡΠ»Π΅ΠΌΠ΅Π½ΡΡ
def add_suffix(value):
return str(value) + ' Π³.'
# ΠΡΠΈΠΌΠ΅Π½ΡΠ΅ΠΌ ΡΡΠ½ΠΊΡΠΈΡ ΠΊ ΠΊΠ°ΠΆΠ΄ΠΎΠΌΡ ΡΠ»Π΅ΠΌΠ΅Π½ΡΡ DataFrame
df = df.applymap(add_suffix)
print(df)
Π Π΅Π·ΡΠ»ΡΡΠ°Ρ:
ΠΈΠΌΡ Π²ΠΎΠ·ΡΠ°ΡΡ
0 ΠΠ²Π°Π½ Π³. 25 Π³.
1 ΠΠ°ΡΠΈΡ Π³. 30 Π³.
2 ΠΠ»Π΅ΠΊΡΠ΅ΠΉ Π³. 35 Π³.
Π€ΠΈΠ»ΡΡΡΠ°ΡΠΈΡ DataFrame
ΠΠΎΠ³Π΄Π° Π½Π°ΠΌ Π½ΡΠΆΠ½ΠΎ ΡΠΈΠ»ΡΡΡΠΎΠ²Π°ΡΡ Π΄Π°Π½Π½ΡΠ΅ Π² DataFrame, ΠΌΡ ΠΌΠΎΠΆΠ΅ΠΌ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°ΡΡ Π»ΠΎΠ³ΠΈΡΠ΅ΡΠΊΠΈΠ΅ Π²ΡΡΠ°ΠΆΠ΅Π½ΠΈΡ Π² ΠΊΠ°ΡΠ΅ΡΡΠ²Π΅ ΡΡΠ»ΠΎΠ²ΠΈΠΉ ΡΠΈΠ»ΡΡΡΠ°ΡΠΈΠΈ.
import pandas as pd
# Π‘ΠΎΠ·Π΄Π°Π΅ΠΌ DataFrame
df = pd.DataFrame({'ΠΈΠΌΡ':['ΠΠ²Π°Π½', 'ΠΠ°ΡΠΈΡ', 'ΠΠ»Π΅ΠΊΡΠ΅ΠΉ'],
'Π²ΠΎΠ·ΡΠ°ΡΡ':[25, 30, 35]})
# Π€ΠΈΠ»ΡΡΡΡΠ΅ΠΌ DataFrame ΠΏΠΎ Π²ΠΎΠ·ΡΠ°ΡΡΡ Π±ΠΎΠ»ΡΡΠ΅ 30
filtered_df = df[df['Π²ΠΎΠ·ΡΠ°ΡΡ'] > 30]
print(filtered_df)
Π Π΅Π·ΡΠ»ΡΡΠ°Ρ:
ΠΈΠΌΡ Π²ΠΎΠ·ΡΠ°ΡΡ
2 ΠΠ»Π΅ΠΊΡΠ΅ΠΉ 35
ΠΡΡΠΏΠΏΠΈΡΠΎΠ²ΠΊΠ° ΠΈ Π°Π³ΡΠ΅Π³Π°ΡΠΈΡ Π΄Π°Π½Π½ΡΡ
ΠΠΎΠ³Π΄Π° Π½Π°ΠΌ Π½ΡΠΆΠ½ΠΎ Π°Π½Π°Π»ΠΈΠ·ΠΈΡΠΎΠ²Π°ΡΡ Π΄Π°Π½Π½ΡΠ΅ ΠΏΠΎ Π³ΡΡΠΏΠΏΠ°ΠΌ, ΠΌΡ ΠΌΠΎΠΆΠ΅ΠΌ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°ΡΡ Π³ΡΡΠΏΠΏΠΈΡΠΎΠ²ΠΊΡ ΠΈ Π°Π³ΡΠ΅Π³Π°ΡΠΈΡ Π΄Π°Π½Π½ΡΡ .
import pandas as pd
# Π‘ΠΎΠ·Π΄Π°Π΅ΠΌ DataFrame
df = pd.DataFrame({'ΠΈΠΌΡ':['ΠΠ²Π°Π½', 'ΠΠ°ΡΠΈΡ', 'ΠΠ»Π΅ΠΊΡΠ΅ΠΉ'],
'ΠΏΠΎΠ»':['Π', 'Π', 'Π'],
'Π·Π°ΡΠΏΠ»Π°ΡΠ°':[50000, 60000, 70000]})
# ΠΡΡΠΏΠΏΠΈΡΡΠ΅ΠΌ Π΄Π°Π½Π½ΡΠ΅ ΠΏΠΎ ΠΏΠΎΠ»Ρ
grouped_df = df.groupby('ΠΏΠΎΠ»')
# ΠΡΠΏΠΎΠ»Π½ΡΠ΅ΠΌ Π°Π³ΡΠ΅Π³Π°ΡΠΈΡ, Π½Π°ΠΏΡΠΈΠΌΠ΅Ρ, ΡΡΠ΅Π΄Π½Π΅Π΅ Π·Π½Π°ΡΠ΅Π½ΠΈΠ΅ Π·Π°ΡΠΏΠ»Π°ΡΡ
aggregated_df = grouped_df['Π·Π°ΡΠΏΠ»Π°ΡΠ°'].mean()
print(aggregated_df)
Π Π΅Π·ΡΠ»ΡΡΠ°Ρ:
ΠΏΠΎΠ»
Π 60000
Π 60000
Name: Π·Π°ΡΠΏΠ»Π°ΡΠ°, dtype: int64
ΠΡΠΎΠ³ΠΈ
Π ΡΡΠΎΠΉ ΡΡΠ°ΡΡΠ΅ ΠΌΡ ΠΈΠ·ΡΡΠΈΠ»ΠΈ, ΠΊΠ°ΠΊ ΠΈΠ·ΠΌΠ΅Π½ΡΡΡ DataFrame Π² pandas. ΠΡ ΡΠ°ΡΡΠΌΠΎΡΡΠ΅Π»ΠΈ Π΄ΠΎΠ±Π°Π²Π»Π΅Π½ΠΈΠ΅ ΡΡΠΎΠ»Π±ΡΠΎΠ², ΠΈΠ·ΠΌΠ΅Π½Π΅Π½ΠΈΠ΅ Π·Π½Π°ΡΠ΅Π½ΠΈΠΉ Π² ΡΡΠ΅ΠΉΠΊΠ°Ρ , ΠΈΠ·ΠΌΠ΅Π½Π΅Π½ΠΈΠ΅ ΡΡΡΡΠΊΡΡΡΡ DataFrame, ΠΏΡΠΈΠΌΠ΅Π½Π΅Π½ΠΈΠ΅ ΡΡΠ½ΠΊΡΠΈΠΉ ΠΊ ΡΡΠΎΠ»Π±ΡΠ°ΠΌ ΠΈΠ»ΠΈ ΡΡΡΠΎΠΊΠ°ΠΌ, ΡΠΈΠ»ΡΡΡΠ°ΡΠΈΡ Π΄Π°Π½Π½ΡΡ ΠΈ Π³ΡΡΠΏΠΏΠΈΡΠΎΠ²ΠΊΡ Ρ Π°Π³ΡΠ΅Π³Π°ΡΠΈΠ΅ΠΉ Π΄Π°Π½Π½ΡΡ . Π’Π΅ΠΏΠ΅ΡΡ Ρ Π²Π°Ρ Π΅ΡΡΡ Π½Π°Π²ΡΠΊΠΈ, ΡΡΠΎΠ±Ρ ΡΡΡΠ΅ΠΊΡΠΈΠ²Π½ΠΎ ΡΠ°Π±ΠΎΡΠ°ΡΡ Ρ DataFrame ΠΈ ΠΎΠ±ΡΠ°Π±Π°ΡΡΠ²Π°ΡΡ Π΄Π°Π½Π½ΡΠ΅ Π² pandas. Π£ΡΠΏΠ΅Ρ ΠΎΠ² Π² Π²Π°ΡΠ΅ΠΌ ΠΏΡΡΠ΅ΡΠ΅ΡΡΠ²ΠΈΠΈ Π² ΠΌΠΈΡ Π°Π½Π°Π»ΠΈΠ·Π° Π΄Π°Π½Π½ΡΡ Ρ ΠΏΠΎΠΌΠΎΡΡΡ pandas!