π ΠΠ°ΠΊ Π½Π°ΠΉΡΠΈ ΠΊΠ²Π°Π½ΡΠΈΠ»ΠΈ Ρ ΠΏΠΎΠΌΠΎΡΡΡ Python: ΠΏΡΠΎΡΡΠΎΠΉ Π³ΠΈΠ΄
Π§ΡΠΎΠ±Ρ Π½Π°ΠΉΡΠΈ ΠΊΠ²Π°Π½ΡΠΈΠ»ΠΈ Π² Python, ΠΌΠΎΠΆΠ½ΠΎ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°ΡΡ ΡΡΠ½ΠΊΡΠΈΡ numpy.percentile()
ΠΈΠ· Π±ΠΈΠ±Π»ΠΈΠΎΡΠ΅ΠΊΠΈ NumPy. ΠΡΠ° ΡΡΠ½ΠΊΡΠΈΡ ΠΏΠΎΠ·Π²ΠΎΠ»ΡΠ΅Ρ Π½Π°ΠΉΡΠΈ ΠΊΠ²Π°Π½ΡΠΈΠ»Ρ Π΄Π»Ρ Π·Π°Π΄Π°Π½Π½ΠΎΠ³ΠΎ ΠΌΠ°ΡΡΠΈΠ²Π° ΡΠΈΡΠ΅Π».
import numpy as np
data = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
# ΠΠ°ΠΉΡΠΈ 25-ΠΉ ΠΊΠ²Π°Π½ΡΠΈΠ»Ρ (Π½ΠΈΠΆΠ½ΠΈΠΉ ΠΊΠ²Π°ΡΡΠΈΠ»Ρ)
q1 = np.percentile(data, 25)
print(f"25-ΠΉ ΠΊΠ²Π°Π½ΡΠΈΠ»Ρ: {q1}")
# ΠΠ°ΠΉΡΠΈ 50-ΠΉ ΠΊΠ²Π°Π½ΡΠΈΠ»Ρ (ΠΌΠ΅Π΄ΠΈΠ°Π½Π°)
q2 = np.percentile(data, 50)
print(f"50-ΠΉ ΠΊΠ²Π°Π½ΡΠΈΠ»Ρ: {q2}")
# ΠΠ°ΠΉΡΠΈ 75-ΠΉ ΠΊΠ²Π°Π½ΡΠΈΠ»Ρ (Π²Π΅ΡΡ
Π½ΠΈΠΉ ΠΊΠ²Π°ΡΡΠΈΠ»Ρ)
q3 = np.percentile(data, 75)
print(f"75-ΠΉ ΠΊΠ²Π°Π½ΡΠΈΠ»Ρ: {q3}")
ΠΠ΅ΡΠ°Π»ΡΠ½ΡΠΉ ΠΎΡΠ²Π΅Ρ
ΠΠ°ΠΊ Π½Π°ΠΉΡΠΈ ΠΊΠ²Π°Π½ΡΠΈΠ»ΠΈ Π² Python
ΠΠ²Π°Π½ΡΠΈΠ»ΠΈ - ΡΡΠΎ ΡΡΠ°ΡΠΈΡΡΠΈΡΠ΅ΡΠΊΠ°Ρ ΠΌΠ΅ΡΠ°, ΠΊΠΎΡΠΎΡΠ°Ρ ΠΏΠΎΠ·Π²ΠΎΠ»ΡΠ΅Ρ ΡΠ°Π·Π΄Π΅Π»ΠΈΡΡ ΡΠ°ΡΠΏΡΠ΅Π΄Π΅Π»Π΅Π½ΠΈΠ΅ Π²Π΅ΡΠΎΡΡΠ½ΠΎΡΡΠ΅ΠΉ Π½Π°Π΄ Π½Π΅ΠΏΡΠ΅ΡΡΠ²Π½ΡΠΌΠΈ ΠΈΠ»ΠΈ Π΄ΠΈΡΠΊΡΠ΅ΡΠ½ΡΠΌΠΈ ΠΏΠ΅ΡΠ΅ΠΌΠ΅Π½Π½ΡΠΌΠΈ Π½Π° ΡΠ°Π²Π½ΡΠ΅ Π΄ΠΎΠ»ΠΈ. ΠΠ²Π°Π½ΡΠΈΠ»Ρ ΠΎΠΏΡΠ΅Π΄Π΅Π»ΡΠ΅Ρ Π·Π½Π°ΡΠ΅Π½ΠΈΠ΅, Π½ΠΈΠΆΠ΅ ΠΊΠΎΡΠΎΡΠΎΠ³ΠΎ Π½Π°Ρ ΠΎΠ΄ΠΈΡΡΡ ΠΎΠΏΡΠ΅Π΄Π΅Π»Π΅Π½Π½Π°Ρ Π΄ΠΎΠ»Ρ Π΄Π°Π½Π½ΡΡ .
Π Python ΡΡΡΠ΅ΡΡΠ²ΡΠ΅Ρ Π½Π΅ΡΠΊΠΎΠ»ΡΠΊΠΎ ΡΠΏΠΎΡΠΎΠ±ΠΎΠ² Π½Π°ΠΉΡΠΈ ΠΊΠ²Π°Π½ΡΠΈΠ»ΠΈ, ΠΈ ΠΌΡ ΡΠ°ΡΡΠΌΠΎΡΡΠΈΠΌ Π½Π΅ΠΊΠΎΡΠΎΡΡΠ΅ ΠΈΠ· Π½ΠΈΡ .
ΠΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°Π½ΠΈΠ΅ Π±ΠΈΠ±Π»ΠΈΠΎΡΠ΅ΠΊΠΈ NumPy
ΠΠΈΠ±Π»ΠΈΠΎΡΠ΅ΠΊΠ° NumPy ΠΏΡΠ΅Π΄ΠΎΡΡΠ°Π²Π»ΡΠ΅Ρ ΡΡΠ½ΠΊΡΠΈΡ numpy.quantile()
, ΠΊΠΎΡΠΎΡΠ°Ρ ΠΏΠΎΠ·Π²ΠΎΠ»ΡΠ΅Ρ Π½Π°ΠΉΡΠΈ ΠΊΠ²Π°Π½ΡΠΈΠ»ΠΈ. ΠΠΎΡ ΠΏΡΠΈΠΌΠ΅Ρ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°Π½ΠΈΡ ΡΡΠ½ΠΊΡΠΈΠΈ:
import numpy as np
# Π‘ΠΎΠ·Π΄Π°Π΅ΠΌ ΠΌΠ°ΡΡΠΈΠ² Π΄Π°Π½Π½ΡΡ
data = np.array([1, 2, 3, 4, 5, 6, 7, 8, 9, 10])
# ΠΠ°Ρ
ΠΎΠ΄ΠΈΠΌ ΠΏΠ΅ΡΠ²ΡΠΉ ΠΊΠ²Π°Π½ΡΠΈΠ»Ρ (25%)
q1 = np.quantile(data, 0.25)
# ΠΠ°Ρ
ΠΎΠ΄ΠΈΠΌ ΠΌΠ΅Π΄ΠΈΠ°Π½Ρ (Π²ΡΠΎΡΠΎΠΉ ΠΊΠ²Π°Π½ΡΠΈΠ»Ρ, 50%)
median = np.quantile(data, 0.5)
# ΠΠ°Ρ
ΠΎΠ΄ΠΈΠΌ ΡΡΠ΅ΡΠΈΠΉ ΠΊΠ²Π°Π½ΡΠΈΠ»Ρ (75%)
q3 = np.quantile(data, 0.75)
print("ΠΠ΅ΡΠ²ΡΠΉ ΠΊΠ²Π°Π½ΡΠΈΠ»Ρ:", q1)
print("ΠΠ΅Π΄ΠΈΠ°Π½Π°:", median)
print("Π’ΡΠ΅ΡΠΈΠΉ ΠΊΠ²Π°Π½ΡΠΈΠ»Ρ:", q3)
Π ΡΡΠΎΠΌ ΠΏΡΠΈΠΌΠ΅ΡΠ΅ ΠΌΡ ΡΠΎΠ·Π΄Π°Π»ΠΈ ΠΌΠ°ΡΡΠΈΠ² Π΄Π°Π½Π½ΡΡ
ΠΈ ΠΈΡΠΏΠΎΠ»ΡΠ·ΡΡ ΡΡΠ½ΠΊΡΠΈΡ numpy.quantile()
, Π½Π°ΡΠ»ΠΈ ΠΏΠ΅ΡΠ²ΡΠΉ ΠΊΠ²Π°Π½ΡΠΈΠ»Ρ (25%), ΠΌΠ΅Π΄ΠΈΠ°Π½Ρ (50%) ΠΈ ΡΡΠ΅ΡΠΈΠΉ ΠΊΠ²Π°Π½ΡΠΈΠ»Ρ (75%). ΠΠ°ΡΠ΅ΠΌ ΠΌΡ Π²ΡΠ²Π΅Π»ΠΈ ΡΡΠΈ Π·Π½Π°ΡΠ΅Π½ΠΈΡ Π½Π° ΡΠΊΡΠ°Π½.
ΠΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°Π½ΠΈΠ΅ Π±ΠΈΠ±Π»ΠΈΠΎΡΠ΅ΠΊΠΈ pandas
ΠΠΈΠ±Π»ΠΈΠΎΡΠ΅ΠΊΠ° pandas ΡΠ°ΠΊΠΆΠ΅ ΠΏΡΠ΅Π΄ΠΎΡΡΠ°Π²Π»ΡΠ΅Ρ ΡΠ΄ΠΎΠ±Π½ΡΠ΅ ΡΡΠ½ΠΊΡΠΈΠΈ Π΄Π»Ρ ΡΠ°Π±ΠΎΡΡ Ρ Π΄Π°Π½Π½ΡΠΌΠΈ, Π²ΠΊΠ»ΡΡΠ°Ρ ΡΡΠ½ΠΊΡΠΈΡ pandas.DataFrame.quantile()
. ΠΠΎΡ ΠΏΡΠΈΠΌΠ΅Ρ Π΅Π΅ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°Π½ΠΈΡ:
import pandas as pd
# Π‘ΠΎΠ·Π΄Π°Π΅ΠΌ DataFrame Ρ Π΄Π°Π½Π½ΡΠΌΠΈ
data = pd.DataFrame({'A': [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]})
# ΠΠ°Ρ
ΠΎΠ΄ΠΈΠΌ ΠΏΠ΅ΡΠ²ΡΠΉ ΠΊΠ²Π°Π½ΡΠΈΠ»Ρ (25%)
q1 = data.quantile(0.25)
# ΠΠ°Ρ
ΠΎΠ΄ΠΈΠΌ ΠΌΠ΅Π΄ΠΈΠ°Π½Ρ (Π²ΡΠΎΡΠΎΠΉ ΠΊΠ²Π°Π½ΡΠΈΠ»Ρ, 50%)
median = data.quantile(0.5)
# ΠΠ°Ρ
ΠΎΠ΄ΠΈΠΌ ΡΡΠ΅ΡΠΈΠΉ ΠΊΠ²Π°Π½ΡΠΈΠ»Ρ (75%)
q3 = data.quantile(0.75)
print("ΠΠ΅ΡΠ²ΡΠΉ ΠΊΠ²Π°Π½ΡΠΈΠ»Ρ:")
print(q1)
print("ΠΠ΅Π΄ΠΈΠ°Π½Π°:")
print(median)
print("Π’ΡΠ΅ΡΠΈΠΉ ΠΊΠ²Π°Π½ΡΠΈΠ»Ρ:")
print(q3)
Π ΡΡΠΎΠΌ ΠΏΡΠΈΠΌΠ΅ΡΠ΅ ΠΌΡ ΡΠΎΠ·Π΄Π°Π»ΠΈ DataFrame Ρ Π΄Π°Π½Π½ΡΠΌΠΈ ΠΈ ΠΈΡΠΏΠΎΠ»ΡΠ·ΡΡ ΡΡΠ½ΠΊΡΠΈΡ pandas.DataFrame.quantile()
, Π½Π°ΡΠ»ΠΈ ΠΏΠ΅ΡΠ²ΡΠΉ, Π²ΡΠΎΡΠΎΠΉ ΠΈ ΡΡΠ΅ΡΠΈΠΉ ΠΊΠ²Π°Π½ΡΠΈΠ»ΠΈ. ΠΠ°ΡΠ΅ΠΌ ΠΌΡ Π²ΡΠ²Π΅Π»ΠΈ ΡΠΎΠΎΡΠ²Π΅ΡΡΡΠ²ΡΡΡΠΈΠ΅ Π·Π½Π°ΡΠ΅Π½ΠΈΡ Π½Π° ΡΠΊΡΠ°Π½.
ΠΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°Π½ΠΈΠ΅ ΠΌΠ΅ΡΠΎΠ΄Π° quantile() Π² ΠΎΠ±ΡΠ΅ΠΊΡΠ°Ρ Series
ΠΠ±ΡΠ΅ΠΊΡΡ Series, ΠΊΠΎΡΠΎΡΡΠ΅ ΡΠ²Π»ΡΡΡΡΡ ΠΎΠ΄Π½ΠΎΠΌΠ΅ΡΠ½ΡΠΌΠΈ ΠΌΠ°ΡΡΠΈΠ²Π°ΠΌΠΈ Π΄Π°Π½Π½ΡΡ
Π² pandas, ΡΠ°ΠΊΠΆΠ΅ ΠΈΠΌΠ΅ΡΡ ΠΌΠ΅ΡΠΎΠ΄ quantile()
, ΠΊΠΎΡΠΎΡΡΠΉ ΠΏΠΎΠ·Π²ΠΎΠ»ΡΠ΅Ρ Π½Π°ΠΉΡΠΈ ΠΊΠ²Π°Π½ΡΠΈΠ»ΠΈ. ΠΠΎΡ ΠΏΡΠΈΠΌΠ΅Ρ Π΅Π³ΠΎ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°Π½ΠΈΡ:
import pandas as pd
# Π‘ΠΎΠ·Π΄Π°Π΅ΠΌ Series Ρ Π΄Π°Π½Π½ΡΠΌΠΈ
data = pd.Series([1, 2, 3, 4, 5, 6, 7, 8, 9, 10])
# ΠΠ°Ρ
ΠΎΠ΄ΠΈΠΌ ΠΏΠ΅ΡΠ²ΡΠΉ ΠΊΠ²Π°Π½ΡΠΈΠ»Ρ (25%)
q1 = data.quantile(0.25)
# ΠΠ°Ρ
ΠΎΠ΄ΠΈΠΌ ΠΌΠ΅Π΄ΠΈΠ°Π½Ρ (Π²ΡΠΎΡΠΎΠΉ ΠΊΠ²Π°Π½ΡΠΈΠ»Ρ, 50%)
median = data.quantile(0.5)
# ΠΠ°Ρ
ΠΎΠ΄ΠΈΠΌ ΡΡΠ΅ΡΠΈΠΉ ΠΊΠ²Π°Π½ΡΠΈΠ»Ρ (75%)
q3 = data.quantile(0.75)
print("ΠΠ΅ΡΠ²ΡΠΉ ΠΊΠ²Π°Π½ΡΠΈΠ»Ρ:", q1)
print("ΠΠ΅Π΄ΠΈΠ°Π½Π°:", median)
print("Π’ΡΠ΅ΡΠΈΠΉ ΠΊΠ²Π°Π½ΡΠΈΠ»Ρ:", q3)
Π ΡΡΠΎΠΌ ΠΏΡΠΈΠΌΠ΅ΡΠ΅ ΠΌΡ ΡΠΎΠ·Π΄Π°Π»ΠΈ Series Ρ Π΄Π°Π½Π½ΡΠΌΠΈ ΠΈ ΠΈΡΠΏΠΎΠ»ΡΠ·ΡΡ ΠΌΠ΅ΡΠΎΠ΄ quantile()
, Π½Π°ΡΠ»ΠΈ ΠΏΠ΅ΡΠ²ΡΠΉ, Π²ΡΠΎΡΠΎΠΉ ΠΈ ΡΡΠ΅ΡΠΈΠΉ ΠΊΠ²Π°Π½ΡΠΈΠ»ΠΈ. ΠΠ°ΡΠ΅ΠΌ ΠΌΡ Π²ΡΠ²Π΅Π»ΠΈ Π·Π½Π°ΡΠ΅Π½ΠΈΡ Π½Π° ΡΠΊΡΠ°Π½.
ΠΠ°ΠΊΠ»ΡΡΠ΅Π½ΠΈΠ΅
Π ΡΡΠΎΠΉ ΡΡΠ°ΡΡΠ΅ ΠΌΡ ΡΠ°ΡΡΠΌΠΎΡΡΠ΅Π»ΠΈ Π½Π΅ΡΠΊΠΎΠ»ΡΠΊΠΎ ΡΠΏΠΎΡΠΎΠ±ΠΎΠ² Π½Π°Ρ
ΠΎΠΆΠ΄Π΅Π½ΠΈΡ ΠΊΠ²Π°Π½ΡΠΈΠ»Π΅ΠΉ Π² Python. ΠΡ ΠΈΡΠΏΠΎΠ»ΡΠ·ΠΎΠ²Π°Π»ΠΈ ΡΡΠ½ΠΊΡΠΈΡ numpy.quantile()
ΠΈΠ· Π±ΠΈΠ±Π»ΠΈΠΎΡΠ΅ΠΊΠΈ NumPy, ΡΡΠ½ΠΊΡΠΈΡ pandas.DataFrame.quantile()
ΠΈΠ· Π±ΠΈΠ±Π»ΠΈΠΎΡΠ΅ΠΊΠΈ pandas ΠΈ ΠΌΠ΅ΡΠΎΠ΄ quantile()
Π² ΠΎΠ±ΡΠ΅ΠΊΡΠ°Ρ
Series.
ΠΠ°Π΄Π΅ΡΡΡ, ΡΡΠ° ΠΈΠ½ΡΠΎΡΠΌΠ°ΡΠΈΡ Π±ΡΠ΄Π΅Ρ ΠΏΠΎΠ»Π΅Π·Π½Π° Π΄Π»Ρ Π²Π°Ρ Π² ΡΠ°Π±ΠΎΡΠ΅ Ρ ΠΊΠ²Π°Π½ΡΠΈΠ»ΡΠΌΠΈ Π² Python!