Как подсчитать количество уникальных значений в pandas? 📊🐼
Чтобы подсчитать количество уникальных значений в Pandas, вы можете использовать метод nunique(). Этот метод возвращает количество уникальных значений в указанной серии или столбце.
import pandas as pd
# Создаем DataFrame
df = pd.DataFrame({'A': [1, 2, 3, 1, 2, 3, 4, 5]})
# Подсчитываем количество уникальных значений в столбце 'A'
count = df['A'].nunique()
# Выводим результат
print(f"Количество уникальных значений: {count}")
Детальный ответ
Как подсчитать количество уникальных значений в Pandas
Когда мы работаем с данными в Pandas, часто возникает необходимость подсчитать количество уникальных значений в определенном столбце. Но как это сделать?
В Pandas есть несколько способов подсчитать количество уникальных значений. Рассмотрим два наиболее распространенных подхода:
1. Метод value_counts()
Метод value_counts()
возвращает серию, которая содержит количество уникальных значений в столбце. Этот метод позволяет легко определить, сколько раз каждое уникальное значение встречается в столбце.
Ниже приведен пример использования метода value_counts()
:
import pandas as pd
# Создаем DataFrame
data = {'fruit': ['apple', 'banana', 'apple', 'orange', 'banana', 'banana']}
df = pd.DataFrame(data)
# Подсчитываем количество уникальных значений в столбце 'fruit'
unique_counts = df['fruit'].value_counts()
# Выводим результат
print(unique_counts)
В результате мы получим следующий вывод:
banana 3
apple 2
orange 1
Name: fruit, dtype: int64
Из вывода видно, что в столбце 'fruit' у нас есть 3 уникальных значения: 'banana', 'apple' и 'orange'. Соответствующие значения показывают, что 'banana' встречается 3 раза, 'apple' - 2 раза и 'orange' - 1 раз.
2. Метод nunique()
Метод nunique()
возвращает количество уникальных значений в столбце. Этот метод полезен, если нам нужно только число уникальных значений, без подробных сведений о каждом из них.
Приведем пример использования метода nunique()
:
import pandas as pd
# Создаем DataFrame
data = {'fruit': ['apple', 'banana', 'apple', 'orange', 'banana', 'banana']}
df = pd.DataFrame(data)
# Подсчитываем количество уникальных значений в столбце 'fruit'
unique_count = df['fruit'].nunique()
# Выводим результат
print(unique_count)
В результате мы получим следующий вывод:
3
Из вывода видно, что в столбце 'fruit' у нас есть 3 уникальных значения.
Оба этих метода - value_counts()
и nunique()
- являются мощными инструментами для подсчета уникальных значений в столбцах Pandas DataFrame. Выбор метода зависит от того, какую информацию мы хотим получить: детальную статистику с количеством каждого уникального значения или просто общее количество уникальных значений.
Надеюсь, эта статья помогла вам разобраться, как подсчитать количество уникальных значений в Pandas!