Как подсчитать количество уникальных значений в pandas? 📊🐼

Чтобы подсчитать количество уникальных значений в Pandas, вы можете использовать метод nunique(). Этот метод возвращает количество уникальных значений в указанной серии или столбце.

import pandas as pd

# Создаем DataFrame
df = pd.DataFrame({'A': [1, 2, 3, 1, 2, 3, 4, 5]})

# Подсчитываем количество уникальных значений в столбце 'A'
count = df['A'].nunique()

# Выводим результат
print(f"Количество уникальных значений: {count}")

Детальный ответ

Как подсчитать количество уникальных значений в Pandas

Когда мы работаем с данными в Pandas, часто возникает необходимость подсчитать количество уникальных значений в определенном столбце. Но как это сделать?

В Pandas есть несколько способов подсчитать количество уникальных значений. Рассмотрим два наиболее распространенных подхода:

1. Метод value_counts()

Метод value_counts() возвращает серию, которая содержит количество уникальных значений в столбце. Этот метод позволяет легко определить, сколько раз каждое уникальное значение встречается в столбце.

Ниже приведен пример использования метода value_counts():

import pandas as pd

# Создаем DataFrame
data = {'fruit': ['apple', 'banana', 'apple', 'orange', 'banana', 'banana']}
df = pd.DataFrame(data)

# Подсчитываем количество уникальных значений в столбце 'fruit'
unique_counts = df['fruit'].value_counts()

# Выводим результат
print(unique_counts)

В результате мы получим следующий вывод:

banana    3
apple     2
orange    1
Name: fruit, dtype: int64

Из вывода видно, что в столбце 'fruit' у нас есть 3 уникальных значения: 'banana', 'apple' и 'orange'. Соответствующие значения показывают, что 'banana' встречается 3 раза, 'apple' - 2 раза и 'orange' - 1 раз.

2. Метод nunique()

Метод nunique() возвращает количество уникальных значений в столбце. Этот метод полезен, если нам нужно только число уникальных значений, без подробных сведений о каждом из них.

Приведем пример использования метода nunique():

import pandas as pd

# Создаем DataFrame
data = {'fruit': ['apple', 'banana', 'apple', 'orange', 'banana', 'banana']}
df = pd.DataFrame(data)

# Подсчитываем количество уникальных значений в столбце 'fruit'
unique_count = df['fruit'].nunique()

# Выводим результат
print(unique_count)

В результате мы получим следующий вывод:

3

Из вывода видно, что в столбце 'fruit' у нас есть 3 уникальных значения.

Оба этих метода - value_counts() и nunique() - являются мощными инструментами для подсчета уникальных значений в столбцах Pandas DataFrame. Выбор метода зависит от того, какую информацию мы хотим получить: детальную статистику с количеством каждого уникального значения или просто общее количество уникальных значений.

Надеюсь, эта статья помогла вам разобраться, как подсчитать количество уникальных значений в Pandas!

Видео по теме

Pandas Базовый №3. Отбор строк и столбцов, Размерность, Импорт CSV

Посчитать Уникальные Слова в Тексте || Python задачи с технических собеседований

Метод sort values объекта Series. Анализ данных с помощью Pandas

Похожие статьи:

🔎 Как выбрать два столбца в pandas? Узнайте простые шаги и советы! 💡

Как подсчитать количество уникальных значений в pandas? 📊🐼