Сколько уникальных значений в столбце pandas? 📊😮

import pandas as pd

df = pd.DataFrame({'col1': [1, 2, 3, 2, 3, 4]})
unique_values = df['col1'].nunique()

unique_values
У вас есть объект DataFrame с названием "df" и столбцом "col1". Чтобы найти количество уникальных значений в этом столбце, вы можете использовать метод "nunique()". Пример кода выше показывает, как это сделать. В переменной "unique_values" будет содержаться число уникальных значений в столбце "col1".

Детальный ответ

Сколько уникальных значений в столбце pandas

В библиотеке pandas, существует несколько способов подсчитать уникальные значения в столбце. Давайте рассмотрим некоторые из них с примерами кода.

Метод value_counts()

Один из самых простых способов подсчитать уникальные значения в столбце - использовать метод value_counts(). Этот метод возвращает серию (Series), где индексы - уникальные значения в столбце, а значения - количество появлений каждого уникального значения. Давайте рассмотрим пример.


import pandas as pd

# Создаем DataFrame
data = {'Столбец': ['значение1', 'значение2', 'значение3', 'значение1', 'значение2']}
df = pd.DataFrame(data)

# Используем метод value_counts()
counts = df['Столбец'].value_counts()

print(counts)

В результате выполнения кода мы получим следующий вывод:

значение1 2

значение2 2

значение3 1

Таким образом, в столбце 'Столбец' у нас есть 2 уникальных значения 'значение1' и 'значение2', которые появляются по 2 раза, и 1 уникальное значение 'значение3'.

Метод unique() и len()

Другой способ подсчитать уникальные значения в столбце - использовать метод unique() и функцию len(). Метод unique() возвращает массив всех уникальных значений в столбце, а функция len() возвращает количество элементов в массиве. Давайте посмотрим на пример.


import pandas as pd

# Создаем DataFrame
data = {'Столбец': ['значение1', 'значение2', 'значение3', 'значение1', 'значение2']}
df = pd.DataFrame(data)

# Используем метод unique() и функцию len()
unique_values = df['Столбец'].unique()
count = len(unique_values)

print(count)

В результате выполнения кода мы получим следующий вывод:

3

Таким образом, в столбце 'Столбец' у нас есть 3 уникальных значения: 'значение1', 'значение2' и 'значение3'.

Метод nunique()

Еще один способ подсчитать уникальные значения в столбце - использовать метод nunique(). Этот метод возвращает количество уникальных значений в столбце. Давайте рассмотрим пример.


import pandas as pd

# Создаем DataFrame
data = {'Столбец': ['значение1', 'значение2', 'значение3', 'значение1', 'значение2']}
df = pd.DataFrame(data)

# Используем метод nunique()
count = df['Столбец'].nunique()

print(count)

В результате выполнения кода мы получим следующий вывод:

3

Таким образом, в столбце 'Столбец' у нас есть 3 уникальных значения: 'значение1', 'значение2' и 'значение3'. Метод nunique() гарантирует, что каждое уникальное значение учитывается только один раз.

Общий вывод

В этой статье мы рассмотрели несколько способов подсчета уникальных значений в столбце pandas. Мы использовали метод value_counts() для подсчета количества появлений каждого уникального значения, метод unique() и функцию len() для получения количества уникальных значений в массиве, а также метод nunique() для получения общего количества уникальных значений в столбце.

Видео по теме

Pandas Базовый №3. Отбор строк и столбцов, Размерность, Импорт CSV

► 4. ИНДЕКСЫ строк и столбцов | Курс по Pandas

Трюк Excel 25. Список уникальных значений

Похожие статьи:

🔎 Как сгруппировать данные в pandas: простой и эффективный способ 📊

Сколько уникальных значений в столбце pandas? 📊😮