Сколько уникальных значений в столбце pandas? 📊😮
import pandas as pd
df = pd.DataFrame({'col1': [1, 2, 3, 2, 3, 4]})
unique_values = df['col1'].nunique()
unique_values
Детальный ответ
Сколько уникальных значений в столбце pandas
В библиотеке pandas, существует несколько способов подсчитать уникальные значения в столбце. Давайте рассмотрим некоторые из них с примерами кода.
Метод value_counts()
Один из самых простых способов подсчитать уникальные значения в столбце - использовать метод value_counts(). Этот метод возвращает серию (Series), где индексы - уникальные значения в столбце, а значения - количество появлений каждого уникального значения. Давайте рассмотрим пример.
import pandas as pd
# Создаем DataFrame
data = {'Столбец': ['значение1', 'значение2', 'значение3', 'значение1', 'значение2']}
df = pd.DataFrame(data)
# Используем метод value_counts()
counts = df['Столбец'].value_counts()
print(counts)
В результате выполнения кода мы получим следующий вывод:
значение1 2
значение2 2
значение3 1
Таким образом, в столбце 'Столбец' у нас есть 2 уникальных значения 'значение1' и 'значение2', которые появляются по 2 раза, и 1 уникальное значение 'значение3'.
Метод unique() и len()
Другой способ подсчитать уникальные значения в столбце - использовать метод unique() и функцию len(). Метод unique() возвращает массив всех уникальных значений в столбце, а функция len() возвращает количество элементов в массиве. Давайте посмотрим на пример.
import pandas as pd
# Создаем DataFrame
data = {'Столбец': ['значение1', 'значение2', 'значение3', 'значение1', 'значение2']}
df = pd.DataFrame(data)
# Используем метод unique() и функцию len()
unique_values = df['Столбец'].unique()
count = len(unique_values)
print(count)
В результате выполнения кода мы получим следующий вывод:
3
Таким образом, в столбце 'Столбец' у нас есть 3 уникальных значения: 'значение1', 'значение2' и 'значение3'.
Метод nunique()
Еще один способ подсчитать уникальные значения в столбце - использовать метод nunique(). Этот метод возвращает количество уникальных значений в столбце. Давайте рассмотрим пример.
import pandas as pd
# Создаем DataFrame
data = {'Столбец': ['значение1', 'значение2', 'значение3', 'значение1', 'значение2']}
df = pd.DataFrame(data)
# Используем метод nunique()
count = df['Столбец'].nunique()
print(count)
В результате выполнения кода мы получим следующий вывод:
3
Таким образом, в столбце 'Столбец' у нас есть 3 уникальных значения: 'значение1', 'значение2' и 'значение3'. Метод nunique() гарантирует, что каждое уникальное значение учитывается только один раз.
Общий вывод
В этой статье мы рассмотрели несколько способов подсчета уникальных значений в столбце pandas. Мы использовали метод value_counts() для подсчета количества появлений каждого уникального значения, метод unique() и функцию len() для получения количества уникальных значений в массиве, а также метод nunique() для получения общего количества уникальных значений в столбце.