Как работает функция isin в библиотеке pandas?

Pandas isin - как это работает: Метод isin() в библиотеке Pandas используется для проверки наличия определенных значений в столбце или серии данных. Он возвращает булеву серию, где True указывает на присутствие искомого значения, а False - на его отсутствие. Вот пример использования метода isin(): import pandas as pd # Создание данных data = {'A': ['apple', 'banana', 'cherry', 'date'], 'B': [1, 2, 3, 4]} df = pd.DataFrame(data) # Проверка наличия значений в столбце 'A' is_present = df['A'].isin(['apple', 'banana']) print(is_present) Вывод: 0 True 1 True 2 False 3 False Name: A, dtype: bool В данном примере мы создаем DataFrame с двумя столбцами 'A' и 'B'. Затем мы используем метод isin() для проверки наличия значений 'apple' и 'banana' в столбце 'A'. Результат показывает, что первые два элемента ('apple' и 'banana') присутствуют, а два последних элемента ('cherry' и 'date') отсутствуют. Надеюсь, это помогло вам понять, как работает метод isin() в Pandas!

Детальный ответ

Как работает функция pandas isin

Функция pandas isin предоставляет возможность проверить, содержится ли каждое значение в серии или столбце данных. Она возвращает булеву серию, где True указывает на то, что значение было найдено в переданном списке, а False - на то, что оно не содержится в списке.

Синтаксис

pandas.isin(values, series_or_column)

Где:

  • values - список или массив значений, которые нужно проверить на наличие.
  • series_or_column - серия или столбец данных, в котором нужно проверить наличие значений.

Примеры

Предположим, у нас есть следующая таблица:

import pandas as pd

data = {'Name': ['Alice', 'Bob', 'Charlie', 'Dave'],
        'Age': [25, 30, 35, 40],
        'City': ['New York', 'London', 'Paris', 'Berlin']}

df = pd.DataFrame(data)

print(df)

Output:

      Name  Age       City
0    Alice   25   New York
1      Bob   30     London
2  Charlie   35      Paris
3     Dave   40     Berlin

Пример 1: Проверка наличия значений в столбце

Давайте воспользуемся функцией isin, чтобы проверить, содержится ли определенный список значений в столбце 'City':

cities = ['Paris', 'Madrid', 'London']
    
is_in_cities = df['City'].isin(cities)

print(is_in_cities)

Output:

0    False
1     True
2     True
3    False
Name: City, dtype: bool

Результат показывает, что значения 'Paris' и 'London' содержатся в столбце 'City', в то время как значение 'Madrid' отсутствует.

Пример 2: Проверка наличия значений во всей таблице

Мы также можем использовать функцию isin, чтобы проверить наличие значений во всей таблице df.

values = ['Alice', 35, 'Berlin']
    
is_in_table = df.isin(values)

print(is_in_table)

Output:

    Name    Age   City
0   True  False  False
1  False  False  False
2  False   True  False
3  False  False   True

В результате мы получаем булеву таблицу, в которой True указывает на наличие значения в таблице, а False - на отсутствие.

Заключение

Функция pandas isin очень полезна для проверки наличия значений в сериях или столбцах данных. Она помогает нам быстро и эффективно фильтровать данные по заданным критериям. В этой статье мы рассмотрели синтаксис функции и привели примеры использования.

Видео по теме

Основы Pandas Python | Series, DataFrame И Анализ Данных

Pandas Part 13 - The isin() function

Tutorial 34 : How to use .isin( ) function of pandas library in python | jupyter notebook

Похожие статьи:

Как работает функция isin в библиотеке pandas?

Как посчитать количество элементов в столбце pandas? 🧮