Как работает функция isin в библиотеке pandas?
isin()
в библиотеке Pandas используется для проверки наличия определенных значений в столбце или серии данных. Он возвращает булеву серию, где True
указывает на присутствие искомого значения, а False
- на его отсутствие.
Вот пример использования метода isin()
:
import pandas as pd
# Создание данных
data = {'A': ['apple', 'banana', 'cherry', 'date'],
'B': [1, 2, 3, 4]}
df = pd.DataFrame(data)
# Проверка наличия значений в столбце 'A'
is_present = df['A'].isin(['apple', 'banana'])
print(is_present)
Вывод:
0 True
1 True
2 False
3 False
Name: A, dtype: bool
В данном примере мы создаем DataFrame с двумя столбцами 'A' и 'B'. Затем мы используем метод isin()
для проверки наличия значений 'apple' и 'banana' в столбце 'A'. Результат показывает, что первые два элемента ('apple' и 'banana') присутствуют, а два последних элемента ('cherry' и 'date') отсутствуют.
Надеюсь, это помогло вам понять, как работает метод isin()
в Pandas!
Детальный ответ
Как работает функция pandas isin
Функция pandas isin предоставляет возможность проверить, содержится ли каждое значение в серии или столбце данных. Она возвращает булеву серию, где True
указывает на то, что значение было найдено в переданном списке, а False
- на то, что оно не содержится в списке.
Синтаксис
pandas.isin(values, series_or_column)
Где:
- values - список или массив значений, которые нужно проверить на наличие.
- series_or_column - серия или столбец данных, в котором нужно проверить наличие значений.
Примеры
Предположим, у нас есть следующая таблица:
import pandas as pd
data = {'Name': ['Alice', 'Bob', 'Charlie', 'Dave'],
'Age': [25, 30, 35, 40],
'City': ['New York', 'London', 'Paris', 'Berlin']}
df = pd.DataFrame(data)
print(df)
Output:
Name Age City
0 Alice 25 New York
1 Bob 30 London
2 Charlie 35 Paris
3 Dave 40 Berlin
Пример 1: Проверка наличия значений в столбце
Давайте воспользуемся функцией isin, чтобы проверить, содержится ли определенный список значений в столбце 'City':
cities = ['Paris', 'Madrid', 'London']
is_in_cities = df['City'].isin(cities)
print(is_in_cities)
Output:
0 False
1 True
2 True
3 False
Name: City, dtype: bool
Результат показывает, что значения 'Paris' и 'London' содержатся в столбце 'City', в то время как значение 'Madrid' отсутствует.
Пример 2: Проверка наличия значений во всей таблице
Мы также можем использовать функцию isin, чтобы проверить наличие значений во всей таблице df.
values = ['Alice', 35, 'Berlin']
is_in_table = df.isin(values)
print(is_in_table)
Output:
Name Age City
0 True False False
1 False False False
2 False True False
3 False False True
В результате мы получаем булеву таблицу, в которой True
указывает на наличие значения в таблице, а False
- на отсутствие.
Заключение
Функция pandas isin очень полезна для проверки наличия значений в сериях или столбцах данных. Она помогает нам быстро и эффективно фильтровать данные по заданным критериям. В этой статье мы рассмотрели синтаксис функции и привели примеры использования.