Что такое isin в pandas? 🐼 | Руководство для начинающих
isin в библиотеке pandas - это метод, позволяющий определить, находится ли каждое значение в серии или столбце DataFrame в заданной последовательности значений или массиве.
Вот простой пример использования метода isin:
import pandas as pd
# Создание DataFrame
data = {'Имя': ['Алексей', 'Иван', 'Мария', 'Ольга', 'Алексей'],
'Возраст': [25, 32, 28, 30, 40]}
df = pd.DataFrame(data)
# Проверка, находится ли каждое имя в заданном списке
names_to_check = ['Алексей', 'Мария']
result = df['Имя'].isin(names_to_check)
print(result)
Вывод:
0 True
1 False
2 True
3 False
4 True
Name: Имя, dtype: bool
Детальный ответ
isin в библиотеке pandas: что это?
isin - это функция в библиотеке pandas, которая помогает определить, содержит ли каждый элемент из одной последовательности (или столбца в DataFrame) какое-либо значение из другой последовательности (или списка значений). Функция возвращает булеву серию, где каждое значение указывает, содержится ли соответствующий элемент в списке значений или нет.
Синтаксис функции isin в pandas:
pandas.isin(values)
Здесь values - это последовательность (список, кортеж, столбец DataFrame и т.д.), содержимое которой мы хотим проверить.
Пример использования функции isin:
import pandas as pd
df = pd.DataFrame({'A': [1, 2, 3, 4, 5]})
values = [2, 4, 6] # Список значений, которые мы хотим проверить
result = df['A'].isin(values)
print(result)
В этом примере у нас есть DataFrame df с одним столбцом 'A', содержащим числа от 1 до 5. Мы также объявляем список значений values, содержащий числа 2, 4 и 6.
С помощью функции isin мы проверяем, содержатся ли элементы столбца 'A' в списке значений values. Результатом будет булева серия, где True указывает на то, что соответствующий элемент найден в списке значений, а False - на то, что элемент не найден.
В данном случае, результат будет: [False, True, False, True, False], так как числа 2 и 4 содержатся в списке значений, а число 6 - нет.
Применение функции isin для фильтрации DataFrame:
Одним из практических применений функции isin является фильтрация DataFrame с помощью списка значений. Мы можем использовать isin для выбора только тех строк, где определенный столбец содержит конкретные значения.
import pandas as pd
df = pd.DataFrame({'A': [1, 2, 3, 4, 5], 'B': ['apple', 'banana', 'cherry', 'apple', 'banana']})
# Выбираем только строки, где столбец 'B' содержит 'apple' или 'banana'
filtered_df = df[df['B'].isin(['apple', 'banana'])]
print(filtered_df)
В этом примере у нас есть DataFrame df с двумя столбцами 'A' и 'B'. Мы используем isin для выбора только строк, где столбец 'B' содержит значения 'apple' или 'banana'.
Результатом будет новый DataFrame filtered_df, содержащий только строки, где столбец 'B' содержит 'apple' или 'banana'.