Что такое isin в pandas? 🐼 | Руководство для начинающих

isin в библиотеке pandas - это метод, позволяющий определить, находится ли каждое значение в серии или столбце DataFrame в заданной последовательности значений или массиве.

Вот простой пример использования метода isin:


import pandas as pd

# Создание DataFrame
data = {'Имя': ['Алексей', 'Иван', 'Мария', 'Ольга', 'Алексей'],
        'Возраст': [25, 32, 28, 30, 40]}
df = pd.DataFrame(data)

# Проверка, находится ли каждое имя в заданном списке
names_to_check = ['Алексей', 'Мария']
result = df['Имя'].isin(names_to_check)

print(result)
    

Вывод:


0     True
1    False
2     True
3    False
4     True
Name: Имя, dtype: bool
    

Детальный ответ

isin в библиотеке pandas: что это?

isin - это функция в библиотеке pandas, которая помогает определить, содержит ли каждый элемент из одной последовательности (или столбца в DataFrame) какое-либо значение из другой последовательности (или списка значений). Функция возвращает булеву серию, где каждое значение указывает, содержится ли соответствующий элемент в списке значений или нет.

Синтаксис функции isin в pandas:

pandas.isin(values)

Здесь values - это последовательность (список, кортеж, столбец DataFrame и т.д.), содержимое которой мы хотим проверить.

Пример использования функции isin:

import pandas as pd
    
df = pd.DataFrame({'A': [1, 2, 3, 4, 5]})
values = [2, 4, 6] # Список значений, которые мы хотим проверить

result = df['A'].isin(values)
print(result)

В этом примере у нас есть DataFrame df с одним столбцом 'A', содержащим числа от 1 до 5. Мы также объявляем список значений values, содержащий числа 2, 4 и 6.

С помощью функции isin мы проверяем, содержатся ли элементы столбца 'A' в списке значений values. Результатом будет булева серия, где True указывает на то, что соответствующий элемент найден в списке значений, а False - на то, что элемент не найден.

В данном случае, результат будет: [False, True, False, True, False], так как числа 2 и 4 содержатся в списке значений, а число 6 - нет.

Применение функции isin для фильтрации DataFrame:

Одним из практических применений функции isin является фильтрация DataFrame с помощью списка значений. Мы можем использовать isin для выбора только тех строк, где определенный столбец содержит конкретные значения.

import pandas as pd
    
df = pd.DataFrame({'A': [1, 2, 3, 4, 5], 'B': ['apple', 'banana', 'cherry', 'apple', 'banana']})

# Выбираем только строки, где столбец 'B' содержит 'apple' или 'banana'
filtered_df = df[df['B'].isin(['apple', 'banana'])]

print(filtered_df)

В этом примере у нас есть DataFrame df с двумя столбцами 'A' и 'B'. Мы используем isin для выбора только строк, где столбец 'B' содержит значения 'apple' или 'banana'.

Результатом будет новый DataFrame filtered_df, содержащий только строки, где столбец 'B' содержит 'apple' или 'banana'.

Полезные ссылки:

Видео по теме

Pandas Part 13 - The isin() function

► 9. ФИЛЬТРАЦИЯ ДАННЫХ по логическому условию | Курс по Pandas.

Основы Pandas Python | Series, DataFrame И Анализ Данных

Похожие статьи:

Что такое isin в pandas? 🐼 | Руководство для начинающих