🔎 Руководство: Что делает тильда в pandas? 🐼

Тильда (~) в библиотеке pandas используется для отсутствующих значений (NaN) или для фильтрации данных.

Когда тильда используется в качестве отсутствующего значения (NaN), она указывает, что значения в столбце отсутствуют или неизвестны. Например:


import pandas as pd

data = {'Name': ['John', 'Anna', 'Peter', 'Linda'],
        'Age': [25, 35, '', 42],
        'City': ['New York', 'Paris', 'London', '']}
df = pd.DataFrame(data)

filtered_df = df[df['Age'] != '']

print(filtered_df)

В этом примере, мы используем тильду в условии фильтрации данных, чтобы исключить строки, в которых возраст неизвестен (пустая строка).

Тильда также может использоваться для фильтрации данных. Например:


import pandas as pd

data = {'Name': ['John', 'Anna', 'Peter', 'Linda'],
        'Age': [25, 35, 42, 28],
        'City': ['New York', 'Paris', 'London', '']}
df = pd.DataFrame(data)

filtered_df = df[df['City'] != '']

print(filtered_df)

В этом примере, мы используем тильду в условии фильтрации данных, чтобы исключить строки с пустыми значениями в столбце "City".

Итак, тильда в pandas используется для обработки отсутствующих значений и для фильтрации данных.

Детальный ответ

Что делает тильда в pandas?

Тильда ~ в pandas используется для выполнения различных операций и преобразований над данными. Давайте рассмотрим несколько основных использований тильды в данном контексте.

1. Операции над индексами

Тильда позволяет обращаться к значениям индекса, которые не являются частями заданного диапазона. Рассмотрим пример:


import pandas as pd

data = {'col1': ['A', 'B', 'C', 'D'], 'col2': [1, 2, 3, 4]}
df = pd.DataFrame(data, index=[10, 20, 30, 40])

# Выбираем значения индекса, не входящие в диапазон
df_filtered = df[~df.index.isin(range(20, 35))]
print(df_filtered)

В данном примере тильда используется для отбора значений индекса, не входящих в диапазон от 20 до 35. Обратите внимание на символ ~ перед фильтром. Он инвертирует результат операции df.index.isin(range(20, 35)), позволяя выбрать значения, не входящие в указанный диапазон.

2. Операции над данными

Тильда также может использоваться в операциях над значениями столбцов и ячеек данных. Рассмотрим примеры:


import pandas as pd

data = {'col1': [1, 2, 3, 4], 'col2': [5, 6, 7, 8]}
df = pd.DataFrame(data)

# Умножение значений столбца на -1
df['col1'] = ~df['col1'] + 1

# Инвертирование значений столбца
df['col2'] = ~df['col2']

print(df)

В данном примере с помощью тильды мы умножаем значения столбца 'col1' на -1 и инвертируем значения столбца 'col2'. Операция ~ представляет побитовое инвертирование каждого элемента, при этом меняется знак. Затем мы добавляем 1 к значениям столбца 'col1' для получения исходных положительных значений.

3. Побитовые операции

Тильда может использоваться для выполнения побитовых операций над значениями столбцов или ячеек. Рассмотрим примеры:


import pandas as pd

data = {'col1': [1, 2, 3, 4], 'col2': [5, 6, 7, 8]}
df = pd.DataFrame(data)

# Побитовое ИЛИ значений столбцов
df['col1'] = df['col1'] | df['col2']

# Побитовое ИЗ или значений столбцов
df['col2'] = df['col1'] ^ df['col2']

print(df)

В данном примере мы выполняем побитовое ИЛИ значений столбцов 'col1' и 'col2' с помощью тильды |. Затем мы выполняем побитовое ИЗ или значений столбцов с помощью тильды ^. Обратите внимание, что для выполнения побитовых операций необходимо, чтобы значения были целочисленными.

4. Операции над строками и столбцами

Тильда может использоваться для выполнения операций над строками и столбцами. Рассмотрим примеры:


import pandas as pd

data = {'col1': [1, 2, 3, 4], 'col2': [5, 6, 7, 8]}
df = pd.DataFrame(data)

# Обращение к строкам с помощью тильды
row = df.loc[~(df['col1'] > 2)]
print(row)

# Обращение к столбцам с помощью тильды
col = df[~(df.columns == 'col2')]
print(col)

В данном примере мы обращаемся к строкам, где значение столбца 'col1' не больше 2, с помощью тильды ~. Затем мы обращаемся к столбцам, кроме 'col2', также с использованием тильды ~. Применение тильды перед условием инвертирует его, позволяя нам выбирать строки и столбцы, которые не соответствуют указанному условию.

Вот и все! Надеюсь, этот детальный обзор поможет вам лучше понять, как использовать тильду в pandas. Запомните, что тильда может быть полезным инструментом для выполнения различных операций и преобразований над данными.

Видео по теме

Pandas - разбор всех основных возможностей на реальном датасете

Основы Pandas Python | Series, DataFrame И Анализ Данных

4 главные причины НЕ делать сайт на Тильде / Tilda

Похожие статьи:

🔧 Как обновить pandas в Anaconda: пошаговое руководство

🔎 Руководство: Что делает тильда в pandas? 🐼

Как создать DataFrame в Pandas: полное руководство для начинающих