🔪 Как обрезать таблицу в pandas: легкий способ для начинающих
Чтобы обрезать таблицу в pandas, вы можете использовать методы .head() и .tail().
import pandas as pd
# Создание примера таблицы
data = {'Имя': ['Анна', 'Борис', 'Вероника', 'Григорий', 'Дарья'],
'Возраст': [25, 32, 28, 43, 30],
'Город': ['Москва', 'Санкт-Петербург', 'Москва', 'Новосибирск', 'Екатеринбург']}
df = pd.DataFrame(data)
# Вывод первых двух строк таблицы
print("Первые две строки таблицы:")
print(df.head(2))
# Вывод последних двух строк таблицы
print("Последние две строки таблицы:")
print(df.tail(2))
Метод .head() выводит первые несколько строк таблицы (по умолчанию - пять), а метод .tail() выводит последние несколько строк. Вы можете указать количество строк, которые хотите вывести в скобках методов. В приведенном примере мы вывели первые две и последние две строки таблицы.
Детальный ответ
Как обрезать таблицу в pandas
В библиотеке pandas, одной из основных задач обработки данных, является фильтрация и обрезание таблицы в соответствии с определенными условиями. В этой статье мы рассмотрим различные способы обрезки таблицы в pandas и предоставим примеры кода.
1. Фильтрация по условию
Одним из наиболее распространенных способов обрезки таблицы является фильтрация по условию. Вы можете использовать логические выражения, чтобы выбрать только те строки, которые соответствуют определенным критериям.
Давайте предположим, что у нас есть таблица с данными о студентах:
import pandas as pd
data = {'Имя': ['Анна', 'Борис', 'Виктор', 'Галина'],
'Возраст': [20, 22, 19, 21],
'Оценка': [85, 90, 75, 95]}
df = pd.DataFrame(data)
Если мы хотим выбрать только тех студентов, у которых возраст больше 20 лет, мы можем использовать следующий код:
filtered_df = df[df['Возраст'] > 20]
Результатом будет новая таблица, содержащая только строки, где возраст студента больше 20.
2. Обрезка по индексу
Если вам нужно обрезать таблицу по определенному диапазону индексов, вы можете использовать метод iloc
.
Давайте предположим, что у нас есть таблица со списком стран:
data = {'Страна': ['Россия', 'Германия', 'Франция', 'Италия', 'Испания'],
'Население': [144.5, 83.1, 67.1, 60.5, 46.7]}
df = pd.DataFrame(data)
Если мы хотим выбрать только первые три страны из таблицы, мы можем использовать следующий код:
trimmed_df = df.iloc[:3]
В результате будет создана новая таблица с первыми тремя строками из исходной таблицы.
3. Удаление столбцов
Если вам нужно удалить определенные столбцы из таблицы, вы можете использовать метод drop
.
Давайте предположим, что у нас есть таблица со студентами:
data = {'Имя': ['Анна', 'Борис', 'Виктор', 'Галина'],
'Возраст': [20, 22, 19, 21],
'Оценка': [85, 90, 75, 95]}
df = pd.DataFrame(data)
Если мы хотим удалить столбец с оценками из таблицы, мы можем использовать следующий код:
trimmed_df = df.drop('Оценка', axis=1)
В результате будет создана новая таблица без столбца 'Оценка'.
4. Обрезка по значениям столбца
Если вам нужно обрезать таблицу на основе значений определенного столбца, вы можете использовать метод isin
.
Давайте предположим, что у нас есть таблица со списком городов:
data = {'Город': ['Москва', 'Санкт-Петербург', 'Нью-Йорк', 'Париж'],
'Страна': ['Россия', 'Россия', 'США', 'Франция'],
'Население': [12.6, 5.4, 8.4, 2.2]}
df = pd.DataFrame(data)
Если мы хотим выбрать только города из России, мы можем использовать следующий код:
filtered_df = df[df['Страна'].isin(['Россия'])]
Результатом будет новая таблица, содержащая только строки, где страна является 'Россия'.
Заключение
В этой статье мы изучили различные способы обрезки таблицы в библиотеке pandas. Мы рассмотрели фильтрацию по условию, обрезку по индексу, удаление столбцов и обрезку по значениям столбца. Каждый из этих методов имеет свои особенности и может быть полезным в различных ситуациях. Ознакомьтесь с документацией по pandas для получения более подробных сведений и примеров.
Надеюсь, этот материал был полезен для вас!