🐼 Как сделать pandas dataframe? Простой гид для начинающих

Чтобы создать Pandas DataFrame, вы можете воспользоваться различными методами. Вот несколько примеров:


import pandas as pd

# Создать DataFrame из словаря
data = {'Name': ['John', 'Jane', 'Alice'],
        'Age': [25, 30, 35]}
df = pd.DataFrame(data)

# Создать DataFrame из списка списков
data = [['John', 25], ['Jane', 30], ['Alice', 35]]
df = pd.DataFrame(data, columns=['Name', 'Age'])

# Создать пустой DataFrame
df = pd.DataFrame()
    

Детальный ответ

Как сделать pandas dataframe

Добро пожаловать в эту подробную статью о том, как создать Pandas DataFrame. DataFrame - это одна из ключевых структур данных библиотеки Pandas, которая позволяет нам удобно работать с табличными данными. В этой статье мы разберем, как создать DataFrame из различных источников данных.

1. Создание DataFrame из списка

Самым простым способом создать DataFrame является использование списка. Мы можем передать список списков, где каждый внутренний список представляет строку таблицы. Давайте посмотрим на пример:


import pandas as pd

data = [['Alice', 25], ['Bob', 30], ['Charlie', 35]]
df = pd.DataFrame(data, columns=['Name', 'Age'])
print(df)
    

Результат:


       Name  Age
    0    Alice   25
    1      Bob   30
    2  Charlie   35
    

Как видите, мы создали DataFrame из списка `data` и установили имена столбцов при помощи параметра `columns`.

2. Создание DataFrame из словаря

Другим удобным способом создания DataFrame является использование словаря. Ключи словаря будут использованы в качестве названий столбцов, а значения словаря - в качестве данных столбцов. Посмотрим на пример:


import pandas as pd

data = {'Name': ['Alice', 'Bob', 'Charlie'], 'Age': [25, 30, 35]}
df = pd.DataFrame(data)
print(df)
    

Результат:


       Name  Age
    0    Alice   25
    1      Bob   30
    2  Charlie   35
    

Как видите, названия столбцов берутся из ключей словаря, а данные столбцов - из значений. DataFrame автоматически пронумеровывает строки.

3. Создание DataFrame из CSV-файла

Часто данные, с которыми мы хотим работать, хранятся в CSV-файлах. Pandas предоставляет возможность просто загрузить данные из CSV-файла в DataFrame. Давайте рассмотрим пример:


import pandas as pd

df = pd.read_csv('data.csv')  # Замените 'data.csv' на путь к вашему CSV-файлу
print(df)
    

В этом примере мы используем функцию `read_csv` из Pandas, чтобы загрузить данные из CSV-файла. Вы можете заменить `'data.csv'` на путь к вашему CSV-файлу. DataFrame будет создан на основе данных в CSV-файле.

4. Создание DataFrame из SQL-запроса

Если вы храните данные в базе данных, вы можете легко создать DataFrame, выполнив SQL-запрос. Для этого необходимо использовать библиотеку SQLAlchemy. Вот пример:


import pandas as pd
from sqlalchemy import create_engine

# Создаем подключение к вашей базе данных
engine = create_engine('postgresql://username:password@localhost/mydatabase')

# Выполняем SQL-запрос и создаем DataFrame
query = 'SELECT * FROM mytable'
df = pd.read_sql(query, engine)
print(df)
    

В этом примере мы создаем подключение к базе данных PostgreSQL с использованием SQLAlchemy. Затем мы выполняем SQL-запрос и создаем DataFrame на основе результатов.

В данной статье мы рассмотрели несколько способов создания Pandas DataFrame. Вы можете выбрать наиболее удобный для вас способ в зависимости от источника данных. Приятной работы с Pandas!

Видео по теме

Pandas Базовый №1. Создание DataFrame и запись в CSV

Основы Pandas Python | Series, DataFrame И Анализ Данных

Pandas Базовый №4. Операции со столбцами DataFrame

Похожие статьи:

Как безболезненно удалить строки с nan в pandas? 🔄✅

🐼 Как сделать pandas dataframe? Простой гид для начинающих