Как преобразовать pandas dataframe в массив: Лучшие способы и советы
Чтобы преобразовать pandas датафрейм в массив, вы можете использовать метод values. Он возвращает массив значений из датафрейма.
import pandas as pd
df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]})
array = df.values
print(array)
Детальный ответ
Как преобразовать pandas dataframe в массив?
Преобразование pandas dataframe в массив может быть полезным, когда вы хотите работать с данными в других библиотеках или выполнять операции, не предусмотренные в pandas. В этой статье мы рассмотрим несколько способов выполнить это преобразование.
1. Использование метода values
Первый способ - использование метода values
для получения значений из dataframe в виде массива. Данный метод возвращает двумерный массив numpy, содержащий значения dataframe. Пример:
import pandas as pd
# Создаем dataframe
data = {'Name': ['John', 'Emily', 'Michael'],
'Age': [25, 30, 35],
'City': ['New York', 'Paris', 'London']}
df = pd.DataFrame(data)
# Преобразуем dataframe в массив
array = df.values
print(array)
Результат выполнения данного кода:
[['John' 25 'New York'] ['Emily' 30 'Paris'] ['Michael' 35 'London']]
2. Использование метода to_numpy
Второй способ - использование метода to_numpy
, доступного начиная с версии pandas 0.24. Этот метод возвращает массив numpy, содержащий значения dataframe. Пример:
import pandas as pd
# Создаем dataframe
data = {'Name': ['John', 'Emily', 'Michael'],
'Age': [25, 30, 35],
'City': ['New York', 'Paris', 'London']}
df = pd.DataFrame(data)
# Преобразуем dataframe в массив
array = df.to_numpy()
print(array)
Результат выполнения данного кода будет идентичным предыдущему примеру:
[['John' 25 'New York'] ['Emily' 30 'Paris'] ['Michael' 35 'London']]
3. Использование метода as_matrix
Метод as_matrix
ранее использовался для преобразования dataframe в массив, но начиная с версии pandas 0.23, данный метод считается устаревшим. Однако, он всё еще может быть использован в старых версиях pandas. Пример:
import pandas as pd
# Создаем dataframe
data = {'Name': ['John', 'Emily', 'Michael'],
'Age': [25, 30, 35],
'City': ['New York', 'Paris', 'London']}
df = pd.DataFrame(data)
# Преобразуем dataframe в массив
array = df.as_matrix()
print(array)
Важно отметить, что метод as_matrix
будет удален в будущих версиях pandas, поэтому рекомендуется использовать методы values
или to_numpy
.
4. Использование метода get_values (устаревший)
Раньше, для преобразования dataframe в массив также использовался метод get_values
. Но начиная с версии pandas 0.23, данный метод также считается устаревшим и будет удален. Вместо этого, предлагается использовать методы values
или to_numpy
. Пример использования метода get_values
:
import pandas as pd
# Создаем dataframe
data = {'Name': ['John', 'Emily', 'Michael'],
'Age': [25, 30, 35],
'City': ['New York', 'Paris', 'London']}
df = pd.DataFrame(data)
# Преобразуем dataframe в массив
array = df.get_values()
print(array)
Пожалуйста, обратите внимание, что данный метод рекомендуется не использовать, поскольку он считается устаревшим.
Заключение
В этой статье мы рассмотрели несколько способов преобразовать pandas dataframe в массив. Мы ознакомились с методами values
, to_numpy
, as_matrix
, и get_values
. Рекомендуется использовать методы values
или to_numpy
, так как as_matrix
и get_values
считаются устаревшими и будут удалены в будущих версиях pandas.
Надеюсь, данная информация была полезна. Успехов в работе с pandas dataframe!