Loading AI tools
программная библиотека Из Википедии, свободной энциклопедии
pandas — программная библиотека на языке Python для обработки и анализа данных. Работа pandas с данными строится поверх библиотеки NumPy, являющейся инструментом более низкого уровня. Предоставляет специальные структуры данных и операции для манипулирования числовыми таблицами и временны́ми рядами. Название библиотеки происходит от эконометрического термина «панельные данные», используемого для описания многомерных структурированных наборов информации. pandas распространяется под новой лицензией BSD.
Pandas | |||
---|---|---|---|
Тип | Python-библиотека[вд] и программа для численного анализа[вд] | ||
Автор | Уэс Мак-Кинни[вд][1] | ||
Разработчики | Уэс Мак-Кинни[вд], Брок Мендель[вд], Йорис Ван ден Босше[вд] и Джефф Ребек[вд][2] | ||
Написана на | Python | ||
Операционная система | кроссплатформенность | ||
Первый выпуск | 11 января 2008 | ||
Последняя версия |
|
||
Репозиторий | github.com/pandas-dev/pa… | ||
| |||
| |||
Лицензия | BSD | ||
Сайт | pandas.pydata.org (англ.) | ||
Медиафайлы на Викискладе |
Основная область применения — обеспечение работы в рамках среды Python не только для сбора и очистки данных, но для задач анализа и моделирования данных, без переключения на более специфичные для статобработки языки (такие, как R и Octave).
Также активно ведётся работа по реализации «родных» категориальных типов данных.
Пакет прежде всего предназначен для очистки и первичной оценки данных по общим показателям, например среднему значению, квантилям и так далее; статистическим пакетом[англ.] он в полном смысле не является, однако наборы данных типов DataFrame и Series применяются в качестве входных в большинстве модулей анализа данных и машинного обучения (SciPy, Scikit-Learn[англ.] и других).
Основные возможности библиотеки:
Библиотека оптимизирована для высокой производительности, наиболее важные части кода написаны на Cython и Си.
Разработка пакета начата в 2008 году сотрудником AQR Capital Management[англ.] Уэсом Маккини (англ. Wes McKinney). Перед уходом из AQR ему удалось убедить руководство позволить опубликовать исходный код библиотеки под свободной лицензией.
Другой работник AQR — Чан Шэ — присоединился к проекту в 2012 году, став вторым главным разработчиком библиотеки. Примерно в то же время библиотека набрала популярность в среде Python-разработчиков, и к проекту присоединилось множество новых участников.[5]
Кривые
import pandas as pd
import matplotlib.pyplot as plt
import numpy as np
df = pd.DataFrame(np.random.randn(100, 5), columns=list('ABCDE'))
df=df.cumsum() # Return cumulative sum over a DataFrame or Series axis
df.plot()
plt.show()
Диаграмма
df = pd.DataFrame(np.random.rand(10, 5), columns=list('ABCDE'))
df.plot.bar(stacked=True)
plt.show()
График
df = pd.DataFrame(np.random.rand(7, 5), columns=list('ABCDE'))
df.plot.box()
plt.show()
Гистограмма
data = pd.Series(np.random.normal(size=100))
data.hist(grid=False)
plt.show()
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.