Pandas
З Вікіпедії, вільної енциклопедії
pandas — програмна бібліотека, написана для мови програмування Python для маніпулювання даними та їхнього аналізу. Вона, зокрема, пропонує структури даних та операції для маніпулювання чисельними таблицями та часовими рядами. pandas є вільним програмним забезпеченням, що випускається за трипунктовою ліцензією BSD[4]. Ця назва походить від терміна «панельні дані[en]» (англ. panel data), який в економетрії позначає багатовимірні структуровані набори даних.
![]() | |
![]() | |
Тип | бібліотека Pythond і numerical softwared |
---|---|
Автор | Вес Маккінніd[1] |
Розробники | Спільнота |
Стабільний випуск | 0.23.4[2] (3 серпня, 2018 ) |
Операційна система | Багатоплатформова |
Мова програмування | Python[3] |
Ліцензія | Ліцензія BSD |
Онлайн-документація | pandas.pydata.org/docs/user_guide/index.html#user-guide |
Репозиторій | github.com/pandas-dev/pandas |
Вебсайт | pandas.pydata.org |
Можливості бібліотеки
- Об'єкт DataFrame із вбудованим індексуванням для маніпулювання даними.
- Інструменти для зчитування та записування даних між структурами даних у пам'яті та різними форматами файлів.
- Вирівнювання даних та вбудована підтримка пропущених даних.
- Переформатовування для отримання зведених наборів даних.
- Отримання зрізів за мітками, індексування з розширеними можливостями[5] та отримання піднаборів з великих наборів даних.
- Вставляння та вилучення стовпчиків у структурах даних.
- Рушій групування, що дозволяє робити з наборами даних операції розділення-зміни-об'єднання (англ. split-apply-combine).
- Злиття та з'єднання наборів даних.
- Ієрархічне індексування осей для роботи з даними високої вимірності в структурі даних нижчої вимірності.
- Функціональність для часових рядів: породження діапазонів дат та перетворення частоти, статистики рухливого вікна, лінійні регресії рухливого вікна, зсування дат та запізнювання.
Цю бібліотеку сильно оптимізовано за продуктивністю, критичні ланцюжки коду написано мовами Cython та C.[6]
DataFrames
Узагальнити
Перспектива
![]() |
![]() | Цей розділ є сирим перекладом з англійської мови. Можливо, він створений за допомогою машинного перекладу або перекладачем, який недостатньо володіє обома мовами. (вересень 2021) |
Pandas в основному використовується для аналізу даних. Pandas дозволяє імпортувати дані з різних форматів файлів, таких як значення, розділені комами, JSON, SQL, Microsoft Excel. Pandas дозволяє здійснювати різні операції з обробкою даних, такі як об'єднання, зміна форми, вибір, а також очищення даних та функції перегляду даних.[7] reshaping,[8]
Індексування DataFrames
Існує кілька способів індексування Pandas DataFrames. Один із найпростіших способів зробити це за допомогою позначення у квадратних дужках.
У наведеному нижче прикладі можна використати квадратні дужки для вибору одного стовпця автомобільної рамки даних. Ви можете використовувати як одну, так і подвійну дужку. Одинарна дужка виводить серію Pandas, тоді як подвійна дужка виводить Pandas DataFrame. [9]
# Import pandas and cars.csv import pandas as pd cars = pd.read_csv('cars.csv', index_col = 0) # Print out country column as Pandas Series print(cars['cars_per_cap']) # Print out country column as Pandas DataFrame print(cars[['cars_per_cap']]) # Print out DataFrame with country and drives_right columns print(cars[['cars_per_cap', 'country']])
Історія
Розробник Вес Маккінні[en] почав працювати над pandas 2008 року, коли був у AQR Capital Management[en], через потребу у високопродуктивному, гнучкому інструменті для здійснення кількісного аналізу фінансових даних. Перед тим, як покинути AQR, він зміг переконати керівництво дозволити йому віддати цю бібліотеку у відкритий доступ.
Інший співробітник AQR, Чан Ше (англ. Chang She), приєднався до цих зусиль 2012 року як другий з основних за внеском до цієї бібліотеки.
Див. також
Примітки
Посилання
Wikiwand - on
Seamless Wikipedia browsing. On steroids.