본문 바로가기

파이썬/판다스(Pandas)

[파이썬 라이브러리]판다스 장점 및 Series와 DataFrame의 정의

Numpy는 기계 친화적인 라이브러리

파이썬 판다스: 데이터 분석의 필수 도구

판다스의 장점

판다스는 파이썬에서 데이터 처리 및 분석을 위한 강력한 라이브러리입니다. 그 중에서도 주요 장점은 다음과 같다:

  • 데이터 구조의 유연성
  • 높은 성능과 속도
  • 다양한 데이터 포맷 지원 (CSV, Excel, SQL 등)
  • 편리한 데이터 조작 및 처리 기능
  • 시각화 및 통계 분석 기능 제공

Series와 DataFrame

판다스에서 가장 중요한 데이터 구조는 Series와 DataFrame이다

Series

Series는 1차원 배열 형태의 데이터 구조로, 인덱스와 값의 쌍으로 이루어져 있습니다. 간단한 시계열 데이터나 단일 열의 데이터를 다룰 때 사용된다.

DataFrame

DataFrame은 2차원 테이블 형태의 데이터 구조로, 여러 개의 Series를 모아서 만든다. 행과 열의 인덱스를 가지며, 열은 각각의 특성을 나타내고 행은 각각의 데이터를 나타낸다. 데이터베이스나 엑셀 시트와 유사한 형태이다.