Python to AI

Python - Pandas

최 수빈 2024. 11. 25. 13:15

 

 

Pandas;

Python에서 데이터를 쉽게 다룰 수 있게 해주는 데이터 분석 라이브러리

 

 

 

  • 데이터를 표(테이블) 형식으로 가공, 다양한 데이터 조작 기능 제공
  • 데이터를 정리하고 분석하는 데 강력한 도구

 

 

 

 

데이터프레임(DataFrame)

판다스의 핵심 자료 구조, 엑셀의 스프레드시트처럼 행(row)과 열(column)로 구성된 2차원 데이터 구조

 

시리즈(Series)

단일 열을 나타내는 1차원 데이터 구조, 데이터프레임의 구성 요소 중 하나. 

=> 판다스를 이용하면 데이터의 필터링, 정렬, 집계 등 다양한 작업을 간단한 코드로 수행가능

 

 

 

 

 

 

Pandas 활용 분야

 

  • 데이터 분석

방대한 양의 데이터를 효율적으로 처리, 분석

(통계 분석, 트렌드 파악, 데이터 시각화 등 다양한 작업에 사용)

  • 데이터 전처리

결측값 처리, 이상치 제거, 데이터 변환 등

  • 비즈니스 인텔리전스(BI)

기업에서 중요한 의사결정을 내리기 위해 데이터에서 인사이트를 도출하는 과정에서 사용

고객 데이터 분석, 판매 데이터 추적 등 분석 작업에 활용 

  • 금융 데이터 분석

금융 시장 데이터 분석, 투자 전략 수집

주식 가격 데이터, 경제 지표 등을 분석하는 데 강력

  • 연구 및 학술 분석

연구 데이터의 수집, 정리, 분석

사회과학, 생명과학 등 다양한 분야에서 데이터를 다루는 연구에 활용