Pandas;
Python에서 데이터를 쉽게 다룰 수 있게 해주는 데이터 분석 라이브러리
- 데이터를 표(테이블) 형식으로 가공, 다양한 데이터 조작 기능 제공
- 데이터를 정리하고 분석하는 데 강력한 도구
데이터프레임(DataFrame)
판다스의 핵심 자료 구조, 엑셀의 스프레드시트처럼 행(row)과 열(column)로 구성된 2차원 데이터 구조
시리즈(Series)
단일 열을 나타내는 1차원 데이터 구조, 데이터프레임의 구성 요소 중 하나.
=> 판다스를 이용하면 데이터의 필터링, 정렬, 집계 등 다양한 작업을 간단한 코드로 수행가능
Pandas 활용 분야
- 데이터 분석
방대한 양의 데이터를 효율적으로 처리, 분석
(통계 분석, 트렌드 파악, 데이터 시각화 등 다양한 작업에 사용)
- 데이터 전처리
결측값 처리, 이상치 제거, 데이터 변환 등
- 비즈니스 인텔리전스(BI)
기업에서 중요한 의사결정을 내리기 위해 데이터에서 인사이트를 도출하는 과정에서 사용
고객 데이터 분석, 판매 데이터 추적 등 분석 작업에 활용
- 금융 데이터 분석
금융 시장 데이터 분석, 투자 전략 수집
주식 가격 데이터, 경제 지표 등을 분석하는 데 강력
- 연구 및 학술 분석
연구 데이터의 수집, 정리, 분석
사회과학, 생명과학 등 다양한 분야에서 데이터를 다루는 연구에 활용
'Python to AI' 카테고리의 다른 글
Python - Pandas(Series/DataFrame) (0) | 2024.11.27 |
---|---|
Python - Pandas설치 및 Conda, Jupyter Notebook, 가상환경과 kernel (1) | 2024.11.26 |
MVT(Model-View-Template) design pattern에 기반을 둔 Django의 architecture (3) | 2024.11.15 |
Django (1) | 2024.11.15 |
Decorator, Context Manager (0) | 2024.11.14 |