Python to AI

Python - Pandas(feat. CSV, JSON, XLSX, sqlite3)

최 수빈 2024. 12. 4. 12:40

 

다양한 형식에서 데이터 불러오기

import pandas as pd

#CSV 파일 불러오기
df_csv = pd.read_csv('data.csv')

print(df_csv.head())

"""
sep: 구분자 지정, 기본값(,)
header: 헤더 행 지정, 기본값은 첫번째 행(0)

"""

#데이터가 탭으로 구분되어 있을 경우
df_csv = pd.read_csv('data.csv', sep = '\\t')

#URL에서 CSV파일 불러오기
url = '<https://example.com/data.csv>'
df_csv_url = pd.read_csv(url)

print(df_csv_url.head())
#Excel파일 불러오기
df_excel = pd.read_excel('data.xlsx')

print(df_excel.head())

"""
sheet_name: 읽고자 하는 시트 이름 또는 번호 지정, 기본값은 첫번째 시트(0)
header: 헤더 행 지정, 기본값은 첫번째 행(0)

"""

df_excel = pd.read_excel('data.xlsx', sheet_name = 'Sheet2'

#URL에서 Excel파일 불러오기
url = '<https://example.com/data.xlsx>'
df_excel_url = pd.read_excel(url)

print(df_excel_url.head())
#JSON파일 불러오기
df_json = pd.read_json('data.json')

print(df_json.head())

#orient: JSON데이터 형식 지정, 기본값 columns

#URL에서 JSON파일 불러오기
url = '<https://example.com/data.json>'
df_json_url = pd.read_json(url)

print(df_json_url.head())

 

 

데이터 저장

#CSV파일로 저장

#예시 데이터 프레임 생성
df = pd.DataFrame({
    '이름' : ['철수', '영희', '민수'],
    '나이' : [25, 30, 35],
    '직업' : ['학생', '회사원', '프리랜서']
})

#CSV파일로 저장
df.to_csv('data_csv', index=False)

"""
index=False: 인덱스를 제외하고 저장
sep: 구분자 지정, 기본값(,)

URL경로가 아닌, 로컬 파일 시스템에 저장하는 방법. URL 지정할 수 없음

"""
#Excel파일로 저장하기
df.to_excel('data.xlsx', index=False)

"""
sheet_name: 저장할 시트 이름 지정, 기본값(Sheet1)
불러올 때 기본값: sheet_name=0 → 첫 번째 시트
저장할 때 기본값: sheet_name='Sheet1' → 기본 시트 이름

index=False: 인덱스 제외하고 저장

"""
JSON파일로 저장하기
df.to_json('data.json')

#oriend: JSON형식 지정, 기본값 columns(records, index등 다양한 형식으로 저장 가능)

#레코드 형식으로 저장하기
df.to_json('data_records.json', orient = 'records')
#SQL데이터베이스에 저장하기
import sqlite3

#SQLite 데이터베이스 연결
conn = sqlite3.connect('database.db')

#데이터프레임을 SQL테이블로 저장하기
df.to_sql('table_name', conn, if_exists='replace', index=False)

#연결 종료
conn.close()

"""
name: 저장할 테이블 이름 지정
conn: 데이터베이스 연결 객체 지정 (con, conn..등등 원하는 이름ㄱ 보통 conn)
if_exists: 테이블이 이미 존재할 경우 동작 지정(replace, append, fail중 선택)
index=False: 인덱스를 제외하고 저장

"""

'Python to AI' 카테고리의 다른 글

Python - Pandas(feat.isin(), astype())  (0) 2024.12.08
Python - Pandas(feat. titanic.csv)  (0) 2024.12.05
Python - NumPy(feat. Broadcasting)  (1) 2024.12.02
Python - NumPy  (3) 2024.11.29
Python - Pandas(Series/DataFrame)  (0) 2024.11.27