다양한 형식에서 데이터 불러오기
import pandas as pd
#CSV 파일 불러오기
df_csv = pd.read_csv('data.csv')
print(df_csv.head())
"""
sep: 구분자 지정, 기본값(,)
header: 헤더 행 지정, 기본값은 첫번째 행(0)
"""
#데이터가 탭으로 구분되어 있을 경우
df_csv = pd.read_csv('data.csv', sep = '\\t')
#URL에서 CSV파일 불러오기
url = '<https://example.com/data.csv>'
df_csv_url = pd.read_csv(url)
print(df_csv_url.head())
#Excel파일 불러오기
df_excel = pd.read_excel('data.xlsx')
print(df_excel.head())
"""
sheet_name: 읽고자 하는 시트 이름 또는 번호 지정, 기본값은 첫번째 시트(0)
header: 헤더 행 지정, 기본값은 첫번째 행(0)
"""
df_excel = pd.read_excel('data.xlsx', sheet_name = 'Sheet2'
#URL에서 Excel파일 불러오기
url = '<https://example.com/data.xlsx>'
df_excel_url = pd.read_excel(url)
print(df_excel_url.head())
#JSON파일 불러오기
df_json = pd.read_json('data.json')
print(df_json.head())
#orient: JSON데이터 형식 지정, 기본값 columns
#URL에서 JSON파일 불러오기
url = '<https://example.com/data.json>'
df_json_url = pd.read_json(url)
print(df_json_url.head())
데이터 저장
#CSV파일로 저장
#예시 데이터 프레임 생성
df = pd.DataFrame({
'이름' : ['철수', '영희', '민수'],
'나이' : [25, 30, 35],
'직업' : ['학생', '회사원', '프리랜서']
})
#CSV파일로 저장
df.to_csv('data_csv', index=False)
"""
index=False: 인덱스를 제외하고 저장
sep: 구분자 지정, 기본값(,)
URL경로가 아닌, 로컬 파일 시스템에 저장하는 방법. URL 지정할 수 없음
"""
#Excel파일로 저장하기
df.to_excel('data.xlsx', index=False)
"""
sheet_name: 저장할 시트 이름 지정, 기본값(Sheet1)
불러올 때 기본값: sheet_name=0 → 첫 번째 시트
저장할 때 기본값: sheet_name='Sheet1' → 기본 시트 이름
index=False: 인덱스 제외하고 저장
"""
JSON파일로 저장하기
df.to_json('data.json')
#oriend: JSON형식 지정, 기본값 columns(records, index등 다양한 형식으로 저장 가능)
#레코드 형식으로 저장하기
df.to_json('data_records.json', orient = 'records')
#SQL데이터베이스에 저장하기
import sqlite3
#SQLite 데이터베이스 연결
conn = sqlite3.connect('database.db')
#데이터프레임을 SQL테이블로 저장하기
df.to_sql('table_name', conn, if_exists='replace', index=False)
#연결 종료
conn.close()
"""
name: 저장할 테이블 이름 지정
conn: 데이터베이스 연결 객체 지정 (con, conn..등등 원하는 이름ㄱ 보통 conn)
if_exists: 테이블이 이미 존재할 경우 동작 지정(replace, append, fail중 선택)
index=False: 인덱스를 제외하고 저장
"""
'Python to AI' 카테고리의 다른 글
Python - Pandas(feat.isin(), astype()) (0) | 2024.12.08 |
---|---|
Python - Pandas(feat. titanic.csv) (0) | 2024.12.05 |
Python - NumPy(feat. Broadcasting) (1) | 2024.12.02 |
Python - NumPy (3) | 2024.11.29 |
Python - Pandas(Series/DataFrame) (0) | 2024.11.27 |