2024/12 45

Python - Matplotlib 한글폰트 커스텀컨피그

Matplotlib의 기본 설정 폰트 Sans-serif에 한글이 포함돼있지 않아서 matplotlib뿐만 아니라 얘를 기반으로 하는 라이브러리들을 사용할 때 한글을 지원하는 폰트를 따로 지정해주지 않으면 깨져있는 네모네모를 보며 살아야된다. 뭔 데이터인지 알 수가 없다.근데 또 매번 폰트 지정해주기는 귀찮다. 그렇다고 데이터분석을 때려칠까. ? ㅇ제일 좋은 방법임. 하지만 하고는 싶은데 귀찮은 경우를 위해 (물론 코드 외워버리기, 체화하기, 구글링하기, 메모장에 코드 짱박아놓기, ChatGPT활용하기, 키보드에 단축키로 메크로 설정.. 등등 다양한 방법이 있지만 다 귀찮아서- 나는 이제껏.. 내 노트북 안쓰고 intel에서 제공해주는 컴퓨터 돌려서 걍 바탕화면에 코드조각 늘어놓고 썼다.......ㅋ지금..

Python to AI 2024.12.10

API

API(응용 프로그램 인터페이스, Application Programming Interface) 소프트웨어 간의 상호 작용을 가능하게 하는 도구, 정의 및 프로토콜의 집합  API는 서로 다른 소프트웨어 시스템이나 애플리케이션이 데이터를 교환하거나 기능을 사용할 수 있도록 하는 인터페이스 역할을 한다. API의 주요 개념인터페이스: API는 두 애플리케이션 간의 상호작용 방식을 정의함예) 클라이언트 애플리케이션이 서버의 데이터를 가져오는 방법을 명확히 규정명세 (Specification)요청(Request): 데이터를 요청할 때 필요한 메서드, 경로, 파라미터 등을 명시응답(Response): 요청에 대한 결과로 반환되는 데이터의 구조 정의엔드포인트(Endpoint)API가 제공하는 기능이나 데이터의 접..

OpenAI API 활용 2024.12.10

Python - Pandas(데이터 전처리 : isna(), isnull() )

데이터 전처리 - 결측치 탐지와 다양한 처리 방법  결측치(Missing Value) 탐지Pandas는 결측치를 쉽게 탐지하고 처리할 수 있는 다양한 기능 제공  isna(),  isnull()로 결측치 탐지 데이터프레임의 각 요소가 결측치인지 여부를 확인, 두 함수는 동일한 기능을 함=> 최신 코드에서는 isna()사용권장, 호환성을 유지해야하거나 기존 코드에서 사용중이라면 isnull()사용import pandas as pd#예시 데이터프레임 생성data = { '이름' : ['철수','영희','민수','지수'], '나이' : [25,30,None,35], '직업' : ['학생','회사원','학생',None]}df = pd.DataFrame(data)#결측치 여부 확인df.isna() df.info(..

Python to AI 2024.12.10

스칼라(scalar)

스칼라 크기만을 가진 단일 값수학과 물리학에서 기본적인 개념단일 숫자로 표현됨물리적 단위를 가질 수 있음(kg, ℃)주로 실수로 표현되지만, 복소수나 정수일 수도 있음길이, 질량, 온도, 시간 등데이터 분석과 머신러닝에서 개별 특성값이나 모델 파라미터로 자주 사용됨 스칼라 값이 활용되는 방식(스칼라 값을 모델이나 알고리즘에서 사용하는 방법)모델의 편향(bias) : 신경망에서 각 뉴런의 출력값에 더해지는 단일 숫자활성화 함수의 임계값 : 뉴런이 활성화되기 위한 기준값특성값 : 키(170cm)나 나이(30세) 같은 단일 데이터-> 단일 특성 분석 - 평균, 표준편차 등의 통계적 분석에 사용-> 모델 파라미터 최적화 - 머신러닝 모델의 가중치(weight)와 편향(bias)는 스칼라 값으로 표현됨 예 : 신..

Python - Pandas(데이터 변형 : 그룹화, 집계, 피벗테이블)

groupby()를 사용한 그룹화 - 데이터의 특정 열을 기준으로 그룹화 import pandas as pd#예시 데이터프레임 생성data = { '이름' : ['철수','영희','민수','지수','철수','영희'], '과목' : ['수학','수학','과학','과학','영어','영어'], '점수' : [90,85,95,80,75,88]}df = pd.DataFrame(data)#'이름'을 기준으로 그룹화grouped = df.groupby('이름') 집계 함수 사용하기 - 그룹화한 데이터에 대해 다양한 집계 함수(mean, sum, count 등)사용#각 학생의 평균 점수 계산mean_scores = grouped['점수'].mean()mean_scores여러 집계 함수들 동시에 사용#각..

Python to AI 2024.12.09

Python - Pandas(데이터 변형 : 정렬, 병합)

정렬 sort_values()를 사용한 값(Value) 기준 정렬 - 특정 열의 값을 기준으로 데이터 오름차순 또는 내림차순 정렬import pandas as pd#예시 데이터프레임 생성data = { '이름':['철수','영희','민수','지수'], '나이':[25,30,22,35], '직업':['학생','회사원','학생','프리랜서']}df = pd.DataFrame(data)#'나이'기준으로 오름차순 정렬sorted_df = df.sort_values(by='나이')sorted_df #'나이'기준으로 내림차순 정렬sorted_df_desc = df.sort_values(by='나이', ascending=False)sorted_df_desc sort_values()를 사용한 여러 열 ..

Python to AI 2024.12.09

Python - Pandas(feat.isin(), astype())

기본 조건부 필터링import pandas as pd#예시 데이터프레임 생성data = { '이름': ['철수', '영희', '민수', '지수'], '나이': [25, 30, 22, 35], '직업': ['학생', '회사원', '학생', '프리랜서'] }df = pd.DataFrame(data)#나이가 25 이상인 행만 선택filtered_df = df[df['나이'] >= 25]filtered_df  여러 조건을 사용한 필터링(And(&), OR(|))#여러 조건을 사용한 필터릴 AMd(&), OR(|)#나이가 25이상이고, 직업이 '학생'인 행만 선택filtered_df = df[(df['나이'] >= 25) & (df['직업'] == '학생')]filtered_df..

Python to AI 2024.12.08

Sasha Alex Sloan - Older

Sasha Alex Sloan - Older 나는 아직도 그들처럼 되지 않으려 노력해요. '그거, 니 얼굴에 침 뱉기야.'라고 손가락질한다면 어쩔 수 없어요. 변하지 못할 것 같아요. 아주 어릴때는 이해할 수 없어서 이해하지 않았어요. 지금은 많이 이해할 수 있어요. 공감하지 않을 뿐입니다.사랑은 어렵지만 당신이 말하는 사랑이 진실되었다면 당신들의 행동은 실수가 아니라는 걸 알아요. 내가 생각하는 사랑과 당신들이 말하는 사랑이 다르다는 것을 알아요. 사랑하는 방식이 다를 수 있다는 것을 알아요. 또 이것이 어떤 관계에 국한된 이야기가 아니라는 것을 알아요. 사랑이라면, 설령 나와 방식이 다르더라도, 내가 원하는 사랑이 아니더라도, 사랑을 느낄 수 있다는 것을 알아요. 내가 생각하는 사랑을 주지 못한 사람..

break; 2024.12.07

Python - Pandas(feat. titanic.csv)

URL에서 CSV파일을 불러오고, data를 탐색해보자 ! import pandas as pdurl = 'https://raw.githubusercontent.com/datasciencedojo/datasets/master/titanic.csv'#CSV파일 불러오기df = pd.read_csv(url)#상위 5개 행 미리보기df.head()  #상위 10개 행 미리보기df.head(10)  #하위 데이터 미리보기, 기본값(5개 행)df.tail()  #하위 3개 행 미리보기df.tail(3) 데이터프레임 기본 정보 확인#info()함수 데이터프레임 전체 구조 각 열의 데이터 타입과 null값 여부 확인df.info()#describe() 주요 통계 정보 확인, 숫자형 데이터에 대한 주요 통계 정보 제공d..

Python to AI 2024.12.05

Python - Pandas(feat. CSV, JSON, XLSX, sqlite3)

다양한 형식에서 데이터 불러오기import pandas as pd#CSV 파일 불러오기df_csv = pd.read_csv('data.csv')print(df_csv.head())"""sep: 구분자 지정, 기본값(,)header: 헤더 행 지정, 기본값은 첫번째 행(0)"""#데이터가 탭으로 구분되어 있을 경우df_csv = pd.read_csv('data.csv', sep = '\\t')#URL에서 CSV파일 불러오기url = ''df_csv_url = pd.read_csv(url)print(df_csv_url.head())#Excel파일 불러오기df_excel = pd.read_excel('data.xlsx')print(df_excel.head())"""sheet_name: 읽고자 하는 시트 이름 ..

Python to AI 2024.12.04
728x90