huggingface 2

음성 생성과 번역을 활용한 데스크톱 번역기

PyQt5, Hugging Face Transformers, Eleven Labs API 활용영어 → 한국어 자동 번역번역된 텍스트 → 음성 변환변환된 음성 → 재생GUI 인터페이스 제공번역영어 문장을 입력하면 NLLB-200 모델로 한국어로 번역음성 생성번역된 문장을 Eleven Labs API로 음성(mp3)으로 변환음성 재생생성된 mp3 파일을 PyDub으로 재생GUI 구성PyQt5로 사용자 인터페이스 구성 (입력, 버튼, 출력 등) pip install requests PyQt5 pydub dotenv transformers torch torchaudio torchmedia  필요 라이브러리import osimport requestsfrom dotenv import load_dotenvfrom P..

사전 학습과 파인 튜닝

사전 학습 (Pre-training) 대규모 일반 텍스트 데이터로 언어의 패턴과 구조를 학습하는 과정 방대한 데이터셋 사용 (예: 위키백과, 북 코퍼스)특정 작업(X) 일반적인 언어 이해(O) 예:BERT 사전 학습MLM(Masked Lanuage Modeling): 일부 단어를 가리고 예측NSP (Next Sentence Prediction): 문장 간 자연스러운 연결 예측  파인 튜닝 (Fine-tuning) 사전 학습된 모델을 특정 작업(예: 감정 분석)에 맞게 추가 학습 특정 태스크에 맞춘 미세 조정적은 데이터로도 효과적사전 학습된 가중치를 기반으로 빠른 수렴 가능   IMDb 영화 리뷰 감정 분석*IMDb(Internet Movie Database)영화 리뷰를 바탕으로 만든 이진 감정 분석용 데..

728x90