Generative AI 3

Stable Diffusion을 활용한 이미지 생성

Stable Diffusion 텍스트 설명을 입력하면 이미지를 생성하는 인공지능 모델(Text-to-Image) 입력 : 자연어 텍스트 (prompt)출력: 고해상도 이미지 (512x512 이상 가능)라이선스: 오픈소스(MIT 기반), 누구나 사용 가능학습 데이터: LAION-5B라는 대규모 텍스트-이미지 페어 데이터셋  작동 방식노이즈 이미지를 준비텍스트를 보고 어떤 이미지를 원하는지 파악노이즈를 점점 제거하면서 이미지를 만들어냄→ 이 과정을 Diffusion(확산)과정이라고 부름  stable diffusion 모델 설치pip install diffusers transformers torch 이미지 생성from diffusers import StableDiffusionPipelineimport tor..

생성형 모델의 기본 원리 - 랜덤성(Randomness)과 조건성(Conditionality)

랜덤성(Randomness)과 조건성(Conditionality) 랜덤성(Randomness) 같은 입력에도 다양한 출력을 생성하게 만드는 요소 생성형 모델은 확률 분포(probability distribution)에 따라 출력을 선택함→ 텍스트 생성에서, 다음 단어를 예측할 때 여러 후보 중에서 확률적으로 선택 랜덤성 조절 (예: GPT-3)import openaiopenai.api_key = 'api-key'response = openai.Completion.create( engine="text-davinci-003", prompt="Once upon a time, there was a friendly robot who", max_tokens=50, temperature=0.7 ..

생성형 AI(Generative AI)

생성형 AI(Generative AI) 입력을 바탕으로 새로운 결과물을 만들어내는 AI텍스트 생성 모델몇 개의 단어를 입력하면 자연스러운 문장을 이어 생성GPT-3, ChatGPT 등이미지 생성 모델텍스트나 스케치를 바탕으로 이미지 생성DALL·E, Stable Diffusion 등음악 생성 모델멜로디 입력에 따라 음악을 작곡Magenta 등창의적인 작업을 도와주며, 예술·콘텐츠·디자인 등 다양한 분야에 활용되고 있음  생성형 AI 개발의 어려움  대규모 데이터와 연산 자원 수십억 개의 파라미터를 학습하는 딥러닝 기반 모델이기 때문에 방대한 데이터와 고성능 GPT/TPU가 필요함 텍스트 생성: 수십~수백GB 이상의 문서 데이터이미지 생성: 이미지와 그 설명이 함께 포함된 수십만~수백만 개의 데이터셋→ 개..

728x90