Stable Diffusion WebUI 로컬 설치 완전 가이드 - 무료 AI 이미지 생성
2026년 4월 기준 | AI 도구 비교
요약: Stable Diffusion을 내 컴퓨터에서 무료로 돌리는 방법을 A부터 Z까지 다룹니다. AUTOMATIC1111 WebUI와 ComfyUI 두 가지 방식을 비교하고, Windows/Mac 설치법, 모델 다운로드, 기본 사용법, 실전 프롬프트 팁까지 정리합니다. DALL-E 3나 Midjourney에 매달 돈 내는 게 아까운 분들을 위한 가이드입니다.
로컬 설치가 나은 이유
Midjourney는 월 $10~$60, DALL-E 3는 크레딧당 과금, Adobe Firefly도 유료 플랜이 필요합니다. 이미지를 많이 생성하면 비용이 꽤 빠르게 쌓입니다.
Stable Diffusion은 오픈소스입니다. 내 컴퓨터에 설치하면 이미지를 몇 장을 생성하든 추가 비용이 없습니다. 그리고 클라우드 서비스에서는 불가능한 것들이 가능합니다:
- NSFW 필터 없음: 어떤 이미지든 생성 가능 (윤리적 사용은 본인 판단)
- 커스텀 모델: 특정 스타일이나 캐릭터에 맞게 파인튜닝된 모델 사용 가능
- 완전한 제어: 해상도, 샘플링 방식, 시드 값 등 모든 파라미터 조절 가능
- 프라이버시: 이미지가 외부 서버로 전송되지 않음
단점은 GPU가 필요하다는 것과 초기 설정이 번거롭다는 점입니다. 이 가이드에서 그 번거로움을 최소화하겠습니다.
시스템 요구사항
| 항목 | 최소 | 권장 |
|---|---|---|
| GPU | NVIDIA GTX 1060 (6GB) | RTX 3060 (12GB) 이상 |
| RAM | 8GB | 16GB 이상 |
| 저장공간 | 20GB | 50GB+ (모델별 2~7GB) |
| OS | Windows 10/11, Linux | Windows 11, Ubuntu 22.04 |
AMD GPU 사용자: DirectML 백엔드를 사용하면 AMD GPU에서도 돌릴 수 있지만, NVIDIA 대비 속도가 30~50% 느립니다. Mac M시리즈 칩도 MPS 백엔드로 지원되지만 역시 속도 차이가 있습니다.
AUTOMATIC1111 WebUI 설치 (Windows)
가장 대중적인 WebUI인 AUTOMATIC1111을 설치합니다. 처음 접하는 분에게 가장 추천하는 방식입니다.
Step 1: Python 설치
# Python 3.10.x를 설치합니다 (3.11+는 호환성 문제 있음)
# python.org에서 3.10.11 다운로드
# 설치 시 "Add Python to PATH" 반드시 체크
# 설치 확인
python --version
# Python 3.10.11
Step 2: Git 설치
# git-scm.com에서 다운로드 후 설치
# 기본 설정 그대로 Next 클릭
git --version
# git version 2.44.0.windows.1
Step 3: WebUI 다운로드 및 실행
# 원하는 위치에서 클론
git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git
cd stable-diffusion-webui
# 첫 실행 (자동으로 의존성 설치, 10~20분 소요)
webui-user.bat
첫 실행 시 venv 생성, PyTorch 설치, 기본 모델 다운로드가 자동으로 진행됩니다. 완료되면 브라우저에서 http://127.0.0.1:7860으로 접속할 수 있습니다.
Step 4: VRAM 부족 시 설정
6GB VRAM이면 기본 설정으로는 OOM(Out of Memory)이 발생할 수 있습니다. webui-user.bat를 편집합니다:
@echo off
set COMMANDLINE_ARGS=--medvram --xformers
call webui.bat
--medvram: VRAM 사용량을 줄입니다 (4~6GB GPU용)--lowvram: 더 극단적으로 줄입니다 (4GB 미만 GPU용, 매우 느림)--xformers: 메모리 효율적인 attention 연산 (속도 + 메모리 둘 다 개선)
ComfyUI 설치
ComfyUI는 노드 기반 UI로, 복잡한 워크플로우를 시각적으로 구성할 수 있습니다. AUTOMATIC1111보다 빠르고 메모리 효율적이지만 학습 곡선이 있습니다.
# ComfyUI 설치
git clone https://github.com/comfyanonymous/ComfyUI.git
cd ComfyUI
# 가상환경 생성
python -m venv venv
venv\Scripts\activate
# PyTorch 설치 (CUDA 12.1 기준)
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121
# ComfyUI 의존성 설치
pip install -r requirements.txt
# 실행
python main.py
브라우저에서 http://127.0.0.1:8188로 접속합니다. 노드를 연결해서 워크플로우를 만드는 방식이라, 처음에는 복잡해 보이지만 익숙해지면 AUTOMATIC1111보다 유연합니다.
모델 다운로드 가이드
Stable Diffusion의 핵심은 모델(체크포인트)입니다. 어떤 모델을 쓰느냐에 따라 결과물이 완전히 달라집니다.
2026년 4월 기준 추천 모델:
| 모델 | 특징 | 용량 | 추천 용도 |
|---|---|---|---|
| SD XL Base | 공식 기본 모델, 1024x1024 | 6.9GB | 범용 |
| Juggernaut XL | 사실적 사진 특화 | 6.9GB | 실사 이미지 |
| DreamShaper XL | 예술적 스타일 강점 | 6.9GB | 일러스트, 판타지 |
| SD 3.5 Medium | 최신 아키텍처, 가벼움 | 4.7GB | 빠른 생성 |
모델은 Civitai나 Hugging Face에서 다운로드합니다. 다운로드한 .safetensors 파일을 아래 경로에 넣으면 됩니다:
# AUTOMATIC1111
stable-diffusion-webui/models/Stable-diffusion/
# ComfyUI
ComfyUI/models/checkpoints/
기본 사용법: txt2img
WebUI에 접속하면 txt2img 탭이 기본으로 열립니다. 핵심 설정을 하나씩 살펴봅시다.
Prompt (프롬프트): 생성할 이미지를 영어로 묘사합니다.
# 좋은 프롬프트 예시
a professional photograph of a cozy coffee shop interior,
warm lighting, wooden furniture, plants on shelves,
morning sunlight through windows, shallow depth of field,
high quality, 8k uhd, dslr
Negative Prompt (네거티브 프롬프트): 원하지 않는 요소를 명시합니다.
# 네거티브 프롬프트 기본 세트
blurry, low quality, distorted, deformed,
ugly, bad anatomy, watermark, text, logo
주요 파라미터:
- Sampling method: DPM++ 2M Karras가 가장 범용적. 고품질이 필요하면 DPM++ SDE Karras
- Sampling steps: 20~30이 적정. 높을수록 디테일이 좋지만 느림
- CFG Scale: 7~12. 프롬프트를 얼마나 엄격히 따를지. 높으면 과포화, 낮으면 자유분방
- Seed: -1이면 랜덤. 마음에 드는 이미지의 시드를 기록해두면 재현 가능
- Size: SDXL은 1024x1024가 기본. 비율을 바꾸려면 1024x768 등으로 조절
실전 프롬프트 작성법
프롬프트 작성에는 공식이 있습니다. 이 구조를 따르면 일관성 있는 결과를 얻을 수 있습니다.
프롬프트 공식:
[미디엄] + [주제] + [스타일/분위기] + [조명] + [품질 키워드]
미디엄 예시: photograph, oil painting, digital art, watercolor, 3d render, anime illustration
조명 예시: natural lighting, studio lighting, golden hour, neon glow, dramatic shadows
품질 키워드: masterpiece, best quality, highly detailed, 8k uhd, sharp focus
실전 예시 1: 사실적 풍경
professional landscape photograph of a misty mountain lake at dawn,
pine trees reflected in still water, fog rolling over peaks,
golden hour lighting, shot on Canon EOS R5, 85mm lens,
national geographic style, 8k uhd, highly detailed
실전 예시 2: 제품 사진
product photography of a modern wireless headphone,
matte black finish, floating on white background,
soft studio lighting, commercial advertisement style,
minimalist composition, high end product shot, 4k
실전 예시 3: 일러스트
digital illustration of a futuristic city skyline at night,
cyberpunk aesthetic, neon lights reflecting on wet streets,
flying vehicles, holographic advertisements,
artstation trending, concept art, vibrant colors
팁: 괄호 (keyword:1.3)로 가중치를 줄 수 있습니다. 숫자가 높을수록 해당 요소가 강조됩니다. 1.0이 기본, 1.5 이상은 과포화 위험이 있습니다.
AUTOMATIC1111 vs ComfyUI 비교
| 항목 | AUTOMATIC1111 | ComfyUI |
|---|---|---|
| UI 방식 | 전통적 폼 방식 | 노드 기반 그래프 |
| 학습 난이도 | 쉬움 | 중간~어려움 |
| 생성 속도 | 보통 | 10~30% 빠름 |
| VRAM 효율 | 보통 | 우수 |
| 확장성 | Extensions | Custom Nodes (더 유연) |
| 워크플로우 공유 | 설정 스크린샷 | JSON으로 완벽 재현 |
| 추천 대상 | 입문자 | 중급자 이상 |
입문자라면 AUTOMATIC1111로 시작하세요. 기본적인 이미지 생성을 익히고, ControlNet이나 img2img 같은 고급 기능이 필요해지면 ComfyUI로 넘어가는 게 자연스러운 경로입니다.
저는 처음에 AUTOMATIC1111을 3개월 쓰다가 ComfyUI로 넘어갔습니다. 워크플로우를 JSON으로 저장하고 공유할 수 있는 점이 결정적이었습니다. 팀에서 같은 워크플로우를 쓰려면 ComfyUI가 압도적으로 편합니다.
유료 서비스와 비교
| 항목 | Stable Diffusion (로컬) | Midjourney | DALL-E 3 |
|---|---|---|---|
| 비용 | 무료 (전기세만) | $10~$60/월 | 크레딧 과금 |
| 생성 제한 | 무제한 | 플랜별 제한 | 크레딧 소진 시 중단 |
| 프라이버시 | 완전 로컬 | 서버 업로드 | 서버 업로드 |
| 품질 (기본) | 모델에 따라 다름 | 높음 | 높음 |
| 사용 편의성 | 설정 필요 | 매우 쉬움 | 매우 쉬움 |
| 커스터마이징 | 무한 | 제한적 | 제한적 |
결론적으로:
- "빨리 예쁜 이미지 한 장만" → Midjourney나 DALL-E 3
- "많이 생성하고 세밀하게 제어" → Stable Diffusion 로컬
- "특정 스타일/브랜드에 맞는 이미지" → Stable Diffusion + 커스텀 모델
마무리
Stable Diffusion 로컬 설치는 처음에 번거롭지만, 한 번 세팅하면 그 자유도는 어떤 유료 서비스와도 비교할 수 없습니다. 특히 이미지를 대량으로 생성해야 하는 프로젝트(블로그 대표이미지, 프레젠테이션, 프로토타입 목업 등)에서 비용 절감 효과가 큽니다.
추천하는 시작 경로는 이렇습니다:
- AUTOMATIC1111 설치 + SDXL Base 모델로 기본 이미지 생성
- 프롬프트 작성법 연습 (위의 공식 활용)
- 필요에 맞는 커스텀 모델 탐색 (Civitai에서)
- 고급 기능이 필요하면 ComfyUI로 전환
GPU만 있으면 오늘 바로 시작할 수 있습니다.
관련 글 추천:
- 파이썬으로 AI 이미지 생성하기 - DALL-E 3 API 완전 가이드
- Ollama로 로컬 LLM 돌리기 - GPU 없이도 가능한 방법
- Hugging Face Transformers 입문 - 로컬에서 AI 모델 돌리기
'AI 도구 비교' 카테고리의 다른 글
| ChatGPT Plus vs Claude Pro vs Gemini Advanced - 월 2만원 진짜 값하는 건? (0) | 2026.04.22 |
|---|---|
| Claude Sonnet 4.6 vs GPT-5 vs Gemini 2.5 - 2026년 최신 LLM 전면 비교 (0) | 2026.04.20 |
| AI 코드 생성 도구 총정리 - Copilot, Cursor, Codeium, Claude Code 4종 비교 (0) | 2026.04.16 |
| Claude 3.5 vs GPT-4o 긴 문서 요약 능력 비교 - 논문 10편으로 실측 (0) | 2026.04.12 |
| Notion AI vs ChatGPT Plus - 업무 자동화 도구 승자는? (0) | 2026.04.11 |