본문 바로가기

설치가이드,Installation Guide

cumfyui로 나노 바나나 처럼 편집해보자 flux kontext(모델 가이드 포함)

본문 대표 썸네일 이미지

안녕하세요.

오늘의 글은 구글의 나노바나나랑 비슷한 역할을 하는

flux kontext에 대해서 써볼까 합니다.


 FLUX 모델 종류 요약

모델 이름특징 요약

Flux.1 Dev 공개 모델, sd모델에 비해 좀 무거운 경향이있습니다.
Flux.1 Schnell 빠른 생성용 모델 (속도↑ 품질△)
Flux Kontext Dev  편집 가능, 구조적 변경에 강함

 

현재 공개된 버전은 pro, max 등 몇 가지 버전을 제외한 위의 3가지 정도가 됩니다. 

flux.1 dev가 이미지fx,미드저니처럼 그림을 그리는 모델이라면

Flux Kontext Dev는 나노바나나 처럼 그림이나 사진을 편집하는 모델이라고 생각하시면 됩니다.

아까 글을 다 썼는데 테스트하다가 컴퓨터가 멈추는 바람에 다시 쓰게 되어 좀 허무하긴 하네요.


-공개된 모델들 다운로드 경로입니다-

버전 특징 속도 VRAM 용량

safetensors 정식 고품질 모델 보통 높음 23GB
fp8 경량화, 빠름 빠름 중간 11~12GB
gguf (q4) 양자화, 메모리 절약 느림 낮음 4GB 이하

참고로 flux.1 dev를 쓰고 계신 분들이면 베이스 모델만 받으시면 됩니다.

Flux Kontext Dev 공개모델(23기가) 그리고 vae파일이 같이 있습니다.

CUMFYUI의 FLUX 베이스 모델 노드
safetensors파일인 경우 확산모델로드로 로드합니다.

ComfyUI\models\unet 폴더에 넣어줍니다.

● flux1-kontext-dev.safetensors 

ComfyUI\models\vae 폴더에 넣어줍니다.

ae.safetensors

ComfyUI\models\vae

https://huggingface.co/black-forest-labs/FLUX.1-Kontext-dev/tree/main

 

ComfyUI\models\unet 폴더에 넣어줍니다.

Flux Kontext Dev fp8(반정도로 줄여놓은 버전)

https://huggingface.co/6chan/flux1-kontext-dev-fp8/tree/main

 

양자화(gguf)

CUMFYUI의 FLUX 베이스 양자화 모델 노드
gguf양자화 버전은 gguf unet로더를 이용해 다음 노드와 연결합니다.

 

양자화 모델은 vram절약을 위해 만들어진 버전입니다.

추론을 위해서 압축이 되어있어서 vram절약은 되나, 속도가 다소 늦어질 수도 있습니다.

사용해 보시고 품질, 속도 알맞은 걸 고르시길 바랍니다.

ComfyUI\models\diffusion_models 폴더에 넣어줍니다.

https://huggingface.co/QuantStack/FLUX.1-Kontext-dev-GGUF/tree/main

 

나머지 모델들은 flux 1.dev 랑 같습니다.

ComfyUI\models\clip 폴더에 넣어줍니다.

● t5xxl_fp8_e4m3fn.safetensors
● clip_l.safetensors

https://huggingface.co/comfyanonymous/flux_text_encoders/tree/main

CUMFYUI의 KONTEXT 사용중인 워크플로
노드 구성입니다.

 

보라색으로 되어있는 부분은 지금 사용하지 않는 노드를

지나치기 위해 컨트롤+b로 닫아둔 상태입니다.

로라와 업스케일링 부분인데요 자신이 업스케일이나 로라가

필요하신 분은 저부분에 노드를 넣으셔서 연결해 주시면 됩니다.

테스트 해본 이미지테스트 한 이미지의 결과

(피규어 형태 변환 예시)

프롬프트:

The photo shows a bear character smiling while drowning in water. The bear character in this photo is made into a detailed figurine and placed on a table.

 

테스트 이미지테스트한 이미지의 결과

(있는그대로 다른곳에 있는 편집)

프롬프트:

The photo shows a smiling bear character drowning in water. Please draw a picture of the bear character in this photo, maintaining its features while also showing it in a hotel pool with children.

 

이렇게 변화를 가져옵니다.

프롬프트는 그냥 번역기를 이용해서 적어서 대충 느낌이지만요.

 

 **프롬프트 구성 팁**

- "The photo shows..."로 시작하는 프롬프트는 기존 사진 기반 편집에 효과적입니다.
- 배경 변경 시 "in a hotel pool", "on a white desk"처럼 명확한 장소와 물체를 지정하면 좋습니다.
- **사실적 묘사**: "realistic", "photo-like" 등을 활용하면 디테일을 살릴 수 있습니다.
- **구체적 묘사**: "figurine made of plastic, glossy surface" 같은 상세 표현도 추천됩니다.

 

gpt나 제미나이 등 ai모델들에게 써달라고 하면 더욱 자연스럽고

풍부하게 프롬프트를 쓰실 수 있습니다.

 

앞으로의 그림은 프롬프트 잘쓰는 사람과 상상력이나 아이디어가

좋은 사람들 위주로 많이 변할것 같은 느낌입니다.

 

CUMFYUI의 티케시,세이지어텐션 노드 이미지

★참고로 티케시세이지어텐션은 이미지를 빨리 그리는 용도로 사용하는 기술입니다.

사용 안 하셔도 무방하나 좀 더 빠른 이미지 출력을 원하실 땐 사용하시는 게 좋을 것 같네요.

품질은 떨어질 수도 있으니 넉넉한 vram을 소유하고 계시면 테스트해서 닫아놓고 사용하셔도 무방합니다.