본문 바로가기

그림생성,Image Creation,Gallery

요즘 유행하는 피규어 생성 AI, 구글 나노 바나나 vs 델3 vs Flux 비교

 

게시물의 대표 썸네일 이미지

안녕하세요. 오늘의 글은 최근 유행하는 나노 바나나에 대해서 써보고 느낌을 flux로 옮겨 볼까 합니다.
일단  최근 유행하는 나노 바나나의 정체가 궁금하실 것 같은데요.

나노 바나나(Nano Banana)란?

**"나노 바나나"**는 구글의 첨단 이미지 생성 및 편집 AI 모델의 별명이에요.
정식 명칭은 Gemini 2.5 Flash Image이며, Google DeepMind와 Gemini 앱 내에서 제공되는 최신 이미지 AI입니다.

 

혁신 포인트
  • 거의 즉시 반응하는 속도로 이미지 편집하거나 생성 가능
  • 디테일 유지력 뛰어나서, 여러 번 수정해도 캐릭터나 장면 일관성이 살아있음
  • 이미지 합성이나 스타일 변경도 자연스럽고 고퀄 표현

요즘 제미나이 앱에 상당수의 인원이 유입되었다고 하는데 예전 지브리 스튜디오 스타일이 유행했다면
최근엔 나노 바나나를 이용한 피규어 만들기가 유행을 타고 있어서 그런가 봅니다.

 

나노 바나나 (구글의 Gemini 2.5 Flash Image 모델을 부르는 별명)와,
gpt(델모델)과 로컬 flux를 비교해 볼까 합니다.
 

나노 바나나 이용방법

우선 나노 바나나를 이용하기 위해선

구글의 https://aistudio.google.com/
접속해 줍니다.

구글의 나노 바나나 접속 방법 이미지

아직 베타기간이라 사용하는데 제약이 있습니다. 하루 이미지 100장(변경가능) 정도 
동영상 생성 veo2에 비하면 괜찮은 편입니다.
동영상 같은 경우 오류도 잘나고 생성 시 제약도 많으니까요
아래처럼 화면이 나오면 트라이 나노 바나나를 눌러 이미지를 선택해 줍니다.

나노 바나나 사용 설정 이미지

+ 버튼을 눌러 업로드 이미지를 선택해 줍니다.

 

나노 바나나 사용 설정 이미지와 프롬프트

그 후에 프롬프트 작성을 해주는데요.
구글은 아시다시피 영어뿐만이 아니라 한글도 프롬프트 입력이 가능합니다.
이미지 fx나 다른 생성 관련 앱을 실행했을 때도 마찬가지입니다.
다만 한글보다는 영어 인식이 좋아서
프롬프트 구성을 영어로 하시면 더 잘 먹히겠죠.
일단 전 한글로 써봤습니다.

나노 바나나 사용한 결과 이미지
나노 바나나를 이용한 피규어

 

대충 프롬프트 작성을 했는데도 생각보다
잘 나왔습니다.
그런데 이게 gpt는 안될까요? 당연히 가능합니다.
나노바나나를 쓰는 이유는 최신 기술로 세밀하고  캐릭터의 일관성유지가 좋기 때문에 사람들이 많이들 사용합니다.
특히 gpt 무료 생성과 다르게 구글은 하루 사용량이 많기 때문에 제약에 따른 이용도도 증가 하는것 같습니다.
 
그럼 gpt를 한번 봐볼게요. 지피티는 너무 유명해서 사용방법이라고 딱히 없는 것 같네요.
사진 올리고 대화만 하면 됩니다.

GPT를 이용한 결과 이미지
gpt를 이용한 피규어

 

gpt 같은 경우 오픈 ai에서 쓰이는 델 3이라는 모델을 사용합니다.
그쪽으로 프롬프트를 넘기게 되면 생성해서 가져다주는 개념이죠.
Gemini 2.5 Flash Image 비교했을 시 어떤 느낌인가요?
물론 프롬프트에 의해 세밀함과 디자인이 변경되기도 합니다.

 

항목 나노 바나나 델 3 Flux

스타일 애니풍 + 피규어 질감 혼합 그림 느낌 강함, 패키징 약함 진짜 제품 사진처럼 보이는 수준
박스 표현 단순 / 일부 포함 거의 없음 완전 실사 느낌 박스 가능
표정/포즈 제어 큼직한 감정 표현 제한적, 종종 왜곡 매우 정밀 제어 가능
배경 구성 귀엽고 캐주얼한 스타일 배경과 잘 분리 안 됨 모니터/책상 등 실사 연출 강함
완성도 높음 (자동 구성 강점) 텍스트만으론 한계 있음 커스터마이징 최강, 하지만 손이 많이 감

 

제 친구인 gpt는 이렇게 나눠서 위 글처럼 평가를 해줬네요.

 

그럼 로컬은 이렇게 할 수 없냐? 당연히 가능합니다. 위에 보시면 flux라는 글이 보이는데
바로 fluxkontext라는 모델이 있습니다.
어쩌면 이 모델을 기반으로 구글에서 나노 바나나를 만들었을 수도 있겠네요.
구글이 있던 모델들을 응용해서 이것저것 강화해서 쓰는 걸로 유명하니까요.

 

FLUX KONTEXT를 이용한 결과 이미지
flux kontext를 이용한 피규어

flux1 dev가 그림을 그리는 모델이라고 보면 flux kontext는 그림 그려진 걸 유지하면서 편집하는 모델입니다.
보통 comfyui에서 쓰는데 로컬로 비디오램 12기가인 3060 이상이면 가능합니다.
설치가 약간 까다롭긴하지만 , 설치방법를 한번 해보면 자주 이용하게 됩니다.

FLUX KONTEXT를 사용한 노드 구성

●cumfyui를 이용한 flux kontext의 노드 구성
노드나 모델들은 무료로 이용가능합니다.
상업적 저작권에 관해서는 1차 저작권 2차 저작권이 있으니 잘 알아보시고 사용하시길 바랍니다.

 

 
flux kontext에 들어간 프롬프트

a realistic photo of a toy figure of a chubby bear in a yellow tracksuit with unzipped jacket, fists clenched, power pose, standing on a wooden desk, next to a cube-shaped pvc toy box with camouflage pattern and transparent window, on the monitor behind is a full-body 2D anime-style illustration of the same character in natural proportions, not distorted, slightly zoomed out, matching pose, blue sky background, studio lighting, realistic product prototype scene
 

-해석-

노란색 트레이닝복을 입고 재킷을 풀어헤친 통통한 곰 인형 장난감의 사실적인 사진. 주먹을 꽉 쥐고 파워 포즈를 취하고 있으며, 나무 책상 위에 서 있고, 위장 무늬와 투명 창이 있는 큐브 모양의 PVC 장난감 상자 옆에 서 있습니다. 모니터 뒤에는 자연스러운 비율로 동일한 캐릭터의 전신 2D 애니메이션 스타일 일러스트레이션이 있습니다. 왜곡되지 않고 약간 축소되어 있으며, 포즈가 일치하고, 푸른 하늘 배경, 스튜디오 조명, 사실적인 제품 프로토타입 장면입니다.
 
 

flux의 경우 알다시피 오프라인 모델이라 온라인앱에서 생성되는
이미지와 다르게 사이즈 제한이 없고 여러 가지 실험을 할 수 있는
장점이 있습니다. 그려진 이미지를 wan과 같은 ai동영상
모델로 동영상 제작도 가능합니다.
 
저는 개인적으로 피규어 스타일은 Flux, 빠른 실험은 나노 바나나, 간단 테스트는 델 3을 쓰고 있습니다.

 

세밀한 조정은 결국 어떤 프롬프트를 어떻게 쓰느냐에 따라 크게 달라집니다.
조명, 질감 그리고 같은 프롬프트를 쓰더라도
모델에 따라 정말 다르게 표현을 할 수도 있습니다.
모델이 어떤 설명으로 어떤 포즈로 학습된냐에 따라서 다르기 때문에
모델마다 개성이 있으므로, 자신의 목적과 취향에 따라
조합해서 쓰는 것이 가장 현명한 선택일 것 같습니다.