스테이블 디퓨전(StableDiffusion)

요즘 주목받는 Flux 를 아시나요?

물범쌤 2024. 8. 19. 12:58

안녕하세요 여러분, 물범쌤입니다 :)

최근에 Flux(플럭스)라는 생성형 AI 모델이 굉장히 주목받고 있는데요.

이 모델이 왜 핫한건지 ,그리고 어떻게 써볼 수 있는지

많은 분들이 궁금해하시는것 같아서 한번 정리해 보려고 합니다.

 

그럼, 바로 본론으로 들어가 보시죠! ^^

 


1. Flux 가 뭔가요?

 

 

Flux는 블랙 포레스트 랩스(blackforestlabs.ai)에서 제작된 생성형 AI모델입니다.

이 Flux모델은 다음과 같은 특징이 있습니다.

 

● 다른 프로그램들에 비해 강력한 손가락 표현 : 

AI이미지에서 항상 거론되는 문제가 바로 손가락의 표현인데요,

SD3가 개선된 모델을 내놓는다고 했지만,
아직 많은 사람들이 SD3의 품질에 대해 회의적인 반면

최근 미드저니에서 발표한
미드저니 6.0 모델이 실사 표현이나 손가락 표현등에 있어서

훨씬 고품질의 이미지를 뽑아낼 수 있다는 평이 많았습니다만,

Flux는 손가락과 텍스트의 표현등에서 미드저니 6.0 보다도 

더 높은 성능을 보여주고 있는 모델입니다.

 

● 생동감 있는 실사 표현 : 

Stable diffusion의 고질적인 문제라고 한다면

'아름다움'과 '완벽함'을 추구하는 로라들이 많이 제작되면서,

이미지를 생성하다보면 어느순간 이목구비나 피부 표현들이

비현실적으로 묘사되는 부분이 있습니다.

(ex.인간이라기보다 인형에 가까운 피부)

Flux모델은 그런 부분에 있어서

조금 더 현실적인 이미지 표현들이 잘 드러나고,

Stable Diffusion 기반에서 미드저니와 같은 예술적인 화풍과

유니크한 색감을 표현할 수 있다는 점이
큰 특징이라고 할 수 있겠습니다.

 


2. 어떻게 사용해볼 수 있나요?

 

우선, Flux는 3가지 모델이 있습니다.

 

1) schnell (가장빠른 모델):

가장 빠른 모델이며, 개인용으로 맞춤화되어 있습니다.
FLUX.1 [dev]와 유사하게 Hugging Face에서 가중치를 사용할 수 있으며 
추론 코드는 GitHub에서 확인할 수 있습니다. 
FLUX.1 [schnell]은 Replicate, fal.ai 및 mystic을 통해서도 사용할 수 있습니다.

2) dev (일반적인 모델):

비상업적 응용을 위한 개방형 가중치, guidance-distilled 모델입니다.
FLUX.1 [pro]에서 직접 증류된 FLUX.1 [dev]는
동일한 크기의 표준 모델보다 효율적이면서도
유사한 품질과 신속한 준수 기능을 얻습니다.
FLUX.1 [dev] 가중치는 HuggingFace에서 사용할 수 있으며
Replicate, fal.ai 및 mystic에서 직접 시도할 수 있습니다.

 

3)pro(고급 모델):

최고의 FLUX.1은 라인 프롬프트 팔로잉, 시각적 품질,
이미지 세부 정보 및 출력 다양성을 갖춘

최첨단 성능의 이미지 생성 기능을 제공합니다.
저희는 API에서 FLUX.1 [pro]에 대한 추론 컴퓨팅을 천천히 강화하고 있습니다.

또한 FLUX.1 [pro]는

Partners Replicate, fal.ai 및 mystic을 통해 액세스할 수 있습니다.
저희는 또한 전용 및 맞춤형 엔터프라이즈 솔루션을 제공합니다.

 

이 중에서 Pro버전은 이미지 갯수에 비례한 사용 요금이 발생하고,

나머지 두 가지 버전은 무료로 생성을 체험해볼 수 있습니다.

아래의 URL에서 허깅페이스 아이콘을 클릭해주세요!

https://blackforestlabs.ai/#get-flux

반응형

 

허깅페이스 ID가 없다면 무료가입을 진행하세요!

 

 

이동 후에는 우측 상단에 'Space'를 통해서 이동해주세요

Space는 허깅페이스에서 체험 가능한 여러 모델들이 있는데

검색을 해보셔도 좋고 저는 하단에 바로 Flux가 보여서 그대로 클릭해주었습니다 :)

 

 

이동하면 바로 프롬프트를 입력하고 생성해볼 수 있는 공간이 나오게 됩니다.

이곳에서 Flux모델을 체험해 볼 수 있습니다.

 

 

프롬프트를 작성하고, 'Run'버튼을 누르면 이미지를 생성할 수 있습니다.

 

 

매우 아름답지는 않지만,

그래도 Flux의 특징이라 할 수 있는 손가락이 잘 표현되었기에

예시로 첨부드립니다 :)

 


3. 어떻게 해야 고품질 이미지를 사용할 수 있나요?

 

아무래도 우리 눈에 아름다운 고품질 이미지 생성을 위해서는

로라 적용이 필수적일 수 밖에 없습니다.

로라를 적용한다는 것은,

해당 모델을 로컬 설치를 진행해야 한다는 뜻이기도 합니다.

 

1)로컬설치

알려드린 허깅페이스 페이지에서

'space'가 아닌, 'Files and versions'로 가시면

파일을 다운로드 받으실 수 있습니다.

Flux는 용량이 상당히 크기 때문에(약 20~30GB) 참고해주시고,

저는 사진에는 schnell 버전으로 보여드리지만

실제 사용은 dev버전으로 사용하고 있다는 점 참고해주세요 :)

 

 

 

2)다음은 로라 차례 입니다.

아래의 URL은 Flux에서 적용 가능한 로라들이 모여있는 페이지 입니다.

https://huggingface.co/XLabs-AI/flux-lora-collection/tree/main

자세히 보시면 리얼리즘 로라 부터 ,애니메이션, 아트,

디즈니, 미드저니풍의 로라까지

다양한 로라들을 사용해볼 수 있습니다.

 

 

 

3)다음은 워크 플로우 입니다.

저는 comfyUI를 사용하기 때문에

Flux 모델 사용을 위한 워크 플로우를 사용하지만

ComfyUI가 생소하신 분들께서는

web-ui Forge에서도 사용 가능하시니까 참고해주세요.

(SD3가 아직 web-ui에서 적용 안될뿐, Flux는 사용 가능합니다.)

아래의 URL은 ComfyUI용 워크플로우 입니다.

https://openart.ai/workflows/maitruclam/comfyui-workflow-for-flux-simple/iuRdGnfzmTbOOzONIiVV

 

 

 


생성 단계에서 주의해야할 Flux모델의 몇 가지 특징이 있습니다.

 

1.Flux 모델은 부정 프롬프트를 반영하지 않기 때문에

CFG scale 을 '1'로 두셔야 합니다.

 

2.Flux는 이미지 생성에 꾀나 시간이 걸립니다.(약 2분내외)

일반적인 Flux 모델보다 이미지 생성 속도가 더 빠른

NF4 모델이 있습니다.

https://huggingface.co/lllyasviel/flux1-dev-bnb-nf4

 

다만 기존의 Flux 모델과 별도의 체크포인트 로더가 필요하기 때문에

Flux를 좀 더 깊게 파고드실 분들만 참고해주시길 바랍니다.

사용해본 결과 이미지 생성시간 축소가 체감되긴 합니다.


마지막으로 Flux 모델을 통한 이미지 예시를 몇 가지 보여드리겠습니다.

 

 

 


오늘은 최근 주목받고 있는 Flux 모델에 대해 알아보았습니다.

용량이 크고, 생성시간이 오래 걸리긴 하지만

확실히 복잡한 설정 없이도 고품질의 이미지를 잘 뽑아낼 수 있는것 같습니다.

 

 

이 컨텐츠가 유익하셨다면

커피값은 기업들에게 받을테니

광고 한번씩만 눌러주시면 감사드리겠습니다 :)

 

그럼 모두 좋은 하루 되세요! ^^

반응형