Development/Artificial Intelligence

AI 이미지 생성 — 99%가 모르는 충격적인 사실

Danny Seo 2024. 9. 5. 11:46

목차

    이 글에서는 AI 이미지 생성 기술에 대해 깊이 있게 다루어보려 합니다.

    ImageFX — AI로 생성된 커버 이미지입니다.

     

    많은 글들이 AI 이미지 생성기 중 어떤 것이 "최고"인지 묻곤 합니다.

     

    하지만 사실 그렇게 간단한 문제가 아닙니다.

     

    각 이미지 생성기마다 강점과 약점이 있기 때문입니다.

     

    Dall-e 3 vs Flux.1 vs Leonardo.ai vs ImageFX (Google)

    테스트 #1: 실제 사람의 AI 이미지

    Flux.1은 사람의 실제 모습을 가장 사실적으로 표현하는데 뛰어납니다.

     

    첫 번째 프롬프트는 다음과 같습니다:

    “20세 아시아 여성의 포토리얼리틱 셀카 이미지. 그녀는 플로리다에 있는 집 앞마당에 서 있으며, 흰 티셔츠를 입고 있습니다. 마당 중앙에 서 있고, 저녁 시간이 되기 전 흐린 하늘과 야자수가 배경으로 보입니다.”

     

    Flux.1

    Flux.1:  플로리다에 있는 아시아 여성 AI 이미지

     

    Dall-e 3 from OpenAI 

    Dall-e 3 (OpenAI):  플로리다에 있는 아시아 여성 AI 이미지

     

    이건 너무 가짜 같아서 우스광쓰러운 것 같습니다. 

     

    ImageFX (Google)

    ImageFX (Google):  플로리다에 있는 아시아 여성 AI 이미지

     

    Leonardo.ai

    Leonardo.ai: 플로리다에 있는 아시아 여성 AI 이미지

     

    결론:

    Flux.1이 이번 테스트의 승자입니다.

     

    ImageFX는 두 번째로, 꽤 사실적이지만 어딘가 미묘하게 어색합니다.


    Dall-e 3와 Leonardo.ai는 완전히 실패했습니다.

    제 생각에 Dall-e와 Leonardo는 어떤 "안전성" 문제로 인해 젊은 여성의 사실적인 이미지를 만들지 않도록 제한을 둔 것 같습니다.

     

    이 모델들이 사실적인 이미지를 만들 수 없다는 의미는 아닙니다. 다만 젊은 여성의 이미지는 무언가 이유가 있어 생성이 제한된 것 같습니다.

    이 점은 매우 특이하며, 주목할 필요가 있습니다. AI 생성기들이 인간에 의해 프로그래밍된 만큼, 때때로 그 결과는 매우 다를 수 있습니다.

     

    테스트 #2: 나이 든 사람

    첫 번째 테스트에서 젊은 여성의 사실적인 이미지를 거부한 AI 생성기들이 있었다는 것을 알게 되었습니다. 그렇다면 노인 이미지는 어떨까요?

     

    프롬프트:

    "깊은 주름과 은발을 가진 노부인의 포토리얼리틱 초상화. 전통적인 직조된 숄을 두르고 있으며, 인자한 미소를 짓고 있습니다. 배경은 단순하고 흐릿한 자연 풍경으로, 얼굴에 집중되어 있습니다."

     

    Flux.1

    Flux.1:  AI로 생성된 노부인

     

    Dall-e 3

    Dall-e 3:  AI로 생성된 노부인

     

    보이시나요?

     

    이번 테스트에서는 Flux.1보다 더 나은 결과를 보여줬다고 생각합니다 (물론 둘 다 훌륭하지만요).

     

    여기서 핵심은 검열이 얼마나 중요한 역할을 한다는 점입니다.

     

    Dall-e 3는 원한다면 사람의 이미지를 충분히 만들 수 있지만, 이상하게도 노인 이미지에 대해서는 전혀 제약이 없는 것 같습니다.

     

    ImageFX

    ImageFX:  AI로 생성된 노부인

     

    결론:

    노인의 경우, 모든 모델이 사실적인 이미지를 만드는 데 아무런 문제가 없었습니다.

     

    Dall-e와 Leonardo에서는 20대 여성 이미지에서만 검열이 문제가 되었습니다.

     

    참고로, Leonardo가 이전에 젊은 여성의 매우 고품질 포토리얼리틱 이미지를 생성한 것을 본 적이 있습니다. 그래서 이번에 왜 이런 결과가 나왔는지 확실하지 않습니다. 최근에 Canva가 Leonardo를 인수했기 때문에, 더 많은 검열 압박을 받고 있을 가능성도 있습니다. 앞으로 어떤 변화가 있을지 지켜봐야 할 것 같습니다.

     

    테스트 #3: 유명인사 (도널드 트럼프)

    프롬프트:

    "도널드 트럼프의 포토리얼리틱 이미지"

     

    Flux.1

    Flux.1: AI로 생성된 도널드 트럼프 이미지


    솔직히 약간 만화처럼 보이지만, 이번 테스트에서는 가장 나은 결과입니다.

     

    다른 유명인사들, 예를 들어 테일러 스위프트의 이미지를 Flux.1로 생성했을 때, 결과물이 굉장히 인상적이었습니다.

     

    다만 법적 문제를 피하기 위해 여기에는 게시하지 않겠습니다.

     

    Leonardo.ai

    Leonardo.ai: 도널드 트럼프 AI 이미지

     

    Dall-e 3와 ImageFX는 완전히 실패했습니다.  
    이 두 이미지 생성기는 공인 인물의 이미지를 아예 시도조차 하지 않았습니다. 그들의 정책에 어긋나기 때문입니다.

    보시다시피, 내부 정책과 검열이 이미지 생성에 큰 영향을 미칩니다.

    이론적으로는 이 모델들이 무엇이든 생성할 수 있지만, 일부 모델은 다른 모델들보다 훨씬 더 많은 제약을 받습니다.

     

    테스트 #4: 음식 이미지 (특정 카메라 각도 등)

    이번 테스트의 목적은 보다 구체적이고 복잡한 프롬프트로 AI 생성기들이 어떻게 반응하는지 확인하는 것이었습니다.

     

    프롬프트:

    "캐논 EOS 5D Mark IV와 50mm f/1.2 렌즈로 45도 각도에서 살짝 눈높이보다 위에서 촬영한 완벽하게 구운 미디엄 레어 스테이크. 스테이크는 숯 자국과 로즈마리 한 줄기가 얹어져 있으며, 구운 감자와 그린빈이 곁들여져 있습니다. 배경에는 흐릿하게 적포도주 한 잔이 놓여 있습니다."

     

    Dall-e 3

    Dall-e 3: AI로 생성된 스테이크 저녁

    ImageFX

    ImageFX:  AI로 생성된 스테이크 저녁

    Flux.1

    Flux.1: AI로 생성된 스테이크 저녁

    결론:

    세 모델 모두 품질 면에서는 비슷한 수준이었습니다.

    개인적으로는 Dall-e 3가 가장 뛰어났다고 생각합니다.

    Flux는 두 번째였고,

    ImageFX는 마지막이었습니다 (스테이크가 건조해 보이고 약간 인위적이었습니다).

    하지만 중요한 점은, 세 이미지 생성 모델 모두 검열과는 무관한 복잡한 프롬프트를 꽤 잘 처리했다는 것입니다.

     

    테스트 #5: 추상 미술

    이번 테스트의 목표는 AI 모델들이 얼마나 창의적으로 작업할 수 있는지를 확인하는 것이었습니다.

     

    프롬프트:

    "서로 뒤섞이고 흐르는 색과 형상들로 이루어진 추상적인 작품. 터키석, 마젠타, 금색 등 꿈 같은 느낌을 자아내는 생동감 넘치는 색들이 움직임과 에너지를 전달합니다."

     

    Dall-e 3

    Dall-e 3:  AI로 생성된 추상 미술

    ImageFX

    ImageFX:  AI로 생성된 추상 미술

    Flux.1

    Flux.1:  추상 미술

     

    결론:
    사람마다 의견이 다를 수 있겠지만, 제 생각에는 Dall-e 3와 ImageFX가 가장 멋지고 창의적으로 보였습니다.

    Flux.1은 조금 아쉬운 느낌이었습니다.

    아마도 이번 테스트는 단순히 사진을 합성하는 것보다 언어를 얼마나 잘 이해하는지가 중요한 요소였던 것 같습니다.

    OpenAI와 Google이 언어 이해에서 더 뛰어난 성과를 낸 것이 자연스러워 보입니다.

     

    테스트 #6: 풍경

    마지막 테스트는 자연 풍경 장면입니다.

     

    프롬프트:

    "울창한 소나무 숲으로 둘러싸인 고요한 산속 호수. 물은 맑고 투명하며, 멀리 눈 덮인 산이 물 위에 반사됩니다. 작은 나무 부두가 호수로 뻗어 있으며, 노 젓는 배가 물 위에 부드럽게 흔들리고 있습니다."

     

    Flux.1

    Flux.1:  AI로 생성된 자연 풍경

    ImageFX

    ImageFX:  AI로 생성된 자연 풍경

    Dall-e 3

    Dall-e 3: AI로 생성된 자연 풍경

    결론:

    세 모델 모두 꽤 훌륭했습니다.

    개인적으로는 Flux.1이 승자라고 생각하지만, 그건 단지 제가 색감을 더 선호하기 때문입니다 (이건 개인적인 취향의 문제인 것 같습니다).

     

    마무리

    결론적으로, AI 이미지 생성기는 각기 다른 특성과 강점을 가지고 있으며, 어떤 모델이 "최고"라고 단정 짓기보다는 특정 상황이나 목적에 맞는 모델을 선택하는 것이 중요합니다. 

     

    Flux.1, Dall-e 3, ImageFX 모두 훌륭한 성과를 내지만, 개인의 취향이나 요구에 따라 선호하는 결과물이 달라질 수 있습니다. 

     

    앞으로 기술이 발전함에 따라 이들 모델 간의 차이는 더 뚜렷해지거나, 반대로 점차 비슷해질 수도 있겠죠. 

     

    검열과 같은 요소 또한 중요한 변수로 작용할 것이므로, 이를 염두에 두고 사용해야 할 것입니다.