달리3 사용법 in 챗GPT
생성형 AI 챗봇인 챗GPT에 AI 그림 생성 모델인 달리3가 통합되었습니다. 두 모델은 모두 OpenAI에서 개발한 모델로, 이번 통합으로 이제 챗GPT 대화창 안에서 이미지 생성이 가능하게 되었습니다.
이번 포스팅에서는 챗GPT에 통합된 달리3 사용법과, 이 새로운 기능을 다양하게 활용하는 방법을 소개하겠습니다.
이번 포스팅을 보시기 전 달리3가 다른 AI 모델 대비 어떤 강점이 있는지에 대해 설명한 포스팅을 먼저 보시면, 포스팅을 이해하는 데 도움이 되실 겁니다.
⚠️ 달리3는 유료 버전인 챗GPT Plus(월 $20)와 기업용 챗GPT Enterprise에서만 제공됩니다.
달리3는 마이크로소프트의 빙 AI에도 탑재되었으며, 빙에서는 무료로 이용 가능합니다.
달리3 사용법 in 챗GPT
지금부터 챗GPT 내에서의 달리3 사용법을 기능 선택→ 이미지 생성→ 이미지 편집 순으로 안내하겠습니다.
1. GPT-4 → DALL·E 3 선택
2. 챗GPT 대화창에 프롬프트(명령어) 입력
'하늘을 나는 마녀, 크리스마스'라는 한글 프롬프트를 입력해 보겠습니다.
3. 상세 프롬프트 4개 자동 완성
사용자가 입력한 프롬프트를 기반으로 챗GPT가 스스로 더욱 디테일한 프롬프트 4개를 생성합니다.
한글로 입력한 프롬프트가 영문으로 자동 번역되어 진행되는 것을 알 수 있습니다.
4. 이미지 생성 완료
하늘을 나는 마녀, 크리스마스에 대한 이미지 4개 생성 완료
5. 이미지 수정
생성된 이미지의 수정 작업도 가능합니다. 단, 원본 이미지를 편집하는 방식이 아닌, 기존에 생성된 이미지를 참조하여 새로운 이미지를 만드는 방식입니다.
원본 이미지와 유사하지만, 분위기나 디테일이 일부 변형된 이미지를 얻을 수 있습니다.
위에서 생성한 마녀를 남자 마법사로 변경하고 → 변경된 마법사에게 모자를 씌우는 작업을 진행해 보겠습니다.
마녀를 남자 마법사로 변경
남자 마법사에게 모자 착용
6. 개별 이미지 선택
개별 이미지를 클릭하면 이미지와 사용된 프롬프트를 함께 볼 수 있으며, Copy 버튼을 눌러 프롬프트를 복사하거나, 이미지를 다운로드할 수 있습니다.
달리3 기본 정보
지금부터 챗GPT에 탑재된 달리3의 기본 정보를 소개하겠습니다.
제공되는 이미지 사이즈, 시간당 사용 횟수 등은 OpenAI의 정책에 따라 언제든지 변경될 수 있습니다.
이미지 사이즈
총 3가지 이미지 사이즈를 지원합니다. 지원하는 사이즈는 아래와 같습니다.
1. 1024x1024 (정사각형)
2. 1792x1024 (가로형)
3. 1024x1792 (세로형)
시간당 사용 횟수 제한
3시간 최대 50회 사용 제한이 있습니다.
50회에는 달리 외 다른 GPT-4 기능(Default, Browse with Bing, Advanced Data Analysis, Plugin)의 사용 횟수도 모두 포함됩니다.
제한 횟수는 OpenAI에서 언제든지 변경할 수 있습니다.
Rate Limit
위 3시간 최대 50회 사용 제한과는 별개로, 달리3로 이미지를 많이 생성하면 50회에 도달하지 않더라도 Rate Limit 메세지와 함께 특정 시간 동안 이미지 생성이 불가한 것으로 확인됩니다.
콘텐츠 검열
챗GPT는 콘텐츠 검열이 매우 엄격한 편입니다. 특정 연예인 이름, 특정 브랜드 이름을 기재하여 이미지 생성 요청 시 아래와 같이 이미지 생성이 불가하다는 메세지를 쉽게 볼 수 있습니다.
연예인 IU 닮은 한국인 여성
엽서, 코카콜라를 마시고 있는 포켓몬스터
마약 하는 중년 남성
심한 경우 아래와 같이 경고 창이 나타날 수도 있습니다.
달리3 사용법 - 고급 활용법
달리3 사용법 고급 편입니다. 챗GPT Plus에서 제공하는 다른 기능인 Advanced Data Analysis와의 연계 활용법과, 홈페이지 배너, 로고 등 상업적으로 활용할 수 있는 방법에 대해 소개하겠습니다.
1. Gif 형식 이미지 만들기
2. 이미지 업스케일(해상도↑)
이번에는 달리3로 만든 이미지를 업스케일(해상도↑) 해보겠습니다. 업스케일 작업 역시 Advanced Data Analysis 기능을 통해서 할 수 있습니다.
이미지 4배 업스케일 (1024 x 1024 → 4096 x 4096)
4배로 업스케일 해도, 이미지가 깨지지 않고 원본 이미지의 세부 내용을 아주 잘 반영한 것을 확인할 수 있었습니다.
3. 텍스트 삽입
달리3는 2023년 10월 기준 전 세계적으로 몇 없는 텍스트를 이미지로 정확하게 구현할 수 있는 AI 모델입니다.
이 기능을 활용하여 홈페이지에 사용할 배너를 만들 수도
텍스트가 포함된 로고를 만들어 사용할 수도 있습니다.
텍스트를 이미지로 구현하는 것이 가능해짐에 따라 AI 이미지의 상업적 이용이 한층 더 수월해졌습니다.
4. 네 컷 이미지
달리3를 활용해서 네 컷 이미지를 만들 수도 있습니다.
생성되는 4개의 개별 이미지에 연속성을 부여하거나
하나의 이미지 속에 네 컷이 다 들어가게 만들 수도 있습니다.
제가 이번 포스팅에서 소개한 달리3 사용법 외에도 정말 다양하고 유용한 활용법이 발견될 것으로 예상됩니다. 독자분께서도 본인만의 달리3 사용법을 찾아 독창적인 이미지를 만들어 보시길 바랍니다.
챗GPT vs 빙 이미지 크리에이터
달리3 모델은 OpenAI의 챗GPT Plus(유료 버전)와 마이크로소프트의 빙 이미지 크리에이터 모두에 적용되어 있습니다.
같은 AI 엔진이 적용되어 있음에도 불구하고 둘 사이에는 꽤 많은 차이점이 존재합니다.
1. 유료 VS 무료
챗 GPT에서 달리3를 사용하려면 유료 버전인 챗GPT Plus(월 $20)를 구독해야 하지만, 빙 이미지 크리에이터에서는 무료로 사용 가능합니다.
2. 프롬프트
챗GPT에서는 사용자가 프롬프트를 입력하면 → 챗GPT가 사용자가 입력한 프롬프트를 기반으로 더 상세한 프롬프트를 작성하며 → 이 프롬프트를 기반으로 이미지가 생성됩니다.
반면, 빙 이미지 크리에이터에서는 사용자가 입력한 프롬프트가 그대로 사용됩니다.
3. 콘텐츠 검열
빙 이미지 크리에이터는 콘텐츠를 검열하는 정도가 챗GPT 보다 덜합니다.
특정 인물의 이름을 기입하면 이미지 생성이 불가하다고 답변하는 챗GPT와는 달리, 빙 이미지 크리에이터에서는 실제 연예인과 매우 닮은 AI 모델을 생성할 수 있습니다.
⚠️ 빙 이미지 크리에이터도 다른 이미지 제너레이터에 비해서는 검열이 강한 편입니다.
4. 텍스트 구현 능력
텍스트 구현 능력은 챗GPT가 빙 이미지 크리에이터 보다 뛰어납니다.
보고 계시는 블로그 주소가 포함된 Welcome to Deepdaive.com 텍스트를 이미지로 구현해 보면, 챗GPT에서는 쉽게 구현되는 편이지만, 빙 이미지 크리에이터에서는 구현이 매우 어렵습니다.
빙 이미지 크리에이터에서는 Deepdaive 대신 영어사전에 등재된 단어인 Deepdive로 구현되는 경우가 많았습니다. 사전에 없는 단어는 제대로 구현하지 못하는 것으로 보입니다.
⚠️마이크로소프트는 OpenAI에 대규모의 투자를 진행 중이며, 투자가 마무리되는 시점에 OpenAI는 마이크로소프트의 자회사가 되는 것으로 알려져 있습니다.
위 언급한 차이점은 양사의 정책에 따라 언제든지 변경될 수 있습니다.
이미지 소유권, 상업적 이용
OpenAI의 정책 상 챗GPT에서 달리3로 생성한 모든 이미지의 소유권은 사용자에게 있으며, 상업적으로 이용하는데 문제가 없습니다.
다만, 정책은 언제든지 변할 수 있으니 상업적 이용 전 최신 업데이트 내역을 확인할 필요가 있습니다.
동일한 달리3 모델이 탑재된 마이크로소프트의 빙(Bing) 이용약관에는 비상업적 용도로만 사용하도록 명시되어 있는 점 참조 부탁드립니다.
달리3 사용법 에필로그
지금까지 달리3 사용법에 대해 함께 알아보았습니다.
챗GPT에 탑재된 달리는 사용자가 간단한 프롬프트만 입력하면, 챗GPT가 알아서 멋진 프롬프트를 생성해 주기 때문에 초보자/입문자가 사용하기에 아주 적합해 보입니다.
또한, 한글을 자동으로 영어로 번역해주기 때문에, 영어를 못하는 유저도 아무 걱정 없이 사용할 수 있다는 큰 장점도 있습니다.
달리3가 출시되기 전까지, 미드저니와 스테이블 디퓨전이 AI 그림 생성 분야에서 독보적인 위상을 차지하고 있었습니다.
하지만, 프롬프트 세부 요청사항을 기존의 어떤 AI모델보다 더 정확하게 반영하고, 텍스트를 이미지로 정확히 구현할 수 있는 달리3가 출시되면서 AI 그림 생성 분야의 판도에 큰 변화가 있을 것으로 보입니다.
챗GPT에 탑재된 달리3 사용에 있어 한 가지 아쉬운 부분은, 사용자가 입력한 프롬프트를 그대로 사용하는 옵션이 없다는 것입니다.
챗GPT가 자체적으로 프롬프트를 개선하는 것은 분명 큰 장점이 있지만, 프롬프트 자동 개선이 오히려 불편함을 주는 경우도 분명히 존재합니다.
이 부분은 조만간 개선이 있지 않을까 예상해 봅니다.
달리3와 기존 최강자였던 미드저니에서 동일한 프롬프트를 입력해서 생성된 이미지가 어떻게 다른지 궁금하시다면 아래 포스팅을 참조 부탁드립니다.
[Update – 2024/1/31]
1.본문에는 달리3, Advanced Data Analysis 등의 기능을 선택한 후 사용하는 것으로 기재했는데, 이 모든 기능이 더 이상 별도로 선택하지 않아도 채팅창 안에서 작동되는 것으로 변경되었습니다. (채팅창에서 ~그려줘와 같이 명령하면 이미지가 생성됩니다)
2.포스팅 작성 시점에는 3시간 50회 제한이었으나 현재는 3시간 40회 제한입니다.
3. 빙 이미지 크리에이터의 검열도 더욱 강해져서 특정 연예인의 이름을 직접적으로 언급한 경우 이미지 생성이 불가합니다.
4. 일관성, 연속성 있는 이미지를 생성하는 방법은 아래 포스팅을 참조 부탁드립니다.
https://deepdaive.com/달리3-seed/
빠른 정보에 감사를 드립니다.
DALL-E3의 고급기능3에 텍스트를 이미지로 표현하는 프롬프트와 고급기능4인 네 컷 이미지 프롬프트가 궁금합니다. 사례를 부탁드려도 될까요?
안녕하세요 너무 잘봤습니다. 챗gpt에게 웰컴투 딥다이브 요청한 이미지중에 도시 네온사인 이미지는 어떻게 요청하면 저렇게 나오나요? 너어어무 이쁘네요!