챗GPT 달리3 프롬프트 작성 가이드 (챗GPT와 달리3의 능력 최대한 활용하기)

챗GPT 달리3 프롬프트 작성 가이드

챗GPT에서 이미지가 생성되는 과정은 기존 AI 이미지 생성 모델의 방식과는 큰 차이가 있습니다.

이에 프롬프트 역시 이러한 차이를 고려해서 작성해야 할 필요가 있습니다.

이번 포스팅에서는 챗GPT에서 이미지를 생성할 때 사용하기 적합한 프롬프트 작성 방법을 소개하겠습니다.

🛎️ 챗GPT에는 AI 이미지 생성 모델인 달리3가 탑재되어 챗GPT 대화창 안에서 이미지를 생성할 수 있습니다.

기존의 프롬프트 작성법

기존에 좋은 프롬프트를 작성하는 방법으로 자주 언급되던 내용은 다음과 같습니다.

1. 중요한 키워드가 앞쪽에 위치해야 함.
2. 너무 길지도, 짧지도 않은 프롬프트가 좋음.
3. 적당한 길이의 키워드를 나열하는 것이 문장형 프롬프트보다 유리함.

위 내용은 다른 AI 이미지 생성 도구에서는 여전히 유효한 내용입니다.

간단한 이미지를 생성할 경우 달리3에서도 유효한 내용일 수 있습니다. 하지만 챗GPT와 달리3의 능력을 활용하는 부분에 있어서는 아쉬운 방법입니다.

챗GPT 달리3의 능력

지금부터 챗GPT와 달리3 두 모델이 가진 능력에 대해 설명하겠습니다.


챗GPT의 프롬프트 고도화 기능

챗GPT는 사용자가 입력한 프롬프트를 고도화하는 작업을 수행합니다.

아래는 프롬프트 고도화 작업이 포함된 챗GPT의 이미지 생성 과정입니다.

[챗GPT 이미지 생성 과정]
1. 프롬프트 이해: 챗GPT는 사용자가 입력한 프롬프트의 전체적인 내용을 이해합니다.

2. 핵심 프롬프트 추출: 챗GPT는 전체 프롬프트 중에서 이미지를 생성하기 위한 핵심적인 프롬프트 부분만을 따로 추출합니다.

3. 프롬프트 번역: 챗GPT는 추출한 핵심 프롬프트를 영어로 번역합니다.

4. 고도화된 프롬프트 작성: 번역된 영어 프롬프트의 내용을 기반으로, 챗GPT는 더욱 상세하고 구체적인 프롬프트를 스스로 작성합니다.

5. 이미지 생성: 고도화된 프롬프트를 기반으로 달리3 모델이 이미지를 생성합니다.

이 과정을 통해 사용자가 잘 다듬어지지 않은 긴 프롬프트를 입력하더라도, 챗GPT가 전체적인 내용을 파악한 후 달리3가 이미지로 구현하기에 최적화된 프롬프트로 변환합니다.

이에 프롬프트의 길이나 구조에 너무 큰 제한을 두지 않고, 이미지에 반영하고자 하는 내용을 최대한 구체적으로 작성하는 것이 중요합니다.

달리3의 정확한 프롬프트 구현 능력

달리3는 프롬프트의 세부 요청사항을 기존의 어떠한 AI 툴보다 더 잘 파악하고 이미지에 반영합니다.

아래는 이미지의 스타일과 다양한 요소에 대한 설명, 그리고 텍스트 구현 요청까지 포함된 복잡한 프롬프트로 생성한 이미지입니다.

챗GPT 달리3
수채화, 한국인 가족의 뒷모습. 아이와 엄마 아빠, 그리고 유모차 하나. 멀리서 사람이 없는 회전목마를 바라보고 있음. 회전목마의 중앙 위쪽 목판에 "AI Land"가 적혀 있음

프롬프트 내 모든 요청 사항이 아주 잘 반영됐을 뿐만 아니라, 텍스트(AI LAND)도 이미지로 정확하게 구현된 것을 볼 수 있습니다.

달리3는 위 예시 이미지 생성에 사용된 것보다 더 복잡한 프롬프트도 이미지로 정확하게 구현할 수 있습니다.

물론 짧고 간결한 프롬프트로도 창의적이고 멋진 이미지를 만들 수 있지만, 이는 챗GPT의 프롬프트 고도화 기능과 달리3의 정확한 프롬프트 구현 능력을 충분히 활용하는 방법은 아닙니다.

챗GPT 달리3의 을 제대로 활용하려면, 프롬프트를 기존의 방식과는 조금은 다르게 작성해야 합니다.

지금부터 소개할 프롬프트 작성 가이드는 단순히 멋진 이미지를 만드는 방법이 아니라, 두 모델의 능력을 최대한 활용하는 것에 중점을 두었습니다.

프롬프트 작성 가이드

아래는 챗GPT 달리3를 활용한 이미지 생성에 최적화된 프롬프트 작성 가이드입니다.

[챗GPT 달리3 프롬프트 작성 가이드]
1. 문장 형태로 자세하게 묘사하기
2. 요소 간 위치적 관계 설명하기
3. 비유, 은유적 표현 활용하기

이제 위 세 가지 내용이 반영된 프롬프트로 생성한 이미지를 함께 보며 설명을 진행하겠습니다.

요소 간 위치적 관계를 설명하는 문장형 프롬프트 (1번 + 2번)

챗GPT 달리3는 각 요소 간의 위치적 관계를 잘 이해합니다. 각 요소 간의 위치적 관계를 포함한 문장형 프롬프트를 사용해서 만든 이미지를 함께 보겠습니다.

챗GPT 달리3
가로 비율 사진. 한복판에 있는 큰 돌 위에는 아름다운 흰색 나비가 앉아 있다.  돌의 바로 앞에는 작은 연못이 흐르며, 연못에는 물고기가 몇 마리 헤엄치고 있다. 연못의 주변에는 형형색색의 꽃이 피어 있다. 뒷 배경에는 눈이 쌓여 있는 높은 산들이 보이고, 하늘에는 무지개가 떠 있다.

이미지에 프롬프트에서 언급한 모든 요소가 잘 구현되었고, 요소 간 위치적 관계도 요청대로 정확하게 반영된 것을 알 수 있습니다.

비유, 은유적 표현을 활용한 문장형 프롬프트 (1번 + 3번)

챗GPT 달리3는 비유, 은유적 표현도 잘 이해합니다. 아래는 비유, 은유적 표현을 사용해서 만든 이미지입니다.

챗GPT 달리3
가로 비율 사진. 모성애를 느끼는 어미 표범이 아기 사슴을 사랑으로 돌보고 있다.

이번에는 조금 더 어려운 표현을 사용해서 인물을 묘사해 보겠습니다.

챗GPT 달리3
가로 비율 이미지. 실제 사람의 외모. 긴 검은색 머리가 무심하게 어깨를 덮고 있는 소녀는 미스틱한 푸른 눈동자를 가지고 있다. 그 눈은 별빛이 스며든 깊은 바다같이 보이며, 그 안에는 수많은 비밀과 전설이 숨겨져 있는 듯하다. 그녀의 피부는 백야처럼 하얗게 빛나며, 그녀의 몸매는 가늘고 길게 뻗은 유연한 나무와 같다. 손목에는 중세 시대의 귀족들이 착용하던 것 같은 섬세한 금속 팔찌를, 귀에는 은색 귀걸이를 착용하고 있다. 그녀의 뒤에는 반투명한 날개가 천천히 움직이며, 그 날개에서는 은빛의 먼지가 흩날리고 있다. 그녀는 마법의 세계에서 온 것 같은 미스테리한 분위기를 풍긴다.

두 개의 예시 이미지에서 볼 수 있듯이, 챗GPT 달리3는 비유, 은유적 표현도 이미지로 잘 구현합니다.

두 번째 이미지에 사용된 프롬프트의 길이는 매우 긴 편임에도 불구하고 거의 모든 요소가 정확하게 반영되었습니다.

생성형 AI 모델의 한계에 대한 이해


생성형 AI 모델은 학습한 데이터를 기반으로 새로운 결과물을 생성합니다. 바꿔 말하면 충분히 학습되어 있지 않은 데이터는 결과물로 구현되기 어렵습니다.

달리3의 경우 프롬프트의 내용과 연관된 이미지가 충분히 학습되어 있지 않다면, 프롬프트가 구체적이더라도 원하는 이미지를 구현하기 어렵다는 한계가 있습니다.

지금부터 두 가지 예시를 보여드리겠습니다.

소파 팔걸이에 앉아 있는 사람

사람이 팔걸이에 앉아 있는 경우는 많지 않고, 그 모습이 사진으로 찍힌 경우는 더욱 없기에 이런 모습은 잘 구현하지 못합니다.

챗GPT 달리3
팔걸이가 있는 소파, 팔걸이에 앉아 있는 사람

대상을 동물로 바꾸면 구현 가능성이 조금은 높아지지만, 여전히 구현하기 어렵습니다.

챗GPT 달리3
팔걸이가 있는 소파, 팔걸이에 앉아 있는 강아지

부자연스러운 사람 손가락 표현

사람의 손가락을 자연스럽게 표현하지 못하는 것은 달리2 시절부터 이어진 달리의 고질적인 약점입니다.

사진을 얼핏 보면 이상함 점을 느끼지 못할 수도 있지만, 손가락 부분을 확대해서 자세히 보면 뭔가 어색한 경우가 많습니다.

아래 예시는 그나마 덜 이상한 예시이며 실제로는 기괴한 이미지도 많이 생성됩니다. 물론 자연스럽게 표현되는 경우도 있긴 합니다.

챗GPT 달리3
가로 비율 사진, 브이를 하고 있는 외국인 남성

엄지손가락이 부자연스럽고, 손가락 마디와 주름도 과장되어 있습니다.

챗GPT 달리3
가로 비율 사진, 유모차를 끌고 있는 한국인 여성

얼핏 보면 자연스러워 보이지만, 자세히 보면 오른손 엄지손가락이 과하게 꺾여 있습니다.

각 AI 모델별로 학습한 데이터가 다르기 때문에 서로 다른 한계점이 있으며, 이런 한계점을 이해하면 불필요한 시간 낭비를 줄일 수 있습니다.

다만, 구현이 잘되지 않는 부분은 사용자의 피드백을 통해 개선될 수 있습니다.

특히 사용자가 많은 달리3의 개선 속도는 굉장히 빠른 편입니다. 이전에 잘 구현하지 못했던 부분들도 어느 순간 갑자기 잘 구현되기 시작할 수 있습니다.

🛎️ 손가락이 잘 구현되지 않는 한계점을 보완하기 위해 뒷짐을 지게 하거나, 벙어리장갑을 끼우는 방법 등을 사용할 수 있습니다.

AI 이미지 생성 실력 향상 팁

지금부터는 AI 이미지 생성 실력 향상을 위해 반드시 필요한 이야기를 하고자 합니다.

영어를 잘 하려면 영어 단어를 잘 알아야 하듯이 AI 이미지 생성을 하기 위해서는 키워드를 많이 알아야 합니다.

예를 들어 클로즈업(Close Up) 키워드를 사용하면 더 가까운 느낌을, 오버헤드샷(Overhead Shot) 키워드를 사용하면 위에서 아래를 내려다보는 느낌을 줄 수 있습니다. (링크)

또한 장노출(Long Exposure), 이중 노출(Double Exposure)와 같은 스타일 키워드는 이미지의 분위기를 완전히 다르게 바꿀 수 있습니다. (링크)

이런 키워드를 익힐 수 있는 가장 좋은 방법은 무엇일까요? 저는 개인적으로 다른 유저가 만든 멋진 AI 이미지를 보고 그 이미지에 사용된 핵심 키워드를 확인한 후, 해당 키워드를 이용해서 직접 이미지를 만들어 보는 것이라고 생각합니다.

저는 네이버 AI 아티스트 모여라~! 카페를 운영하고 있습니다. 카페에는 다수의 AI 이미지와 이미지 생성에 사용된 프롬프트가 함께 공유되어 있습니다. 실력 향상을 원하시는 독자분께서는 많은 참여 부탁드립니다.

Leave a Comment