AI 그림 그리기 필수 용어 7가지 – AI 이미지 생성 모델, 프롬프트, 업스케일, 시드번호, 인페인팅, 아웃페인팅, 텍스트 렌더링

이번 포스팅에서는 현시점 가장 대표적인 AI 이미지 생성 모델을 간략히 소개한 후, AI 이미지 생성 분야에서 자주 사용되는 주요 용어들에 대해 설명하겠습니다.

각 용어를 깊게 파고들기보다는, 용어를 처음 접하는 초보자도 쉽게 이해할 수 있도록 최대한 간단하고 명료하게 설명하는 데 주점을 두겠습니다.

1. AI 이미지 생성 모델

문자 그대로 AI 이미지를 생성할 수 있는 모델입니다. 현재 AI 이미지 생성 분야의 가장 대표적인 세 가지 모델은 달리3, 미드저니, 스테이블 디퓨전입니다.

달리3

2023년 9월 말 출시된 달리3는 챗GPT를 개발한 OpenAI의 AI 이미지 생성 모델입니다. 달리3는 챗GPT, MS 디자이너의 이미지 크리에이터, MS 코파일럿 등 다양한 소프트웨어에 탑재되어 있습니다.

한글 지원이 되며, MS 디자이너의 이미지 크리에이터에서 무료로 이용할 수 있는 달리3는 AI 이미지 생성 분야의 진입장벽을 크게 낮췄습니다.

특히 사용자가 입력한 프롬프트의 세부 요청사항을 정확하게 이해하고, 이미지로 구현하는 부분에 있어 다른 모델 대비 월등히 뛰어난 성능을 자랑합니다.

AI 이미지 생성
달리3 - 유튜버 평범한사업가님 구독자 10,000명 축전

미드저니

미드저니는 생성되는 이미지의 예술성이 뛰어나며, 제공되는 명령어와 기능이 다양합니다. 특히 제공되는 다양한 기능을 통해 이미지 생성 이후 후속 작업이 용이합니다.

미드저니는 최근 V6 모델 출시와 함께 기존에도 뛰어났던 사실적인 이미지를 만드는 능력이 이제는 미드저니로 만든 이미지를 실제와 구분하기 어려울 정도로 더욱 업그레이드되었습니다.

AI 이미지 생성
미드저니 V6

스테이블 디퓨전

스테이블 디퓨전은 사용 난이도가 매우 높은 모델입니다. 스테이블 디퓨전에서는 사용자가 직접 모델을 학습시켜서 원하는 화풍이나 스타일의 이미지를 만들 수 있습니다.

또한 다양한 설정값을 입맛에 맞게 조절해서 이미지를 생성할 수 있고, 이미지 생성 이후 진행할 수 있는 후속 작업의 범위도 가장 넓습니다.

AI 이미지 생성
다양한 설정값을 조정할 수 있습니다

스테이블 디퓨전은 사용자의 컴퓨터에 프로그램을 설치해서 무료로 사용할 수 있습니다. 다만 로컬 환경에서 원활하게 사용하기 위해서는 일정 수준의 이상의 그래픽 카드가 필요합니다. (가장 대중적인 그래픽 카드 : NVIDIA GeForce RTX 3060)

스테이블 디퓨전을 클라우드 서버를 통해 사용할 수 있는 서비스도 존재합니다. Rundiffusion이라는 서비스를 통해 스테이블 디퓨전을 30분간 무료로 이용해 볼 수 있습니다.

AI 이미지 생성
스테이블 디퓨전에서만 가능한 작업

2. 프롬프트

AI 분야에서 프롬프트는 명령어를 의미합니다. AI 이미지 생성 모델은 사용자가 입력한 프롬프트에 맞게 이미지를 생성합니다. 프롬프트는 일반적으로 텍스트 프롬프트를 의미합니다.

AI 이미지 생성

네거티브 프롬프트

네거티브(부정적인)라는 뜻에서 유추할 수 있듯이, 이미지에 포함되지 않았으면 하는 사물, 색상 등을 제외하는 것을 요청하는 프롬프트를 의미합니다.

다수의 AI 이미지 생성 모델은 네거티브 프롬프트를 입력할 수 있는 입력창을 별도로 제공합니다. 미드저니의 경우 --no 명령어(Ex --no blue, tree)가 네거티브 프롬프트와 동일한 역할을 합니다.

AI 이미지 생성
네거티브 프롬프트 입력창이 별도로 구분된 예시

이미지 프롬프트

미드저니, 스테이블 디퓨전을 포함한 일부 모델은 사용자가 업로드한 이미지와 유사한 이미지를 생성하는 기능을 제공합니다. 이때 사용되는 이미지를 이미지 프롬프트라고 합니다.

AI 이미지 생성

이미지 프롬프트는 주로 텍스트 프롬프트와 함께 사용되지만, 텍스트 프롬프트 없이 두 개 이상의 이미지만으로 새로운 이미지를 생성하는 것도 가능합니다.

이미지를 이용해서 새로운 이미지를 만드는 방식을 Image to image라고 부릅니다. 이 용어는 img2img 또는 i2i로 짧게 불리기도 합니다

역 프롬프팅

AI 이미지 생성에 사용할 프롬프트를 AI로부터 역으로 제공받아 이미지를 생성하는 방식입니다.

챗GPT나 MS 코파일럿과 같이 이미지 인식 기능이 있는 AI 챗봇에 사용자가 이미지를 업로드한 후, 이미지를 분석시키면, AI로부터 해당 이미지를 상세하게 묘사한 프롬프트를 제공받을 수 있습니다.

AI 이미지 생성
아주 간단한 역프롬프팅 예시

이렇게 확보한 프롬프트를 다시 AI 이미지 생성 모델에 입력하면, 업로드한 원본 이미지와 유사한 이미지를 생성할 수 있습니다.


3. 업스케일


업스케일은 이미지의 해상도를 향상시키는 기술로, 이미지 내의 픽셀 사이에 추가적인 픽셀을 삽입하는 방식으로 작동합니다. 이 기술은 원본 이미지의 품질을 유지하면서 이미지를 더 선명하고 더 크게 만들기 위해 사용됩니다.

미드저니에는 최근 업스케일과 동시에 이미지를 창의적으로 변형해 주는 Upscale Creative 기능도 출시되었습니다.

AI 이미지 생성
미드저니 Upscale Creative 기능

두 이미지 사이에 차이가 없어 보이지만, 자세히 보면 머리카락이 조금 더 정돈되었고, 속눈썹과 쇄골의 표현이 조금 더 자연스러워진 것을 알 수 있습니다.

4. 시드번호

시드번호는 Seed(씨앗)라는 뜻에서 알 수 있듯이 특정 이미지의 근간이 되는 번호입니다. AI 이미지를 생성하면 해당 이미지에 시드 번호가 부여되며, 동일한 시드 번호를 이용해서 이미지를 생성하면 일관성, 연속성 있는 이미지를 만들 수 있습니다.

달리3 모델이 탑재된 챗GPT에서는 시드번호를 활용해서 일관성, 연속성 있는 이미지를 손쉽게 만들 수 있습니다.

AI 이미지 생성
시드번호를 활용한 일관성, 연속성 있는 이미지 생성 예시

5. 인페인팅

인페인팅은 이미지 내 특정 영역을 AI 기술을 활용하여 편집하는 기능입니다.

AI 이미지 생성

사용자가 특정 영역을 선택한 후 텍스트 프롬프트를 입력하면, AI 모델은 선택된 영역에 프롬프트에 부합하는 새로운 이미지를 생성합니다. 이때 새롭게 생성되는 이미지는 선택된 영역의 나머지 부분과 자연스럽게 조화되도록 디자인됩니다.

텍스트 프롬프트 입력 없이 특정 영역을 선택한 후 삭제하는 것도 가능합니다. 이 경우에도 마찬가지로 선택되지 않은 영역과 조화되는 이미지를 AI가 생성합니다.

6. 아웃페인팅

아웃페인팅은 이미지의 바깥 부분에 배경이나 새로운 요소를 추가하는 AI 기술입니다.

AI 이미지 생성

일반적으로 배경이나 새로운 요소가 추가되며 이미지의 사이즈도 덩달아 증가됩니다.

미드저니에서는 이미지의 크기를 유지하면서, 원본 이미지의 콘텐츠를 축소하고, 축소되고 남은 공간에 이미지가 추가하는 줌 아웃 형태의 아웃페인팅도 제공됩니다.

7. 텍스트 렌더링

텍스트 렌더링은 사용자가 입력한 텍스트 프롬프트를 이미지로 구현하는 AI 기술입니다.

AI 이미지 생성
Happy Birthday James! 케이크

텍스트 렌더링 기능은 Ideogram과 달리3에 가장 먼저 적용되었고, 미드저니도 V6 모델 출시와 함께 텍스트 렌더링 기능이 추가되었습니다.

현재 텍스트 렌더링 기능이 완벽하게 구현되는 모델은 없습니다. 2024년 초 기준, 위에 언급한 모델들은 영어 사전에 등재된 단어로 구성된 짧은 문장을 어느 정도 정확하게 이미지로 구현하는 편입니다.

다만, 요청 문장이 길거나 사전에 없는 단어가 포함된 경우 제대로 구현하지 못할 확률이 매우 높습니다.

향후 AI 모델이 더 많은 데이터를 학습함에 따라, 더욱 복잡한 영어 문장을 정확하게 구현할 수 있을 것으로 기대됩니다. 장기적으로는 영어 외 다른 언어도 이미지로 구현할 수 있을 것으로 예상됩니다.


지금까지 AI 이미지 생성 분야에서 자주 사용되는 주요 용어에 대해 함께 살펴보았습니다. 각 용어에 대한 더욱 상세한 장보는 포스팅 본문의 링크를 통해 확인하실 수 있습니다.

저는 AI 이미지와 영상 관련 정보를 전문으로 다루는 네이버 AI 아티스트 모여라~! 카페를 운영 중입니다. 이 분야에 관심이 있는 독자분들의 많은 관심과 참여를 부탁드립니다.

1 thought on “AI 그림 그리기 필수 용어 7가지 – AI 이미지 생성 모델, 프롬프트, 업스케일, 시드번호, 인페인팅, 아웃페인팅, 텍스트 렌더링”

Leave a Comment