스테이블 디퓨전 3 – 문장형 프롬프트 지원, 텍스트 렌더링 기능 추가


스테이블 디퓨전 3

Stability AI가 2/22(화) 공식 홈페이지를 통해 스테이블 디퓨전 3 모델을 공개했습니다. 현재는 Waitlist 등록 후 사용 권한을 받아 이용할 수 있습니다.

스테이블-디퓨전-3
Epic anime artwork of a wizard atop a mountain at night casting a cosmic spell into the dark sky that says "Stable Diffusion 3" made out of colorful energy

스테이블 디퓨전 3 개선 사항

스테이블 디퓨전 3는 기존 모델 대비 프롬프트를 이해하는 능력과 텍스트 렌더링 능력이 크게 향상되었습니다.

스테이블 디퓨전 공식 홈페이지와 Stability AI 창립자인 Emad Mostaque의 X에서 공개된 이미지 샘플을 보며 모델의 성능이 얼마나 향상되었는지 함께 살펴보겠습니다.

문장형 프롬프트

기존의 스테이블 디퓨전 모델은 문장 형태의 프롬프트를 정확하게 이해하지 못했습니다.

이에 여러 개의 단어를 쉼표로 구분하는 형태로 프롬프트를 구성해야 하는 불편함이 있었으나, 스테이블 디퓨전 3는 문장형 프롬프트도 잘 이해하고 이미지로 구현하는 것으로 보입니다.

스테이블-디퓨전-3
studio photograph closeup of a chameleon over a black background
스테이블-디퓨전-3
a painting of an astronaut riding a pig wearing a tutu holding a pink umbrella, on the ground next to the pig is a robin bird wearing a top hat, in the corner are the words "stable diffusion"

텍스트 렌더링

또한 사용자가 입력한 텍스트를 이미지로 구현하는 기능(=텍스트 렌더링)이 추가되었는데, 샘플 이미지를 보면 달리3, 미드저니의 텍스트 렌더링 기능을 능가하는 것으로 보입니다.

스테이블-디퓨전-3
스테이블-디퓨전-3

이미지 퀄리티

이미지 퀄리티 또한 기존 모델 대비 향상되었습니다. 특히 실제 사진과 같은 이미지를 생성하는 능력이 눈에 띄게 개선되었고, 기존보다 더욱 다양한 스타일의 이미지를 만들 수 있는 것으로 보입니다.

Screenshot 20240223 110803 X
Screenshot 20240223 110822 X
Screenshot 20240223 110321 X
Screenshot 20240223 110312 X 1
Screenshot 20240223 110331 X

이후 출시 예정 기능

창립자인 Emad Mostaque는 SD3 모델 출시 이후 Control, Composition, Collaboration 등 더욱 다양한 서비스가 제공될 것을 암시했습니다.

Screenshot 20240223 102625 KakaoTalk

게시물에 공개된 영상입니다. 이미지 편집 기능이 매우 우수하며, 이미지를 영상으로 변환하는 기능도 제공될 것으로 보입니다.

3D 모델링 기능 또한 제공될 예정입니다.

지금까지 스테이블 디퓨전 3 출시 소식과, 개선 사항이 반영된 이미지 샘플을 함께 보았습니다.

Stability AI 창립자인 Emad Mostaque가 본인의 X를 통해 스테이블 디퓨전 3 관련 정보를 공개 중입니다. 최신 정보는 그의 X에서 확인해 보시기 바랍니다.

Leave a Comment