[외부 콘텐츠 소개] Stable Diffusion AI: 텍스트 한 줄이 이미지를 만든다.

최근에 인공지능 커뮤니티를 뜨겁게 달구고 있는 모델들 중의 하나는 “Stable Diffusion”입니다. 이 모델은 문장으로 구성된 텍스트를 입력하면 그 내용에 적합한 이미지를 자동으로 생성하죠.

아래의 그림들은 Stable Diffusion 모델을 써서 생성해 낸 것들입니다.

Diffusion의 과정을 정리하고 이해하기 위해서는 수학적 설명을 차근차근 따라가야 하지만, 전체적인 개념을 먼저 잡는 것이 디테일을 이해하는 데 큰 도움이 됩니다.

아래의 링크의 글은 Stable Diffusion의 개념을 수학적 notation을 사용하지 않고도 아주 재미있게 설명하고 있습니다.

Stable Diffusion AI: 텍스트 한 줄이 이미지를 만든다

  • “시작 이미지에서 계속 곱해진 markov 연산을 안다면, 반대로 noise 이미지에서 inverse function을 통해 시작 이미지로 되돌릴 수도 있습니다. Diffusion model은 이러한 선형대수적 성질을 이용하여, 나중에 어떠한 이미지를 생성해야 할 때가 되면 이전에 학습했던 noise -> image 연산을 이용해서 무에서 유를 창조하게 되는 것입니다.”
  • “latent space를 설명하면서, 많은 데이터들을 특징별로 구분짓는 공간이라고 했습니다. Latent는 어떤 데이터의 속성 정도를 의미한다고 보시면 됩니다. 따라서, latent diffusion model은 원본 이미지에 대해서 diffuse하는 것이 아니라, 원본 이미지의 latent vector에 대해서 diffuse를 하게 되는 것입니다.”

코멘트

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다