티스토리 뷰

반응형

 

Dall·E로 그림 그리기

 

Dall·E라는 인공지능 AI을 활용한 서비스를 이용하여 그림을 그리는 방법을 알려드리고자합니다.

 

1. Dall·E 소개

Dall·E에 대해 소개합니다. Dall·E는 chat GPT와 마찬가지로 OpenAI사에서 개발한 딥러닝 기반 이미지 생성 모델입니다. Dall·E라는 이름은 20세기의 초현실주의 화가 살바도르 달리의 'Dali'와 픽사의 애니메이션 'WALL-E'를 결합한 것으로, 예술과 딥러닝의 융합을 의미한다고 볼 수 있습니다. 앞선 포스팅에서 살펴본 것처럼 chat GPT는 글이나 문서를 생성한다면 Dall·E는 이미지를 생성하는 능력을 갖추고 있습니다. 이미지를 입력하여 받아들이고, 해당 이미지에 대하여 글로 설명해주면 이를 바탕으로 이미지를 생성하는 능력을 갖고있습니다. 

 

2. Dall·E 작동방식

Dall·E에 사용된 기술을 바탕으로 작동방식을 알아봅시다. Dall·E의 핵심은 오토인코더(Autoencoder)와 생성적 적대 신경망(Generative Adversarial Network, GAN)입니다. 오토인코더란 입력 데이터를 압축하고 다시 복원하는 인코더(encoder)와 디코더(decoder)로 구성된 네트워크를 말합니다. 오토인코더를 통해 원본 이미지와 생성된 이미지 사이의 차이를 최소화하는 방향으로 학습을 합니다. 생성적 적대 신경망 GAN은 생성자(generator)와 판별자(discriminator)라는 두 개의 경쟁적인 신경망으로 구성됩니다. 생성자는 실제 이미지와 유사한 이미지를 생성하려고 하며, 판별자는 실제 이미지와 생성된 이미지를 구분하려고 합니다. 이렇게 생성자와 판별자가 경쟁하면서 점점 더 진짜와 구분하기 어려운 수준의 이미지를 생성하게 됩니다. 

Dall·E는 이러한 오토인코더와 생성적 적대 신경망 GAN의 개념을 결합하여 이미지를 생성합니다. 이전에 학습된 데이터셋에서 대규모로 훈련되었으며, 수백만 개의 이미지와 텍스트 설명을 사용하여 학습되었습니다. 이러한 대규모 학습으로 Dall·E는 사용자가 텍스트 설명을 입력하면 그에 따라 새로운 이미지를 생성할 수 있는 능력을 획득하였습니다. 

 

3. Dall·E 로 그림 그리는 방법

이제 Dall·E를 통해 AI로 그림을 그리는 방법을 알려드리겠습니다. chat GPT와 마찬가지로 인터넷 홈페이지에 Dall·E를 검색하면, openAI사를 통해 Dall·E에 접속하게 됩니다. 로그인은 chat GPT를 이용할 때 사용했던 아이디와 동일한 것을 사용할 수 있습니다. 이용 요금은 최소 단위가 15달러로, 115개 credits을 구매한 후 사용할 수 있습니다. 이제 달리에게 그림을 그리도록 텍스트를 입력해봅시다. "남자의 모습을 한 진주귀걸이를 한 소녀"라는 설명을 제공하면 Dall·E는 해당 설명에 맞는 이미지를 생성하여 그려줍니다. 

우리는 미술대학을 나오지 않았어도, 그림을 잘 그리지 못하여도 괜찮습니다. Dall·E에게 우리가 상상하는 세계의 모습을 말로 설명하면 그에 어울리는 이미지를 생성해주기 때문이지요. Dall·E는 스스로 그림을 그린다기보다는 우리 인간이 제공한 설명에 따라 이미지를 창조한다고 볼 수 있는 점이 참 흥미롭다고 생각합니다. 우리 인간의 상상력을 기반으로하여 이미지를 생성해주기 때문입니다. 그러나 당연하게도 생성된 이미지는 항상 우리가 원하는 이미지와 일치하지 않을 수 있습니다. 때로는 제공한 설명에 충실하지 못하거나 일관성이 없는 결과물이 나올 수도 있습니다. 그러나 이 또한 추가적인 설명을 제공함으로써 보완할 수도 있으며, Dall·E가 생성한 결과물을 보고 새로운 영감을 받는 또다른 상호작용을 기대해볼 수도 있습니다. 그러나 인공지능 분야 대부분의 영역이 그렇듯, 사용자 수가 증가하고 사용 데이터가 쌓이면서 미래에는 더 발전된 버전의 Dall·E가 등장할 것입니다. 이는 곧 창작 작업, 예술활동, 디자인, 시각적인 창의성을 증대하는 활동 등 다양한 분야에 많은 영감을 줄 수 있는 똑똑한 인공지능 서비스를 이용할 수 있다는 기대감을 줍니다. 

반응형