AI로 손 하나 까딱 안하고 그림그리기-StableDiffusion과 DALL-E
요즘 정말 AI가 아주 많이 핫한 것 같습니다. 2-3년 전에 개발자분들이 딥러닝, 인공지능 AI 배워야 한다고 많이 강조하시던 걸 들었었는데 결국 AI가 몇년 사이에 엄청 뛰어난 성능을 보여서 감탄하고 있습니다. 그래서 오늘 주제는 ‘AI로 그림 그리는 방법’ 입니다.
이제 AI 글도 알아서 써주고 이미지도 알아서 그려주니, 포스팅도 참 편하게 할 수 있어서 좋은 것 같습니다. 물론 많은 일자리가 AI 인공지능으로 대체되는 것은 필연적이라 슬프기도 하지만 말입니다. 그저 바라는 게 있다면, 계속 좋은 방면으로 발전해서 악용하는 사람들만은 없기를 바랍니다.
StableDiffusion 소개
StableDiffusion은 OpenAI에서 최근 발표한 인공지능 모델 중 하나입니다. 이 모델은 시계열 데이터 분석에 사용되는 딥러닝 모델로, 과거와 현재의 데이터를 기반으로 미래를 예측할 수 있습니다.
StableDiffusion은 Diffusion Models이라는 기술을 활용하여 구현되었습니다. Diffusion Models은 과거와 현재의 데이터를 이용해 확률 분포를 구성하고, 이를 토대로 미래를 예측하는 방법입니다. 이 방법은 GAN(Generative Adversarial Networks)과 같은 다른 딥러닝 모델과 비교하여 안정적이고 일관된 결과를 생성할 수 있으며, 데이터 샘플의 누락이나 손상에도 강건하게 대처할 수 있습니다.
StableDiffusion은 이러한 Diffusion Models을 개선하여 고차원적인 데이터를 다룰 수 있도록 하였습니다. 또한 모델 학습 시에는 큰 데이터셋을 이용하여 강력한 일반화 성능을 보입니다. 이를 통해 예측 모델의 성능을 향상시킬 수 있습니다.
StableDiffusion은 시계열 데이터 예측 외에도 다양한 응용 분야에서 사용될 수 있습니다. 예를 들어, 이미지 생성 및 완성, 자연어 처리 등에도 적용 가능합니다. 또한 이 모델은 공개된 라이브러리로 제공되어, 누구나 사용해볼 수 있습니다.
사용방법은 원하는 이미지를 영어로 설명하면 AI가 묘사한 텍스트를 보고 이미지를 그려줍니다. 4컷으로이미지가 생성이 되는데요. 텍스트를 상세히 써주는 게 아무래도 퀄리티를 좌우하지 않을까 싶습니다.
하단은, 제가 Stable Diffusion Playground에서 직접 사용해서 만들어본 이미지 입니다. 저는 뉴비라서 글로 설명하는 게 많이 부족한 것 같습니다. 결과로 나온 이미지들이 여러번 다시 텍스트를 수정해서 검색해도기괴하고 못생기게 나오네요. 다른 블로거들이 만드신 이미지 보면 되게 아름답던데 말입니다.
더 좋은 퀄리티를 뽑아내려면 많은 수련이 필요한가 봅니다.
그럼 제가 만든 사진들을 한번 감상해 볼까요?
1. 마술봉을 든 닥터스트레인지 복장을 한 데이비드 컴버배치 – StableDiffusion
사이즈: 512 x 512 용량: 60kb
의외로 닥터스트레인지 닮게 잘 나온 그림들이네요! AI가 그린 그림은 보통 눈이 이상하더라구요. 저작권 때문인지 눈이 뭉게지거나 눈동자가 외계인처럼 까맣고 엄청 크던가 말이에요. 이 그림들은 제법 닥터스트레인지 같아서 좋습니다. ㅎㅎ 하지만 마술봉이 많이 아쉽네요. 마법효과 1도 없는 평범하나 아이스크림 막대기처럼 보이는군요.
맘에 안들면 텍스트를 수정하든지 다시 generate image 버튼을 누르면 되는데요. 얼굴이 기괴하긴 합니다. 일부러 포토샵에서 손으로 뭉개놓은 것 같은 얼굴이네요.
2. stranger things 의 일레븐 – StableDiffusion
스띵의 일레븐도 한번 만들어 보았는데요. 첫번째 그림은 좀 비슷한것 같네요. 근데 데모고르곤과 싸우기를 원했는데, 그냥 일레븐만 그려놔서 너무 아쉽습니다.
사이즈: 512 x 512 용량: 60kb
3. 수퍼마리오 그리기 – StableDiffusion
대박! 역시 2D로 된 캐릭터라서 그런걸까요? 수퍼마리오라고 검색하니까 거의 실제캐릭터와 똑같은 수퍼마리오를 그려주네요. 근데 이거 너무 똑같이 그려놨는데 저작권이 없는 게 맞을까요?
누군가 아시면 알려주세요.
사이즈: 512 x 512 용량: 60kb
DALL-E 소개
DALL-E는 OpenAI에서 개발한 딥러닝 모델로, 이미지 생성과 조작을 수행하는 인공지능 기술입니다. DALL-E는 “Dali”와 “Wall-E”라는 두 영화의 이름을 합쳐 만들어졌으며, 이름 그대로 더 나은 이미지 생성과 이해를 위해 딥러닝 모델과 기술을 결합한 것입니다.
DALL-E는 이미지 생성과 조작을 위해 GPT-3와 비슷한 Transformer 아키텍처를 사용합니다. 하지만 GPT-3와 달리, DALL-E는 이미지를 생성하고 조작하는 데 특화된 레이어와 메커니즘을 포함하고 있습니다.
DALL-E의 특징 중 하나는, 텍스트로 주어진 지시사항을 기반으로 이미지를 생성할 수 있다는 것입니다. 예를 들어 “새벽녘에 노란 색 양털을 가진 늑대가 산에서 노란 꽃을 먹고 있다”라는 문장을 입력하면, DALL-E는 이에 맞는 이미지를 생성할 수 있습니다.
또한 DALL-E는 이미지 조작도 가능합니다. 예를 들어, “노란색 헤어스타일의 개를 파란색으로 바꿔주세요”라는 요청을 하면, DALL-E는 해당 이미지에서 개의 헤어스타일 색상을 파란색으로 변경할 수 있습니다.
DALL-E는 자연어 처리와 컴퓨터 비전 분야에서의 중요한 발전을 이루고 있으며, 현재는 연구 및 개발 단계에 있습니다.
1. 마술봉을 든 닥터스트레인지 복장을 한 데이비드 컴버배치 – Dall-E
달리에서도 똑같이 닥터스트레인지를 검색해 보았으나 그림이 너무 저 퀄리티라 3d art를 뒤에 붙여서
검색해보았습니다.
사이즈: 1024 x 1024 용량: 1.6MB
제법 멋있게 그림 결과물이 나왔습니다. Stable Diffusion은 닥터스트레인지 얼굴도 비슷하게 뽑았는데, 달리는 다른 얼굴인데 더 미남으로 그려줬군요. 굿잡!
2. 기묘한이야기의 일레븐- Dall-E(달리)
이건 뭔가 웃기네요. Stranger things 라고 쓰면 저작권 걸릴까봐 이상한 글자로 나옵니다.
사이즈: 1024 x 1024 용량: 1.6MB
3. 수퍼마리오 -Dall-E
수퍼마리오 닮은 결과물이 나왔습니다. 그냥 수퍼마리오라고 치면 발로 스케치북에 낙서한 것 같은 퀄리티가 나와서 3d art 라고 뒤에 붙여줬더니 비슷하게 그려졌네요. Dall-E 수퍼마리오는 로고도 다르고 저작권 안 걸릴 것 같네요.
사이즈: 1024 x 1024 용량: 1.6MB
AI이미지 만드는 사이트인 Stable diffusion 과 Dall-E 를 비교해 보았습니다. 여러분은 어떤 플랫폼이 더 마음에 드시나요? 저는 뭐가 더 낫다고 아직 확신할 수는 없지만, 일단 Dall-E가 이미지 용량 이랑 사이즈가 더 커서 작업할 때 더 유용할 것 같네요.
검색할 때 설명을 자세하고 상세하게 해서(유화, 수채화, 페인팅 처럼 회화기법도 넣기) 더 훌륭한 그림을 직접 만들어보시길 바래요.
녹색건축인증(G-SEED)의 인증 의무 적용대상 및 인증 비용
장애물없는 생활환경 인증(BF인증) 뜻 – 인증 사례에 대해서알아보자