본문 바로가기
AI 그림 (Stable Diffusion)

스테이블 디퓨전으로 AI그림 뽑기 한달 해보고 드는 단상

by 포for
반응형

스테이블 디퓨전을 알게되고, 이것으로 AI그림 뽑기를 한지 한달이 지났다.

 

웬만한 모델도 다 돌려봤고, 최근에 나온 컨트롤넷도 적용해봤다.

 

chat GPT 도 충격이었지만, 스테이블 디퓨전에 비할바가 아니었다.

 

아무래도 글보다는 눈에 들어오는 이미지를 만드는 것이기 때문인 것 같다. 아니면 글은 그래도 내가 좀 쓸 수 있지만, 그림은 그릴 수 없기 때문일 수도 있다.

 

가만히 보면 어색한 부분이 있지만, 단어 몇개 입력하면 몇초만에 그릴 수 있는 것 치고는 꽤 고퀄이다. 손으로 이정도 그리려면 몇년은 연습해야 한다.

 

스테이블 디퓨전... 콘텐츠 산업에 특이점이 왔다.


제한적이기는 하지만, 원하는 이미지를 뽑는 것이 너무 쉬워졌다. 물론 높은 품질의 이미지는 아직 힘들지만, 시간이 해결해 줄 것이고 그 시간은 년단위가 아니라 월 단위가 될 것 같다. 기술의 발전이 너무너무 빠르다.

 

하지만 아무리 그래도 여전히 쉽지 않은 것은 "무엇을 그릴 것이냐" 이다.


아이디어... chat GPT에게 물어볼 수 있지만, 그걸 그대로 가지고 와서 그림을 그린다면 그게 무슨 의미일까? 그렇게 그린 그림을 보며 신기함과 잠깐의 재미 이외에 어떤 느낌을 가질 수 있을까?

 

내가 원하는 것을 구체적으로 묘사하고, AI를 최대한 활용해서 원하는 수준으로 개선해가는 과정이 중요하다. 이것이 되어야 단기적인 신기함을 넘어 지속적인 행위로 질 수 있다. 모든 취미가 그러하듯.

 

컨트롤넷을 이용하면 캐릭터를 어디에 어떤 자세로 나오게 하는지도 지정할 수 있다. 동영상까지 나오는 것도 얼마 안남았다.

 

인공지능은 평범한 사무직 직장인인 나에게 어떤 영향을 미칠 것인가?

 

미래는 알 수 없지만, 지금 이 시점에서 한가지는 분명하다. 인공지능을 유용한 도구로서 활용할 수 있는지가 기준이 될 것이다.


어떤 일을 하는데 있어 나의 역할은 무엇인가.

 

아이디어를 떠올리고 구상하고, 이를 실현하는 사람인가? 아니면 그냥 주어진 일을, 해야하는 일을 실행하는 사람인가? 상황에 따라 다르겠지만, 대체로 어느 쪽에 속하기는 할 것이다.

 

전자는 주체적인 인간이고, 후자는 도구적인 인간이다.

 

전자에게 AI는 엄청나게 효율적인 도구가 될 것이고, 후자에게는 일자리를 빼앗는 무서운 터미네이터가 될 것이다.


AI가 자비스가 될지, 스카이넷이 될지는 결국 사용하는 인간에게 달렸다.

 

원하는 이미지가 딱 있네. 나만 느끼는건 아니구나. (이미지 출처: 금융경제신문)

 

 

댓글