본문 바로가기
AI 그림 (Stable Diffusion)

스테이블 디퓨전 품질 프롬프트 효과가 있을까? 칠아웃믹스 실사 모델 테스트

by 포for
반응형

스테이블 디퓨전에 사용하는 프롬프트 중 품질에 대한 프롬프트가 많이 있다. 일반, 부정 프롬프트에 다 쓰인다.

 

일반 프롬프트에 쓰이는 것들은 masterpice, best quality, high quality, ultra quality, 4k, 8k 등등등 이 있고, 부정 프롬프트에 쓰이는 것은 low quality, normal quality, worst quality 등등등 이 있다.

 

돌리다보면 이게 효과가 얼마나 있는지 궁금할 때가 있다.

 

그래서 테스트를 해봤다.

 

모델: chilloutmix_NiPrunedFp32Fix

VAE: vae-ft-mse-840000-ema-pruned

기준 프롬프트: a woman is walking in city street

출력 사이즈: 512*768 (업스케일 안함)

 

 

테스트 1

a woman is walking in city street

 

부정 프롬프트: 없음

 

▶ 실사 모델의 대표주자 칠아웃믹스도 이런 결과물이 나온다. 구도는 그래도 잘 뽑는다. 저런 사진으로 학습을 했다는 것을 추측 할 수 있다.

 

 

 

테스트 2

masterpiece, best quality, high quality, a woman is walking in city street

 

부정 프롬프트: 없음

 

▶ 프롬프트에 붉은색 추가. 한결 나아졌으나 부족하다.

 

 

 

 

테스트 3

masterpiece, best quality, high quality, a woman is walking in city street

 

부정 프롬프트: low quality, worst quality, normal quality

 

▶ 테스트2에 사용한 프롬프트에 부정 프롬프트도 추가. 약간 나아진것 같지만, 테스트2에 비해서 훨씬 좋아졌다고 보기는 힘들다.

 

 

 

테스트 4

masterpiece, best quality, high quality, 8k, 4k, ultra quality, a woman is walking in city street

 

부정 프롬프트: nsfw, low quality, worst quality, normal quality

 

▶ 테스트3에 사용한 프롬프트 세트에서 붉은색 품질 프롬프트 추가. 큰 차이 없다. nsfw 안 붙이니까 속옷, 비키니가 여러개 나와서 nsfw 적용 버전으로 대체.

 

 

 

결론

- 품질 프롬프트는 적절하게 쓰면 효과가 있다. 하지만 이것도 2~3개 정도면 충분하다. 더 넣어봐야 차이가 없다.

- 부정 프롬프트에 사용하는건 잘 모르겠다. AI는 학습한 데이터에 기초한 결과물만 낸다는 것을 고려하면....애초에 모델 학습했던 사진들에 좋은 퀄리티라는 설명이 붙어 있었기 때문인 것으로 추정된다. 마음에 들지 않는 사진은 인터넷에 공개를 안했을 것이니 부정 프롬프트에 사용하는 low quality, worst quality, normal quality 같은 말은 아마 없었겠지.

 

 

댓글