요즘 핫한 이미지ai 두개 분?석
완벽하진 않아도, 로고랑 헤드폰 형태, 캐릭터 디테일이 어느정도 유지되는 수준까지 왔습니다.
이전에는 헤드폰 이미지, 캐릭터 주더라도 엉뚱한 모양의 헤드폰과 머리색깔만 똑같은 다른 캐릭터를 뿜어냈는데, 이젠 캐릭터의 디테일과 헤드폰 형태가 잘 유지됩니다.
헤드폰을 캐릭터 이미지에 씌우는건 헤드폰의 원본 형태를 충분히 이해한 상태로 각도, 착용 형태가 다르면서도 원본 헤드폰의 형태와 동일한 이미지로 재해석해내야 하는것이 필요한데, 이부분이 매우 훌륭합니다.
반면 동일한 이미지와 프롬프트를 구글 gemini 2.0 flash image(포토샵 ai로 유명하죠) 에게 던져준 결과, 캐릭터 원본의 디테일은 거의 원본 수준으로 살리는 반면, 헤드폰을 뭔 m50x로 갈아치웠습니다. 또 케이블은 어디로...?
ai가 직접 포샵질을 따로 하는게 아니고 원본 이미지를 기반으로 처음부터 생성하는 요 모델의 특성상 캐릭터 짤의 디테일이 저정도로 유지되는건 놀랍지만, 헤드폰이 완전 달라져버린건 아쉽습니다.
또 원본 캐릭터 짤보다 더 크게 확장된 이미지를 뱉어냈는데, 하필이면 그부분이 팔 부분이라 자세히 보면 손도아닌 머리카락도 아닌 이상한 이미지가 되어버린점도 약간 아쉽습니다. 그냥 원본사이즈로 하면 되는거 아닌가...?
속도가 빨라서 여러번 재시도가 가능한 특성을 이용해 여러번 헤드폰 모양을 지적하며, 원본 헤드폰 모양과 동일하게 다시 헤드폰을 원본 이미지처럼 그려달라 요청했지만, 계속 엉뚱한 헤드폰을 그려댔고요...
원본
ai합성 결과물
전에 Gemini 2.0 flash image로 인게임 칭호 이미지의 텍스트를 다른 글자로 합성해달라고 했을때는, 몇번의 시행착오 후 원본 텍스트의 폰트와 디자인을 그대로 유지하며 훌륭한 결과물을 뽑아냈는데, 아직 헤드폰을 씌우는 정도의 재해석까진 불가능한것으로 보입니다.
만약 이미지의 텍스트를 자연스럽게 조작해 짤을 만들어내는 경우 gemini 2.0 flash image 쪽이 매우 유용할듯 싶습니다.
+실사이미지는 안해봐서 모릅니다. 제 갤러리엔 진짜 사람 사진이 거의 없어서.....
결론!
원본 이미지를 기반으로 재해석하는건 gpt가 우위.
gemini 2.0 flash image의 경우, 원본 이미지에 약간의 변형을 가하는 편집, 특히 텍스트 출력 결과의 깔끔함은 매우 우수하지만, 헤드폰을 씌우는 식의 재해석이 필요한 경우 엉뚱한걸 뱉어냄.
Comment 18
Comment Write

채찍피티, 너어... ㅂㄷㅂㄷ

그냥 가리는 게 낫다..?


본인 사진을 올려서 뭔가 하려는 용기에 박수를 보냅니다.

그냥 올리기에는 너무 흉측한지라 폰에서 ts 씌워 올려도 gpt가 발작을 일으키는거 같습니다 ㅠ





아, 이제야 말귀를 알아먹네요 ㄷㄷㄷ
혐짤 주의
역시 잘 생기고 볼 일입니다. ㅠㅠ

GPT 예제는 좌우채널 선이 Y스플리터 없이 따로있는데, LR 모노모노로 연결해서 크로스토크까지 줄이려고 했군요, GPT녀석 뭘 아는구만 (?)
근데 제가 던져준 이미지엔 스플리터가 안보여서 이정도는 넘어가줘도 될것같습니당


오 ai가 정말 대단하군요 ㄷㄷ