Image editing in Gemini just got a major upgrade
요약
상세 내용
새로운 'likeness maintenance' 기능은 사용자가 의상을 변경하거나(예: 60년대 비하이브 헤어스타일, 치와와에게 튜튜 입히기), 새로운 시나리오나 시대, 직업에 피사체를 배치하더라도 피사체의 외형적 특징을 일관되게 유지합니다. 이는 복잡한 이미지 변형 작업에도 불구하고 피사체의 본질적인 정체성을 보존하는 모델의 능력에 기반합니다.
제공되는 주요 편집 기능은 다음과 같습니다:
* Costume or Location Change (의상 또는 장소 변경): 인물이나 반려동물 사진을 업로드하면, 모델이 피사체의 'likeness'를 유지하면서 새로운 시나리오에 배치하거나 다른 의상, 직업, 시대로 변경할 수 있습니다.
* Blending Photos (사진 블렌딩): 여러 장의 사진을 업로드하여 하나의 새로운 장면으로 매끄럽게 블렌딩할 수 있습니다. 예를 들어, 사용자의 사진과 반려견의 사진을 결합하여 농구 코트에 함께 있는 장면을 만들 수 있습니다. 이는 복잡한 객체 분할(object segmentation) 및 합성(compositing) 기술을 통해 이루어질 것으로 보입니다.
* Multi-turn Editing (다단계 편집): 사용자는 Gemini가 생성하거나 편집한 이미지를 여러 단계에 걸쳐 지속적으로 수정할 수 있습니다. 예를 들어, 빈 방 사진에 벽 색깔을 칠하고, 이후 책장, 가구 또는 커피 테이블을 추가하는 등 이미지의 특정 부분을 변경하면서 다른 부분은 보존하는 반복적인 편집 워크플로우를 지원합니다. 이는 이미지의 잠재 공간(latent space) 내에서 특정 속성을 정교하게 조작하는 능력을 시사합니다.
* Mix Up Designs (디자인 혼합): 한 이미지의 스타일(색상, 질감, 패턴)을 다른 이미지의 객체에 적용할 수 있습니다. 예를 들어, 꽃잎의 색상과 질감을 레인부츠에 적용하거나, 나비 날개의 패턴을 드레스 디자인에 활용할 수 있습니다. 이는 고급 스타일 전이(style transfer) 또는 텍스처 매핑(texture mapping) 기술을 활용한 것으로 보입니다.
* Background Change (배경 변경): 방의 배경을 변경하여 새로운 벽지를 미리 보거나, 사용자를 상상할 수 있는 세계 어느 곳에나 배치할 수 있습니다.
편집된 이미지는 Gemini 앱 내에서 다시 업로드하여 재미있는 비디오로 변환할 수도 있습니다. 모든 AI 생성 또는 편집된 이미지는 가시적인 워터마크와 보이지 않는 SynthID 디지털 워터마크를 포함하여 AI 생성물임을 명확하게 표시합니다. "Nano Banana" 모델은 초기 프리뷰에서 "세계 최고 등급의 이미지 편집 모델"이라는 평가를 받았다고 합니다.