Image editing in Gemini just got a major upgrade

요약

Gemini 앱에 Google DeepMind의 새로운 이미지 편집 모델이 통합되어, 사람과 반려동물의 일관된 모습을 유지하며 이미지를 편집하는 기능이 크게 개선되었습니다.

️ 이 업데이트는 의상이나 장소 변경, 여러 사진 블렌딩, 다중 턴 편집, 다른 이미지의 스타일 적용 등 다양한 고급 편집 기능을 제공합니다.

사용자는 피사체의 원래 모습을 유지하면서 창의적인 사진을 만들 수 있으며, 모든 생성 또는 편집된 이미지에는 AI 생성임을 나타내는 워터마크가 포함됩니다.

상세 내용

2025년 8월 26일, Gemini 앱의 이미지 편집 기능이 Google DeepMind의 새로운 이미지 편집 모델인 "Nano Banana"를 통해 대대적으로 업그레이드되었습니다. 이 업데이트의 핵심 목표는 인물과 반려동물 사진을 편집할 때 피사체의 일관된 'likeness'(모습 또는 특징)를 유지하는 것입니다. 개발팀은 이전 버전에서 발견되었던 미묘한 불일치를 개선하여, 사용자가 사진 속 인물이나 반려동물이 "자기 자신"처럼 보이면서도 다양한 편집을 할 수 있도록 집중했습니다.

새로운 'likeness maintenance' 기능은 사용자가 의상을 변경하거나(예: 60년대 비하이브 헤어스타일, 치와와에게 튜튜 입히기), 새로운 시나리오나 시대, 직업에 피사체를 배치하더라도 피사체의 외형적 특징을 일관되게 유지합니다. 이는 복잡한 이미지 변형 작업에도 불구하고 피사체의 본질적인 정체성을 보존하는 모델의 능력에 기반합니다.

제공되는 주요 편집 기능은 다음과 같습니다:

* Costume or Location Change (의상 또는 장소 변경): 인물이나 반려동물 사진을 업로드하면, 모델이 피사체의 'likeness'를 유지하면서 새로운 시나리오에 배치하거나 다른 의상, 직업, 시대로 변경할 수 있습니다.
* Blending Photos (사진 블렌딩): 여러 장의 사진을 업로드하여 하나의 새로운 장면으로 매끄럽게 블렌딩할 수 있습니다. 예를 들어, 사용자의 사진과 반려견의 사진을 결합하여 농구 코트에 함께 있는 장면을 만들 수 있습니다. 이는 복잡한 객체 분할(object segmentation) 및 합성(compositing) 기술을 통해 이루어질 것으로 보입니다.
* Multi-turn Editing (다단계 편집): 사용자는 Gemini가 생성하거나 편집한 이미지를 여러 단계에 걸쳐 지속적으로 수정할 수 있습니다. 예를 들어, 빈 방 사진에 벽 색깔을 칠하고, 이후 책장, 가구 또는 커피 테이블을 추가하는 등 이미지의 특정 부분을 변경하면서 다른 부분은 보존하는 반복적인 편집 워크플로우를 지원합니다. 이는 이미지의 잠재 공간(latent space) 내에서 특정 속성을 정교하게 조작하는 능력을 시사합니다.
* Mix Up Designs (디자인 혼합): 한 이미지의 스타일(색상, 질감, 패턴)을 다른 이미지의 객체에 적용할 수 있습니다. 예를 들어, 꽃잎의 색상과 질감을 레인부츠에 적용하거나, 나비 날개의 패턴을 드레스 디자인에 활용할 수 있습니다. 이는 고급 스타일 전이(style transfer) 또는 텍스처 매핑(texture mapping) 기술을 활용한 것으로 보입니다.
* Background Change (배경 변경): 방의 배경을 변경하여 새로운 벽지를 미리 보거나, 사용자를 상상할 수 있는 세계 어느 곳에나 배치할 수 있습니다.

편집된 이미지는 Gemini 앱 내에서 다시 업로드하여 재미있는 비디오로 변환할 수도 있습니다. 모든 AI 생성 또는 편집된 이미지는 가시적인 워터마크와 보이지 않는 SynthID 디지털 워터마크를 포함하여 AI 생성물임을 명확하게 표시합니다. "Nano Banana" 모델은 초기 프리뷰에서 "세계 최고 등급의 이미지 편집 모델"이라는 평가를 받았다고 합니다.

#AI #Image Editing #Gemini #Google DeepMind #Generative AI