Image generation (experimental) · Ollama Blog
Blog

Image generation (experimental) · Ollama Blog

2026.01.21
·Web·by 이호민
#Image Generation#AI#Ollama#Text-to-Image#Models

핵심 포인트

  • 1Ollama가 macOS에서 이미지 생성을 지원하기 시작했으며, 이를 위한 두 가지 주요 모델을 소개합니다.
  • 2주요 모델로는 사실적인 이미지를 생성하고 이중 언어 텍스트를 렌더링하는 Z-Image Turbo와 UI mockups 및 텍스트 표현에 강한 FLUX.2 Klein이 있습니다.
  • 3사용자는 이미지 크기, steps, random seed, negative prompts 등의 파라미터를 통해 이미지 생성을 맞춤 설정할 수 있으며, 향후 다른 OS 및 추가 모델, 이미지 편집 기능이 예정되어 있습니다.

Ollama는 macOS에서 이미지 생성 기능을 지원하며, Windows 및 Linux 지원은 곧 출시될 예정임을 발표했습니다. 사용자는 ollama run x/z-image-turbo "your prompt"와 같은 명령어를 통해 프롬프트로부터 이미지를 생성할 수 있으며, 생성된 이미지는 현재 디렉토리에 저장됩니다. Ghostty, iTerm2 등 이미지 렌더링을 지원하는 터미널에서는 이미지를 인라인으로 직접 미리 볼 수 있습니다.

주요 이미지 생성 모델은 다음과 같습니다:

  1. Z-Image Turbo:
    • Alibaba’s Tongyi Lab에서 개발한 6 billion parameter text-to-image model입니다.
    • 주요 특징은 photorealistic 이미지를 생성하는 강력한 능력과 English 및 Chinese bilingual text rendering을 정확하게 처리하는 것입니다.
    • 이 모델은 photorealistic 인물 사진, 풍경, 그리고 중국어 서예와 같은 창의적인 구성을 포함한 다양한 시나리오에 적합합니다.
    • Apache 2.0 라이선스로 제공되어 commercial use가 가능하며, open weights입니다.
  1. FLUX.2 Klein:
    • Black Forest Labs의 가장 빠른 image-generation model로, 4B 및 9B parameter sizes로 제공됩니다.
    • 이 모델은 이미지 내의 readable text 처리에 강점을 보여 UI mockups 및 typography가 포함된 디자인에 특히 유용합니다.
    • 4B model은 Apache 2.0 라이선스로 fully open for commercial use가 가능합니다.
    • 9B model은 FLUX Non-Commercial License v2.1이 적용됩니다.
    • 예시로는 "OPEN 24 HOURS"와 같은 neon sign text rendering과 matte black coffee tumbler와 같은 product photography가 있습니다.

이미지 생성 과정은 여러 parameters를 통해 customize할 수 있습니다.

  • Image location: 생성된 이미지는 기본적으로 현재 디렉토리에 저장되며, 터미널에서 디렉토리를 변경하여 저장 위치를 바꿀 수 있습니다.
  • Image sizes: /set width/set height 명령어를 사용하여 이미지의 width와 height를 조절할 수 있습니다. 작은 이미지는 더 빠르게 생성되고 더 적은 memory를 사용합니다.
  • Number of steps: steps는 model이 실행하는 iterations 수를 제어합니다. Fewer steps는 더 빠르지만 덜 detailed한 이미지를 생성하며, too many steps는 artifacts를 유발할 수 있습니다. Ollama는 각 model에 대해 recommended step count를 기본값으로 사용합니다.
  • Random seed: reproducible results를 위해 random seed를 설정할 수 있습니다. 이는 특정 subject를 반복적으로 생성하거나 정확한 output을 공유할 때 유용합니다. 동일한 prompt라도 다른 seeds는 다른 이미지를 생성합니다.
  • Negative prompts: negative prompts는 model에게 이미지에 포함되기를 원하지 않는 요소를 지시하여 생성 과정을 guide합니다.

향후 계획으로는 Windows 및 Linux 지원 확대, additional image generation models 추가, 그리고 image editing 기능 도입 등이 언급되었습니다.