Grounding World Simulation Models in a Real-World Metropolis

Paper

Grounding World Simulation Models in a Real-World Metropolis

2026.03.18

·Web·by 네루

#Computer Vision#Generative AI#RAG#Video Generation#World Model

핵심 포인트

1Seoul World Model (SWM)은 수백만 장의 street-view 이미지를 RAG에 활용하여 서울의 실제 풍경을 수 킬로미터에 걸쳐 충실하게 렌더링하는 도시 규모의 World Model입니다.
2이 모델은 실제 데이터와 CARLA 시뮬레이터의 합성 데이터를 통합하여 보행, 차량, 자유 카메라 이동 등 다양한 trajectory를 지원하며, cross-temporal pairing 및 view interpolation 기법으로 robustness를 확보합니다.
3SWM은 긴 길이의 영상 생성에서 발생하는 오류 누적을 방지하기 위해 Virtual Lookahead Sink라는 새로운 기법을 도입하여, 미래 위치의 retrieved 이미지를 통해 지속적으로 생성을 re-grounding하여 안정성을 크게 향상시켰습니다.

Grounding World Simulation Models in a Real-World Metropolis

Paper

Grounding World Simulation Models in a Real-World Metropolis

2026.03.18

·Web·by 네루

#Computer Vision#Generative AI#RAG#Video Generation#World Model

핵심 포인트

1Seoul World Model (SWM)은 수백만 장의 street-view 이미지를 RAG에 활용하여 서울의 실제 풍경을 수 킬로미터에 걸쳐 충실하게 렌더링하는 도시 규모의 World Model입니다.
2이 모델은 실제 데이터와 CARLA 시뮬레이터의 합성 데이터를 통합하여 보행, 차량, 자유 카메라 이동 등 다양한 trajectory를 지원하며, cross-temporal pairing 및 view interpolation 기법으로 robustness를 확보합니다.
3SWM은 긴 길이의 영상 생성에서 발생하는 오류 누적을 방지하기 위해 Virtual Lookahead Sink라는 새로운 기법을 도입하여, 미래 위치의 retrieved 이미지를 통해 지속적으로 생성을 re-grounding하여 안정성을 크게 향상시켰습니다.