Paper

Mamba-3: Improved Sequence Modeling using State Space Principles

Albert Gu

2026.03.19

·Arxiv·by 이호민

#Inference Efficiency#LLM#Mamba#Sequence Modeling#State Space Models

핵심 포인트

1Mamba-3는 State Space Model (SSM) 관점에서 세 가지 핵심 방법론을 도입하여, LLM의 inference 효율성과 모델 품질을 동시에 향상시키는 것을 목표로 합니다.
2이 모델은 더 표현력 있는 Exponential-Trapezoidal Discretization, 풍부한 상태 추적을 위한 Complex-valued State Space Model, 그리고 decode latency 증가 없이 성능을 개선하는 Multi-Input, Multi-Output (MIMO) SSM을 결합합니다.
3Mamba-3는 언어 모델링 정확도를 크게 향상시키고, Mamba-2가 해결하지 못했던 합성 state-tracking 작업을 성공적으로 수행하며, hardware utilization을 개선하여 성능-효율성 Pareto frontier를 발전시켰습니다.

O(\Delta_t^3)

Paper

Albert Gu

2026.03.19

·Arxiv·by 이호민

#Inference Efficiency#LLM#Mamba#Sequence Modeling#State Space Models

1Mamba-3는 State Space Model (SSM) 관점에서 세 가지 핵심 방법론을 도입하여, LLM의 inference 효율성과 모델 품질을 동시에 향상시키는 것을 목표로 합니다.
2이 모델은 더 표현력 있는 Exponential-Trapezoidal Discretization, 풍부한 상태 추적을 위한 Complex-valued State Space Model, 그리고 decode latency 증가 없이 성능을 개선하는 Multi-Input, Multi-Output (MIMO) SSM을 결합합니다.
3Mamba-3는 언어 모델링 정확도를 크게 향상시키고, Mamba-2가 해결하지 못했던 합성 state-tracking 작업을 성공적으로 수행하며, hardware utilization을 개선하여 성능-효율성 Pareto frontier를 발전시켰습니다.

O(\Delta_t^3)