Paper

Mamba-3: Improved Sequence Modeling using State Space Principles

Albert Gu

2026.03.19

·Arxiv·by 이호민

#Inference Efficiency#LLM#Mamba#Sequence Modeling#State Space Models

Key Points

1Mamba-3 significantly advances sub-quadratic sequence modeling by introducing three core methodological improvements to enhance model quality, state-tracking capabilities, and inference efficiency.
2Its key innovations include an expressive exponential-trapezoidal discretization, a complex-valued state update rule enabling richer state tracking, and a Multi-Input, Multi-Output (MIMO) formulation for improved hardware utilization during decoding.
3Empirically, Mamba-3 achieves notable gains in downstream language modeling accuracy and successfully solves synthetic state-tracking tasks previously challenging for linear models, all while maintaining efficient inference.

\exp(-At)x(t)

Paper

Albert Gu

2026.03.19

·Arxiv·by 이호민

#Inference Efficiency#LLM#Mamba#Sequence Modeling#State Space Models

1Mamba-3 significantly advances sub-quadratic sequence modeling by introducing three core methodological improvements to enhance model quality, state-tracking capabilities, and inference efficiency.
2Its key innovations include an expressive exponential-trapezoidal discretization, a complex-valued state update rule enabling richer state tracking, and a Multi-Input, Multi-Output (MIMO) formulation for improved hardware utilization during decoding.
3Empirically, Mamba-3 achieves notable gains in downstream language modeling accuracy and successfully solves synthetic state-tracking tasks previously challenging for linear models, all while maintaining efficient inference.

\exp(-At)x(t)