Paper page - Kronos: A Foundation Model for the Language of Financial Markets
Paper

Paper page - Kronos: A Foundation Model for the Language of Financial Markets

2026.04.13
·Hugging Face·by 배레온/부산/개발자
#Financial Markets#Forecasting#Foundation Model#Time Series#Tokenizer

핵심 포인트

  • 1Kronos는 금융 K-line 데이터 모델링을 위한 통합적이고 확장 가능한 pre-training framework를 제안하며, 기존 모델들의 한계를 극복합니다.
  • 2이 모델은 특수화된 tokenizer를 사용하여 연속적인 시장 정보를 token sequence로 변환하고, 45개 글로벌 거래소의 120억 개 이상의 K-line 기록으로 autoregressive pre-training되었습니다.
  • 3Kronos는 price series forecasting에서 RankIC를 93% 개선하고 volatility forecasting에서 MAE를 9% 낮추며, synthetic K-line sequences 생성의 generative fidelity도 22% 향상시키는 등 다양한 금융 task에서 뛰어난 성능을 입증했습니다.

Large Language Models (LLMs)의 성공적인 대규모 pre-training 패러다임이 Time Series Foundation Models (TSFMs)의 개발을 촉진했음에도 불구하고, 금융 K-line 데이터에 대한 이들의 적용은 제한적이었고 종종 비-pre-trained 아키텍처보다 성능이 저조했습니다. 또한 기존 TSFMs는 volatility prediction 및 synthetic data generation과 같은 중요한 downstream tasks를 간과하는 경향이 있었습니다.

이러한 한계점을 극복하기 위해, 본 논문은 금융 K-line modeling에 특화된 통합적이고 확장 가능한 pre-training framework인 Kronos를 제안합니다. Kronos의 핵심 방법론은 연속적인 시장 정보를 token sequences로 이산화(discretize)하는 specialized tokenizer를 도입하는 것입니다. 이 tokenizer는 price dynamics와 trade activity patterns을 모두 보존하도록 설계되었습니다. Kronos는 autoregressive objective를 사용하여 대규모 다중 시장 corpus에서 pre-training되었습니다. 이 corpus는 45개 글로벌 거래소에서 수집된 120억 개 이상의 K-line 기록으로 구성되어 있어, Kronos가 미묘한 temporal 및 cross-asset representations를 학습할 수 있게 합니다.

Kronos는 다양한 금융 task에서 zero-shot 설정으로 탁월한 성능을 보였습니다. 벤치마크 데이터셋에서 Kronos는 price series forecasting의 RankIC를 선두 TSFM 대비 93%, 비-pre-trained baseline 대비 87% 향상시켰습니다. 또한 volatility forecasting에서는 9% 낮은 MAE를 달성했으며, synthetic K-line sequences의 generative fidelity에서는 22%의 개선을 이루었습니다. 이러한 결과들은 Kronos가 end-to-end financial time series analysis를 위한 강력하고 다재다능한 foundation model임을 입증합니다. Pre-trained 모델은 https://github.com/shiyu-coder/Kronos에서 공개적으로 이용 가능합니다.