Blog

GitHub - maderix/ANE: Training neural networks on Apple Neural Engine via reverse-engineered private APIs

maderix

2026.03.03

·GitHub·by 이호민

#ANE#Apple Neural Engine#Machine Learning#Performance Benchmarking#Reverse Engineering

핵심 포인트

1이 프로젝트는 Apple의 사설 ANE API를 리버스 엔지니어링하여, CoreML을 통한 추론 전용 제약을 우회하고 Apple Neural Engine (ANE)에서 직접 신경망 학습이 가능함을 입증합니다.
2`_ANEClient` 및 `_ANECompiler`와 같은 사설 API와 MIL 포맷을 사용하여 역전파를 포함한 사용자 정의 연산 그래프를 구축하고 실행하며, IOSurface를 통해 I/O를 처리하고 가중치를 인메모리로 컴파일합니다.
3M4 칩에서 단일 트랜스포머 레이어 학습 시 9.3ms/step 및 11.2%의 ANE 활용률을 달성했으나, 이는 생산 프레임워크가 아닌 연구 프로젝트이며 낮은 활용률과 CPU 의존성 등 현재 제약이 있습니다.

W_2^T + SiLU_{bwd} + W_1^T + W_3^T

Blog

maderix

2026.03.03

·GitHub·by 이호민

#ANE#Apple Neural Engine#Machine Learning#Performance Benchmarking#Reverse Engineering

1이 프로젝트는 Apple의 사설 ANE API를 리버스 엔지니어링하여, CoreML을 통한 추론 전용 제약을 우회하고 Apple Neural Engine (ANE)에서 직접 신경망 학습이 가능함을 입증합니다.
2`_ANEClient` 및 `_ANECompiler`와 같은 사설 API와 MIL 포맷을 사용하여 역전파를 포함한 사용자 정의 연산 그래프를 구축하고 실행하며, IOSurface를 통해 I/O를 처리하고 가중치를 인메모리로 컴파일합니다.
3M4 칩에서 단일 트랜스포머 레이어 학습 시 9.3ms/step 및 11.2%의 ANE 활용률을 달성했으나, 이는 생산 프레임워크가 아닌 연구 프로젝트이며 낮은 활용률과 CPU 의존성 등 현재 제약이 있습니다.

W_2^T + SiLU_{bwd} + W_1^T + W_3^T