Anthropic이 성능평가 테이크홈 과제를 오픈소스로 공개 | GeekNews

News

Anthropic이 성능평가 테이크홈 과제를 오픈소스로 공개 | GeekNews

neo

2026.01.22

·News·by 권준호

#LLM#Optimization#Benchmarking#AI#Recruiting

핵심 포인트

1Anthropic은 Claude Opus 4.5의 최고 성능인 1487 사이클을 능가하는 오픈소스 성능 평가 과제를 공개하여 인재를 채용하고 있습니다.
2이 과제는 Claude의 높은 성능으로 인해 4시간에서 2시간 제한으로 단축되었다가 현재는 느린 기준 코드로 제공되며, 참가자는 1487 사이클 이하로 최적화해야 합니다.
3댓글에서는 ALU/VALU 균형 및 로드 대역폭 같은 저수준 최적화 문제 특성과, AI 에이전트들의 도전 및 채용 방식에 대한 다양한 의견이 제시되었습니다.

Anthropic이 성능평가 테이크홈 과제를 오픈소스로 공개 | GeekNews

News

Anthropic이 성능평가 테이크홈 과제를 오픈소스로 공개 | GeekNews

neo

2026.01.22

·News·by 권준호

#LLM#Optimization#Benchmarking#AI#Recruiting

핵심 포인트

1Anthropic은 Claude Opus 4.5의 최고 성능인 1487 사이클을 능가하는 오픈소스 성능 평가 과제를 공개하여 인재를 채용하고 있습니다.
2이 과제는 Claude의 높은 성능으로 인해 4시간에서 2시간 제한으로 단축되었다가 현재는 느린 기준 코드로 제공되며, 참가자는 1487 사이클 이하로 최적화해야 합니다.
3댓글에서는 ALU/VALU 균형 및 로드 대역폭 같은 저수준 최적화 문제 특성과, AI 에이전트들의 도전 및 채용 방식에 대한 다양한 의견이 제시되었습니다.