Agent Laboratory: Using LLMs as Research Assistants

Paper

Agent Laboratory: Using LLMs as Research Assistants

2025.02.16

·Web·by Anonymous

#LLM#Agent#Research Assistant#Automation#ML

핵심 포인트

1Agent Laboratory는 인간의 연구 아이디어를 입력받아 연구 보고서와 코드 저장소를 생성하는 LLM 에이전트 기반 시스템으로, 연구자가 아이디어와 비판적 사고에 집중할 수 있도록 반복 작업을 자동화합니다.
2이 시스템은 문헌 검토, 실험, 보고서 작성의 세 단계로 진행되며, ML 문제 해결을 위한 `mle-solver`와 실험 결과를 학술 논문 형식으로 정리하는 `paper-solver`를 핵심 구성 요소로 활용합니다.
3`mle-solver`는 MLE-Bench에서 다른 솔버들보다 높은 성과를 보였으나, 자율 생성된 보고서의 품질은 NeurIPS 기준에 크게 미치지 못했으며, gpt-4o 모델이 가장 비용 효율적이고 빠른 성능을 보였습니다.

Agent Laboratory: Using LLMs as Research Assistants

Paper

Agent Laboratory: Using LLMs as Research Assistants

2025.02.16

·Web·by Anonymous

#LLM#Agent#Research Assistant#Automation#ML

핵심 포인트

1Agent Laboratory는 인간의 연구 아이디어를 입력받아 연구 보고서와 코드 저장소를 생성하는 LLM 에이전트 기반 시스템으로, 연구자가 아이디어와 비판적 사고에 집중할 수 있도록 반복 작업을 자동화합니다.
2이 시스템은 문헌 검토, 실험, 보고서 작성의 세 단계로 진행되며, ML 문제 해결을 위한 `mle-solver`와 실험 결과를 학술 논문 형식으로 정리하는 `paper-solver`를 핵심 구성 요소로 활용합니다.
3`mle-solver`는 MLE-Bench에서 다른 솔버들보다 높은 성과를 보였으나, 자율 생성된 보고서의 품질은 NeurIPS 기준에 크게 미치지 못했으며, gpt-4o 모델이 가장 비용 효율적이고 빠른 성능을 보였습니다.