GitHub - IYENTeam/Hent-ai: Emotion Image Attachment Plugin for AI agents — Auto-classify emotions via LLM and attach matching images to Discord messages
핵심 포인트
- 1Hent-ai는 LLM을 활용하여 AI 에이전트 응답의 감정(hent)을 분류하고, Discord 메시지에 상응하는 감정 이미지를 자동으로 첨부하는 시스템입니다.
- 2이 시스템은 일관성 있는 시각적 표현을 위해 단일 캐릭터 이미지를 기반으로 happy, neutral, loyalty 등 6가지 감정별 이미지를 생성하는 방법을 권장합니다.
- 3Hent-ai는 에이전트의 SOUL.md 파일에 명시된 감정적 행동에 대한 텍스트 표현을 통해 감정을 분류하므로, 에이전트가 `MEDIA:` 태그 대신 자연스럽게 감정을 드러내도록 유도해야 합니다.
Hent-ai는 AI 에이전트의 응답 텍스트에서 "hent"(의도 또는 감정)를 자동으로 분류하고, 분류된 감정에 해당하는 이미지를 Discord 메시지에 첨부하는 도구입니다. 이 시스템은 LLM(Large Language Model)을 활용하여 에이전트의 모든 응답에서 감정을 식별하며, OpenClaw와 Hermes Agent 플랫폼을 지원합니다.
핵심 방법론은 다음과 같습니다:
- 감정 분류 (Emotion Classification): Hent-ai는 에이전트가 생성하는 텍스트 응답을 실시간으로 분석하여 내재된 감정을 LLM을 통해 분류합니다. 에이전트는 특정 감정을 명시적으로 지시하거나 이미지 경로를 포함하는(
MEDIA:태그) 대신, 자연스럽게 글을 작성합니다. Hent-ai는 이 텍스트 내용을 기반으로 감정 신호를 해석합니다. 예를 들어, "작업 완료" 메시지에서 나타나는 축하, "실수"에 대한 사과, "문제 조사"에 대한 설명 등의 표현은 각각 'happy', 'sorry', 'focused'와 같은 특정 감정으로 매핑됩니다. - 이미지 매칭 및 첨부 (Image Matching and Attachment): 분류된 감정에 따라 미리 정의된 감정 이미지가 Discord 메시지에 자동으로 첨부됩니다. Hent-ai는 에이전트의 응답과 함께 사용자에게 시각적인 감정 표현을 제공함으로써, AI 에이전트의 상호작용을 더욱 풍부하게 만듭니다.
지원되는 감정은 'happy', 'neutral', 'loyalty', 'sorry', 'confused', 'focused' 총 6가지입니다. 각 감정은 성공, 일반 정보, 확인, 사과, 불확실성, 작업 수행과 같은 특정 상황에 사용됩니다.
감정 이미지 생성 방법은 다음과 같습니다:
- 기본 캐릭터 생성 (Base Character Generation): DALL-E, Midjourney, Stable Diffusion 등과 같은 이미지 생성 도구를 사용하여 에이전트의 시각적 정체성을 대표하는 기본 캐릭터 이미지를 만듭니다.
- 감정별 변형 생성 (Emotion Variant Generation): 생성된 기본 캐릭터 이미지를 참조 이미지로 사용하여, 각 감정(예: happy, sorry)을 표현하는 변형 이미지를 생성합니다. 이때 "Same character as the reference image, expressing [emotion]. Simple background, consistent art style."와 같은 프롬프트를 사용하여 캐릭터의 일관성을 유지합니다.
- 파일 관리 (Renaming and Placement): 생성된 이미지는
assets/디렉터리에happy.png,neutral.png등 미리 정해진 이름으로 저장해야 합니다.
이미지 품질을 높이기 위한 팁으로는 일관된 아트 스타일 유지, 단순한 배경 사용, 감정별 명확한 시각적 구분, 1:1 비율의 정사각형 이미지 사용, 파일 크기 500KB 이하 유지, PNG 형식 사용 등이 있습니다.
에이전트의 SOUL.md(또는 페르소나 파일) 설정은 Hent-ai의 정확한 감정 분류에 중요합니다. 에이전트에게 어떤 감정 이미지를 선택하라고 지시하는 대신, 에이전트가 특정 상황에서 자연스럽게 감정을 드러내는 방식으로 작성하도록 유도해야 합니다. MEDIA: 태그와 같은 이미지 첨부 지시를 제거하고, 명확한 감정적 행동(Tone)을 정의하는 것이 핵심입니다. 예를 들어, "작업 성공 시 축하하는 표현", "실수 시 즉각적인 사과", "문제 조사 시 현재 확인 중인 내용 설명" 등을 명시하여 LLM 분류기가 'happy', 'sorry', 'focused' 감정을 정확히 식별할 수 있도록 합니다. 에이전트의 성격을 단조롭게 만들지 않고 다양한 감정을 표현하도록 하는 것이 중요하며, 플러그인에 대한 간단한 설명을 SOUL.md에 추가하여 에이전트가 이미지 처리를 Hent-ai에 맡기도록 안내할 수 있습니다.