이 글은 헤르메스 에이전트 개발 배경, 설치, 사용방법 등을 나눔한다.
개요
헤르메스는 서버리스로 자체 로컬 컴퓨터에 설치할 수 있는 에이전트이다. 스스로 발전할 수 있도록 구현되어 있어, 지식을 계속 축척하고 이를 재사용할 수 있다. 헤르메스 프로젝트는 중앙 집중형 AI의 한계를 극복하기 위해 NOUS RESEARCH - Open Source AI에 의해 개발되었다. 누스 리서치는 특정 기업의 이익보다 오픈소스 AI 모델의 성능 향상과 보급을 목적으로 하는 연구 커뮤니티이자 조직이다. 이들은 이미 AI 오픈소스 프로젝트를 통해 세계 AI 개발자들 사이에서 신뢰를 쌓아왔다. 특정 기업에 종속된 클라우드 기반 AI와 달리, 사용자의 로컬 환경에서 독립적으로 작동하는 주권적 AI(Sovereign AI)구현을 목표로 한다. 개발팀은 사용자가 자신의 하드웨어 자원을 활용해 보안 걱정 없이 고성능 AI 비서를 운용할 수 있는 생태계를 구축하고자 이 에이전트를 세상에 내놓았다.
헤르메스 에이전트의 공식 정보와 최신 소스 코드는 공식 깃허브(GitHub) 저장소 및 프로젝트 웹사이트를 통해 제공된다. 개발자들과의 원활한 소통 및 기술 지원은 주로 디스코드(Discord) 커뮤니티나 관련 포럼을 통해 이루어지며, 이곳에서 사용자는 최신 업데이트 소식과 문제 해결 방법을 공유받을 수 있다.
헤르메스 에이전트는 현재 매우 빠른 속도로 발전 중이다. 초기에는 단순한 텍스트 기반 응답에 집중했으나, 현재는 도구 사용(Tool Use), 웹 브라우징, 그리고 장기 기억(Long-term Memory) 기능을 통합하여 복잡한 태스크를 수행할 수 있는 수준에 도달했다. 특히 오픈소스 커뮤니티의 활발한 참여로 인해 다양한 로컬 LLM(대규모 언어 모델)과의 호환성이 강화되고 있으며, 최적화 작업을 통해 사양이 낮은 개인용 PC에서도 원활하게 구동될 수 있도록 경량화가 진행되고 있다.
설치 방법
설치는 리눅스에서 다음과 같이 실행한다.
curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash
만약 이전에 Open claw 에이전트를 설치했다면, 해당 설정을 임포트할 것인지 다음과 같이 질문한다. 본인은 오픈 클로 설치할때 사용할 LLM모델 등을 미리 설정하였기 때문에, 이 설정 정보를 그대로 가져오기로 했다.
이제 헤르메스 설정이 진행된다. 본인의 경우, 신속 설정 모드를 선택하였다.
LLM 모델을 다시 OpenAI Codex로 변경하기 위해 다음 명령을 실행한다.
hermes setup model
이제 다시 해당 코덱스 링크를 방문하면, 다음과 같은 화면이 나타날 것이다. 헤르메스에서 알려준 코드 를 입력한다.
이제 헤르메스 모델 설정 터미널 화면에서 다음과 같이 로긴되고 모델 설정 옵션 입력을 받을 것이다. 적절한 모델을 설정한다. 그리고 다시 헤르메스 에이전트를 실행한다.
hermes
헤르메스에 다음과 같이 입력한다.
hi
그럼, 해당 모델을 호출해 다음 화면과 같이 인시할 것이다.
너는 현재 이 컴퓨터에서 무엇을 할 수 있니?
컴퓨터 현재 상태 간단히 점검해줘.
그럼, 헤르메스가 내 컴퓨터 정보를 읽고 다음과 같이 알려줄 것이다.
현재 전쟁과 주식에 관련된 소식을 웹 검색해바
그럼, 헤르메스가 다음과 같이 관련 소식을 검색하기 위한 파이썬 코드를 생성, 실행한 후, 관련 정보를 얻는다. 얻은 정보는 설정된 언어모델을 통해 질문에 대한 답변을 추론해 보여줄 것이다.
코사인 파형이 시간에 따라 흐르는 시뮬레이션을 하는 프로그램 개발해
이제 다시 실행해 본다. 그럼, 다음과 같이 프로그램이 실행될 것이다.
이제, 오픈 클로에서 입력햇던 나의 아이덴티티 관련 질문을 해본다.
내 이름이 머지?
다음과 같이 잘 기억하고 있는 것을 알 수 있다.
앞에서 검색했던 뉴스도 한번 더 보여달라고 해보자. 과거에 명령 조사했던 내용을 기억하고 있는 것을 알 수 있다.
이외에 주기적으로 서버 관리용 리포트를 생성하는 등의 일들도 시켜본다.
헤르메스는 여러 터미널에 에이전트를 실행해고, 서로 협업하게도 할 수 있다. 이런 궁금한 것은 헤르메스에게 물어보면 다음과 같이 실행 순서를 알려준다. 그래서 별도 메뉴얼을 공부할 필요가 없다.
참고로 헤르메스가 알려준 tmux 도구는 터미널 멀티플렉서로 터미널 내에서 여러 터미널 세션을 만들어 특정 프로그램들을 실행하고 창을 닫아도 해당 프로그램 실행 세션이 살아있게 해준다. 다음과 같이 tmux를 설치해 달라고 해보자. 그럼 sudo 암호를 달라고 한 후 apt get install 명령으로 설치해준다. 이런 방식으로 헤르메스에 도움을 요청하면 여러 도구와 명령들을 일일히 기억하지 않아도 되어 참 편리하다.
해르메스 사용 중에 축척한 지식은 어디에 저장되는 지도 확인해 보자.
넌 내가 너를 통해 알아낸 지식을 어디에 어떤 방식으로 저장하니?
- 개발
- 코드 작성/수정, 버그 디버깅, 테스트 자동화, 성능 점검
- 시스템 작업
- 프로세스/포트/메모리/디스크 점검, 로그 분석, 서버 실행
- 데이터 작업
- CSV/JSON 분석, 리포트 요약, 그래프 생성
- 웹 리서치
- 최신 뉴스/기술 문서/가격 정보 검색 후 핵심 요약
- 문서 업무
- 보고서/메일/발표자료 초안 작성, 한국어/영어 다듬기
- 자동화
- 반복 작업 스크립트화, 정기 실행(크론) 구성
- 이미지/음성
- 이미지 생성, 텍스트 음성 변환(TTS)
- 외부 도구 연동
- GitHub, Notion, Google Workspace, 메신저 전송 등(연결된 경우)
- 기타 기능
- 시스템 상태 리포트 자동 생성
- 웹 뉴스 요약 스크립트
- 폴더 정리 자동화 스크립트
이제, ctrl+D를 눌러 헤르메스를 종료한다. 그럼 다음과 같이 이번 헤르메스 사용시 기록한 내용을 세션으로 저장해 보여주고, 사용된 시간, 호출한 도구 개수 등을 요약해 보여줄 것이다.
마무리
최근, 오픈 클로, 헤르메스 에이전트와 같은 멀티 에이전트 시스템이 크게 발전하고 있다. 다양한 모델과 스킬을 입맛에 맞게 사용할 수 있고, 컴퓨터 정리, 개발, 테스트, 서버 모니터링 등 다양한 목적으로 사용할 수 있다. 올라마 같은 로컬 모델 서빙 도구를 설치하면, 클로드나 제미니 같은 상업묭 모델 유료 토큰 사용하지 않고 무료로 로컬에서 실행되는 에이전트를 만들 수 있다. 좀 더 상세한 내용은 레퍼런스를 참고한다.







