2026년 5월 24일 일요일

NVIDIA OpenUSD 구조, 동작메커니즘 및 유스케이스

이 글은 OpenUSD 구조, 동작메커니즘 및 유스케이스에 대한 내용을 요약 정리한다.



2026년 5월 22일 금요일

무료 토큰 바이브 코딩 도구 Continue 설치 및 사용기

이 글은 무료 토큰 바이브 코딩 도구 Continue 설치 및 사용기를 간단히 나눔한다.

이외, 오픈소스 AI 에이전트에 대해서는 다음 링크를 참고한다.
개요
Continue는 개발 환경(IDE)에 인공지능을 통합하여 코드 자동 완성, 리팩토링, 채팅 등을 제공하는 오픈소스 AI 코딩 어시스턴트(일명 바이브 코딩 도구)이다.
설치
VS Code 환경에서 Continue와 로컬 모델인 Ollama를 연동하는 설치 과정은 다음과 같다.

1.Ollama 설치 및 모델 다운로드
Ollama 공식 홈페이지에서 운영체제에 맞는 프로그램을 설치한다. 설치 완료 후 터미널(명렬 프롬프트)을 열고 코딩에 최적화된 로컬 모델을 다운로드한다. 예를 들어 라마3 기반의 코딩 모델을 받으려면 코드 모델인 ollama run qwen2.5-coder 혹은 ollama run llama3 등을 실행해 로컬에 다운로드 받아둔다.

2.IDE에서 Continue 확장 프로그램 설치
VS Code 에디터를 열고 확장 프로그램 마켓플레이스(Extensions)로 이동한다. 검색창에 Continue를 입력한 후 공식 플러그인을 찾아 설치한다. 설치가 완료되면 에디터 측면 바에 Continue 아이콘이 생성된다.

3.Continue 설정 파일(config.json) 수정
Continue 아이콘을 클릭한 뒤 하단의 설정(톱니바퀴) 버튼을 눌러 config.json 파일을 연다. 

models 배열 항목에 방금 Ollama로 다운로드한 로컬 모델 정보를 다음과 같이 추가하고 저장한다.
name: Local Config
version: 1.0.0
schema: v1
models:
  - name: Autodetect
    provider: ollama
    model: AUTODETECT

4.연동 확인 및 테스트
Continue 채팅창 상단의 모델 선택 드롭다운 메뉴에서 등록한 로컬 모델(예: Ollama qwen2.5-coder)을 선택한다. 질문을 입력하여 로컬 환경에서 답변이 정상적으로 출력되는지 확인한다.

사용기
다음과 같이 프롬프트를 입력해 테트리스를 개발해 본다.

can you make tetris game by using pygame?

결과는 다음과 같다. 

실행하자마자 빠져나오는 에러가 있어 해당 부분을 수정해달라고 했다. 그 결과 다음과 같이 동작되는 코드를 얻을 수 있었다. 무료 토큰 오픈웨이트 모델을 사용해 얻은 결과 치고는 괜찬아 보인다. 
 

이제 PRD를 다음과 같이 작성해 코딩을 시켜본다. 
# [PRD] Pygame 기반 테트리스(Tetris) 개발 요구사항 정의서

## 1. 개요

본 프로젝트는 Python의 `pygame` 라이브러리를 활용하여 로컬 환경에서 실행 가능한 고전 테트리스 게임을 개발하는 것이다. LLM(qwen2.5-coder)이 단번에 구조화된 객체 지향 코드를 생성할 수 있도록 게임 규칙, 시스템 아키텍처, 데이터 구조를 명확히 정의하는 것을 목적으로 한다.

## 2. 게임 명세 및 규칙 (Game Specifications)

* **그리드(Grid) 크기:** 가로 10칸 $\times$ 세로 20칸이다.
* **블록(Tetromino) 종류:** I, J, L, O, S, T, Z 총 7가지 형태이다. 각 블록은 고유의 색상을 가진다.
* **게임 루프 메커니즘:**
* 일정 시간(FPS 및 속도 레벨에 비례)마다 블록이 한 칸씩 자동으로 하강한다.
* 가로 한 줄이 빈칸 없이 블록으로 가득 차면 해당 줄이 소거되고 점수가 누적된다.
* 새로 생성된 블록이 배치될 공간이 없거나, 블록이 화면 최상단(세로 0번 인덱스)을 넘어서면 게임 오버(Game Over)이다.

## 3. 기술 스택 및 아키텍처 구조

* **언어 및 라이브러리:** `Python 3.x`, `pygame` 이다.
* **설계 패턴:** 관리가 용이하도록 **객체 지향 프로그래밍(OOP)** 구조로 클래스를 분리하여 구현한다.

### 3.1 핵심 클래스 구조 (Class Architecture)

```
[Main Loop (main.py)]
       │
       ▼
┌──────────────────────────────────────────────┐
│                 TetrisGame                   │ (게임 상태, 점수, 루프 관리)
└──────┬────────────────────────────────┬──────┘
       │                                │
       ▼                                ▼
┌─────────────────────┐        ┌─────────────────────┐
│      Piece          │        │      GameBoard      │
│ (블록 형태, 좌표, 회전) │        │ (그리드 표현, 줄소거) │
└─────────────────────┘        └─────────────────────┘

```

#### ① `Piece` 클래스

* **역할:** 현재 조종 중인 테트로미노 블록 하나를 표현한다.
* **필수 변수:**
* `x`, `y`: 그리드 상의 현재 좌표 (정수형) 이다.
* `shape`: 블록의 형태를 나타내는 2차원 리스트(행렬)이다.
* `color`: RGB 튜플 형태의 블록 색상 정보이다.

* **필수 메서드:**
* `rotate()`: 블록 행렬을 시계 방향으로 90도 회전시킨다. (단, 회전 후 그리드 경계를 벗어나거나 기존 블록과 겹치면 회전을 취소해야 한다.)

#### ② `GameBoard` 클래스

* **역할:** 10 $\times$ 20 그리드의 상태를 관리하고 쌓인 블록들을 기록한다.
* **필수 변수:**
* `grid`: 10 $\times$ 20 크기의 2차원 리스트이다. 빈 공간은 `(0,0,0)` 또는 `None`으로, 블록이 찬 곳은 해당 블록의 RGB 색상 값으로 채워진다.

* **필수 메서드:**
* `check_collision(piece, offset_x, offset_y)`: 입력받은 `piece`가 지정된 오프셋만큼 이동하거나 회전했을 때, 벽면에 부딪히거나 바닥 혹은 기존에 쌓인 블록과 충돌하는지 여부를 검사하여 Boolean 값(`True`/`False`)을 반환한다.
* `lock_piece(piece)`: 바닥에 닿은 블록을 `grid` 데이터에 영구적으로 고정시킨다.
* `clear_lines()`: 가로 줄이 꽉 찼는지 검사하고, 채워진 줄을 삭제한 뒤 상단의 블록들을 아래로 내린다. 지워진 줄의 개수를 반환한다.

#### ③ `TetrisGame` 클래스 (또는 메인 제어 루프)

* **역할:** Pygame 초기화, 화면 렌더링, 키보드 이벤트 처리, 전체 게임 상태(점수, 게임오버 여부)를 총괄한다.
* **키 입력 이벤트 명세:**
* `KEY_LEFT` / `KEY_RIGHT`: 블록을 좌우로 1칸 이동한다.
* `KEY_DOWN`: 소프트 드롭(Soft Drop)으로 하강 속도를 가속한다.
* `KEY_UP`: 블록을 시계방향으로 회전한다.
* `KEY_SPACE`: 하드 드롭(Hard Drop)으로 블록을 즉시 바닥으로 떨어뜨리고 고정한다.

## 4. UI 및 그래픽 화면 구성 요구사항

* **화면 해상도:** 최소 $width = 400px$, $height = 500px$ 이상으로 설정한다.
* **레이아웃 분할:**
* **메인 게임 보드 영역:** 가로 10칸 $\times$ 세로 20칸 영역을 격자 모양으로 화면 중앙 혹은 좌측에 배치한다. (예: 한 칸당 $30px \times 30px$ 크기)
* **사이드 바 영역:** 현재 점수(Score)와 게임 오버 메시지를 텍스트로 표시한다.


개발을 시켜보았더니, 단순히 지시한 거보다는 품질이 더 좋아보이는 게임화면이 표시된다. 

사용 후 장단점 
실제 개발 업무에서 Ollama와 Continue 조합을 사용해 보면 장단점이 명확하게 체감된다.

가장 큰 만족감을 주는 부분은 비용이다. 아무리 긴 코드 컨텍스트(문맥)를 집어넣고 대화를 나눠도 비용이 0원이며, 토큰 제한으로 인한 결제 압박이 없다. 내부 소스코드가 외부 클라우드로 전송되지 않아 보안 규정이 엄격한 프로젝트에서도 안심하고 사용할 수 있다.

사용 편의성은 깃허브 코파일럿(GitHub Copilot) 못지않게 뛰어나다. 드래그한 코드 영역을 바로 프롬프트에 넣거나(Ctrl + L), 인라인으로 코드를 바로 수정하는 기능(Ctrl + I)이 매끄럽게 작동한다. 

다만 AI의 답변 속도, 성능, 퀄리티는 온전히 개인 PC의 하드웨어 사양(특히 GPU VRAM 용량)에 비례한다. 사양이 낮은 컴퓨터에서는 답변 속도가 느려 답답할 수 있으며, 가벼운 파라미터(Parameter)의 로컬 모델을 쓸 경우 복잡한 아키텍처 설계나 고난도 코드 로직 구현 시 상용 모델(GPT-4o, Claude 등)보다 정확도가 떨어진다. 

마무리
Continue와 Ollama의 조합은 나만의 비용 없는 보안 코딩 비서를 만들 수 있는 최적의 솔루션이다. 상용 서비스 수준의 추론 성능을 확보하려면 고사양의 그래픽 카드가 필요하다는 숙제가 있지만, 간단한 함수 작성, 코드 리팩토링, 주석 생성 및 단순 반복 작업에서는 로컬 모델만으로도 충분히 돈값 그 이상의 생산성을 뽑아낼 수 있다. 오픈소스 생태계와 로컬 LLM의 발전 속도가 매우 빠르기 때문에, 앞으로 비용 절감과 보안을 동시에 잡으려는 개인 개발자와 기업들에게 Continue는 좋은 선택지로 자리 잡을 것으로 생각된다.

레퍼런스

2026년 5월 9일 토요일

헤르메스 에이전트 개발배경, 설치 및 사용방법

이 글은 헤르메스 에이전트 개발 배경, 설치, 사용방법 등을 나눔한다.


오픈클로는 다음 링크를 참고한다.

개요
헤르메스는 서버리스로 자체 로컬 컴퓨터에 설치할 수 있는 에이전트이다. 스스로 발전할 수 있도록 구현되어 있어, 지식을 계속 축척하고 이를 재사용할 수 있다. 헤르메스 프로젝트는 중앙 집중형 AI의 한계를 극복하기 위해 NOUS RESEARCH - Open Source AI에 의해 개발되었다. 누스 리서치는 특정 기업의 이익보다 오픈소스 AI 모델의 성능 향상과 보급을 목적으로 하는 연구 커뮤니티이자 조직이다. 이들은 이미 AI 오픈소스 프로젝트를 통해 세계 AI 개발자들 사이에서 신뢰를 쌓아왔다. 특정 기업에 종속된 클라우드 기반 AI와 달리, 사용자의 로컬 환경에서 독립적으로 작동하는 주권적 AI(Sovereign AI)구현을 목표로 한다. 개발팀은 사용자가 자신의 하드웨어 자원을 활용해 보안 걱정 없이 고성능 AI 비서를 운용할 수 있는 생태계를 구축하고자 이 에이전트를 세상에 내놓았다.

헤르메스 에이전트의 공식 정보와 최신 소스 코드는 공식 깃허브(GitHub) 저장소 및 프로젝트 웹사이트를 통해 제공된다. 개발자들과의 원활한 소통 및 기술 지원은 주로 디스코드(Discord) 커뮤니티나 관련 포럼을 통해 이루어지며, 이곳에서 사용자는 최신 업데이트 소식과 문제 해결 방법을 공유받을 수 있다.

헤르메스 에이전트는 현재 매우 빠른 속도로 발전 중이다. 초기에는 단순한 텍스트 기반 응답에 집중했으나, 현재는 도구 사용(Tool Use), 웹 브라우징, 그리고 장기 기억(Long-term Memory) 기능을 통합하여 복잡한 태스크를 수행할 수 있는 수준에 도달했다. 특히 오픈소스 커뮤니티의 활발한 참여로 인해 다양한 로컬 LLM(대규모 언어 모델)과의 호환성이 강화되고 있으며, 최적화 작업을 통해 사양이 낮은 개인용 PC에서도 원활하게 구동될 수 있도록 경량화가 진행되고 있다.

설치 방법
설치는 리눅스에서 다음과 같이 실행한다.
curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash


만약 이전에 Open claw 에이전트를 설치했다면, 해당 설정을 임포트할 것인지 다음과 같이 질문한다. 본인은 오픈 클로 설치할때 사용할 LLM모델 등을 미리 설정하였기 때문에, 이 설정 정보를 그대로 가져오기로 했다. 

이제 헤르메스 설정이 진행된다. 본인의 경우, 신속 설정 모드를 선택하였다. 

대부분 디폴트값으로 설정한다. 그럼, 다음과 같이 마지막에 설정 수정 명령과 함께 에이전트 실행할 지 물어본다. 엔터를 눌러 실행한다. 

그럼, 다음과 같은 화면을 볼 수 있을 것이다.

다시 Ctrl+D 를 눌러 헤르메스 에이전트를 빠져나온다. 
LLM 모델을 다시 OpenAI Codex로 변경하기 위해 다음 명령을 실행한다.
hermes setup model

화면에서 모델로 OpenAI codex 를 선택하면, 설정 단계를 안내한다. 그대로 따라해 본다. 

앞의 코덱스 로그인 때 적색 표시로 코덱스 장치 코드 인증 활성화하라는 메시지가 뜰 수 있다. 다음과 같이 오픈AI의 설정 해당 메뉴를 찾아, 그 옵션을 다음 화면과 같이 활성화한다.

이제 다시 해당 코덱스 링크를 방문하면, 다음과 같은 화면이 나타날 것이다. 헤르메스에서 알려준 코드 를 입력한다. 

이제 헤르메스 모델 설정 터미널 화면에서 다음과 같이 로긴되고 모델 설정 옵션 입력을 받을 것이다. 적절한 모델을 설정한다. 그리고 다시 헤르메스 에이전트를 실행한다.
hermes

헤르메스에 다음과 같이 입력한다.
hi

그럼, 해당 모델을 호출해 다음 화면과 같이 인시할 것이다. 

헤르메스 에이전트 사용하기
정상적으로 설정되었으니, 헤르메스가 무엇을 할 수 있는 지 다음과 같이 물어보자. 

너는 현재 이 컴퓨터에서 무엇을 할 수 있니?

그럼, 다음과 같이 답변할 것이다. 

다음 명령을 입력해 본다. 

컴퓨터 현재 상태 간단히 점검해줘.

그럼, 헤르메스가 내 컴퓨터 정보를 읽고 다음과 같이 알려줄 것이다. 

다음과 같이 현재 웹 정보도 검색 가능한지 확인해 보자. 

현재 전쟁과 주식에 관련된 소식을 웹 검색해바

그럼, 헤르메스가 다음과 같이 관련 소식을 검색하기 위한 파이썬 코드를 생성, 실행한 후, 관련 정보를 얻는다. 얻은 정보는 설정된 언어모델을 통해 질문에 대한 답변을 추론해 보여줄 것이다. 

바이브 코딩도 간단히 해보자. 

코사인 파형이 시간에 따라 흐르는 시뮬레이션을 하는 프로그램 개발해

그럼, 다음과 같이 코딩하고, 프로그램을 헤르메스가 실행된 폴더에 저장한다. 

실행하라고 명령을 줘본다.

실행을 했는데, 코사인 파형이 애니메이션되지 않는다. 제대로 파형이 안보이니 문제 원인을 수정해 달라고한다. 그럼, 다음과 같이 코드를 읽고 수정해 줄것이다.

이제 다시 실행해 본다. 그럼, 다음과 같이 프로그램이 실행될 것이다. 

이제, 오픈 클로에서 입력햇던 나의 아이덴티티 관련 질문을 해본다. 

내 이름이 머지?

다음과 같이 잘 기억하고 있는 것을 알 수 있다.

앞에서 검색했던 뉴스도 한번 더 보여달라고 해보자. 과거에 명령 조사했던 내용을 기억하고 있는 것을 알 수 있다. 

이외에 주기적으로 서버 관리용 리포트를 생성하는 등의 일들도 시켜본다. 

헤르메스는 여러 터미널에 에이전트를 실행해고, 서로 협업하게도 할 수 있다. 이런 궁금한 것은 헤르메스에게 물어보면 다음과 같이 실행 순서를 알려준다. 그래서 별도 메뉴얼을 공부할 필요가 없다. 

참고로 헤르메스가 알려준 tmux 도구는 터미널 멀티플렉서로 터미널 내에서 여러 터미널 세션을 만들어 특정 프로그램들을 실행하고 창을 닫아도 해당 프로그램 실행 세션이 살아있게 해준다. 다음과 같이 tmux를 설치해 달라고 해보자. 그럼 sudo 암호를 달라고 한 후 apt get install 명령으로 설치해준다. 이런 방식으로 헤르메스에 도움을 요청하면 여러 도구와 명령들을 일일히 기억하지 않아도 되어 참 편리하다.

해르메스 사용 중에 축척한 지식은 어디에 저장되는 지도 확인해 보자. 

넌 내가 너를 통해 알아낸 지식을 어디에 어떤 방식으로 저장하니?

다음과 같이 메모리 메커니즘을 잘 설명해 줄 것이다.

멀티 에이전트 실행하기
다양한 멀티 에이전트로 실행하기 위해서 다음 명령을 입력한다. 
hermes kanban init
hermes kanban stats

헤르메스 도구를 활성화한다. 
hermes tools

다음 명령을 입력해 본다. 
 tmux, kanban 설치 다함. 이제 특정 웹서비스를 개발하기 위한 각 에이전트 멀티로 만들수 있도록 
각 단계별 알려줘. 요구사항 조사, 설계, 개발, 테스트는 각각 영어이름으로 에이전트 만들어. 하나 
에이전트가 끝나면, 다른 에이전트가 자동으로 실행될 수 있도록도 설정해줘.

그럼, 헤르메스가 이를 고려해 명령들을 실행하는 배치파일(쉘 스크립트)를 자동으로 생성해준다. 

이외에도 헤르메스가 할 수 있는 것들은 다음과 같다.

- 개발
      - 코드 작성/수정, 버그 디버깅, 테스트 자동화, 성능 점검
    - 시스템 작업
      - 프로세스/포트/메모리/디스크 점검, 로그 분석, 서버 실행
    - 데이터 작업
      - CSV/JSON 분석, 리포트 요약, 그래프 생성
    - 웹 리서치
      - 최신 뉴스/기술 문서/가격 정보 검색 후 핵심 요약
    - 문서 업무
      - 보고서/메일/발표자료 초안 작성, 한국어/영어 다듬기
    - 자동화
      - 반복 작업 스크립트화, 정기 실행(크론) 구성
    - 이미지/음성
      - 이미지 생성, 텍스트 음성 변환(TTS)
    - 외부 도구 연동
      - GitHub, Notion, Google Workspace, 메신저 전송 등(연결된 경우)

- 기타 기능    
   - 시스템 상태 리포트 자동 생성
   - 웹 뉴스 요약 스크립트
   - 폴더 정리 자동화 스크립트

이제, ctrl+D를 눌러 헤르메스를 종료한다. 그럼 다음과 같이 이번 헤르메스 사용시 기록한 내용을 세션으로 저장해 보여주고, 사용된 시간, 호출한 도구 개수 등을 요약해 보여줄 것이다.

마무리
최근, 오픈 클로, 헤르메스 에이전트와 같은 멀티 에이전트 시스템이 크게 발전하고 있다. 다양한 모델과 스킬을 입맛에 맞게 사용할 수 있고, 컴퓨터 정리, 개발, 테스트, 서버 모니터링 등 다양한 목적으로 사용할 수 있다. 올라마 같은 로컬 모델 서빙 도구를 설치하면, 클로드나 제미니 같은 상업묭 모델 유료 토큰 사용하지 않고 무료로 로컬에서 실행되는 에이전트를 만들 수 있다. 좀 더 상세한 내용은 레퍼런스를 참고한다.