- Guide to Dify, an open-source platform for developing large language model (LLM) applications | by Gen. Devin DL. | Medium
- Dify.AI – Medium
- Explore Dify: A Step-by-Step Guide to Building a Simple LLM-Powered Application | by Ken Maeda | Medium
- Getting Started with Dify: No-Code AI Application Development | by Research Graph | Medium
Daddy Makers
SW, HW, CG, ART, 건설, 건축 메이크 과정을 정리, 공유하는 블로그입니다 - 대디 메이커
2025년 9월 16일 화요일
노코드 도구 Dify 사용기
2025년 9월 15일 월요일
노코드 도구 flowise 사용기
2025년 9월 10일 수요일
LLM 동작 메커니즘과 최신 기술 분석
최신 대규모 언어모델의 기술적 기법들은 크게 효율성과 성능 향상을 동시에 추구하는 방향으로 발전하고 있다. 우선 혼합 전문가 구조라 불리는 MoE 기법은 수많은 전문가 모듈 중 일부만 선택적으로 활성화하여 연산 효율을 극대화하는 방식이다. 게이트 네트워크가 입력 토큰의 은닉 상태를 보고 가장 적합한 전문가를 확률적으로 선택하고 선택된 전문가만 계산에 참여하기 때문에 전체 연산량은 줄어들면서도 특정 전문가가 특정 패턴에 특화되도록 학습된다. 이 과정에서 균형을 잡기 위해 부가적인 로드 밸런싱 손실이 함께 도입된다.
또한 파라미터 효율적 미세조정 기법들이 각광받고 있다. LoRA와 같은 방법은 거대한 모델의 전체 파라미터를 업데이트하지 않고 저차원 어댑터 행렬만 학습해도 충분히 성능을 낼 수 있도록 한다. 이 방식은 저장 공간과 학습 자원을 크게 줄이면서도 다양한 도메인에 빠르게 적응할 수 있다는 장점이 있다.
양자화와 프루닝 역시 중요하다. 양자화는 모델 파라미터를 16비트나 8비트 같은 저정밀도로 표현하여 메모리 사용량과 연산 속도를 개선한다. 프루닝은 중요도가 낮은 가중치를 제거함으로써 모델 크기를 줄이고 효율을 높인다. 이 두 기법은 실제 배포 환경에서의 속도와 비용 문제를 해결하는 핵심적 방법으로 활용된다.
메모리와 추론 속도를 개선하기 위한 기법으로는 효율적 어텐션 구조가 있다. 전통적인 어텐션은 시퀀스 길이에 따라 연산량이 제곱으로 늘어나는데 이를 완화하기 위해 플래시 어텐션과 같은 최적화 기법이 개발되었다. 이 방식은 GPU의 메모리 대역폭을 최대한 활용하면서도 연산을 줄여 긴 시퀀스 처리 능력을 크게 향상시킨다.
데이터 품질과 안전성을 강화하기 위한 학습 전략도 주목된다. 인간 피드백을 통한 강화학습 기법인 RLHF는 모델이 단순히 언어를 생성하는 수준을 넘어 사용자의 의도와 선호를 반영하도록 만든다. 최근에는 직접적인 강화학습 대신 선호 데이터만으로 지도학습을 수행하는 DPO와 같은 방식이 도입되어 학습의 안정성과 단순성이 개선되고 있다.
이와 함께 다중 모달 학습이 확대되고 있다. 텍스트뿐 아니라 이미지 음성 코드 등 다양한 데이터를 하나의 모델이 동시에 이해하고 생성할 수 있도록 설계하는 것이다. 이는 언어 중심에서 벗어나 실제 세계와 상호작용하는 범용 인공지능의 기반이 된다.
요약하면 최신 언어모델은 전문가를 선택적으로 활용하는 MoE 구조 파라미터 효율적 학습을 위한 LoRA 양자화와 프루닝 같은 최적화 메모리 효율적 어텐션 구조 인간 피드백 기반 학습 전략 그리고 다중 모달 통합 학습이라는 축 위에서 진화하고 있는 것이다.
- How to train a LLM from scratch. How to train a small LLM at home with… | by Sau Sheong | Medium
- Developing and training a small MoE LLM from scratch | Medium
- Building Large Language Model (LLM) from Scratch in just 160 lines of Code | by Mahadir Ahmad | Medium
- How to Build an LLM from Scratch | Towards Data Science
- Building a Large Language Model (LLM) from Scratch | by Abdul Rauf | Medium
- LLMs from Scratch Using Middle School Math | TDS Archive
- rasbt/LLMs-from-scratch: Implement a ChatGPT-like LLM in PyTorch from scratch, step by step
2025년 8월 22일 금요일
Text, wav 를 통한 입술 모양 이미지 생성 방법
- 얼굴 특징 감지 가이드 | Google AI Edge | Google AI for Developers
- Face-detection-mediapipe/Mediapipe-Face-Detector.ipynb at main · nikitansg/Face-detection-mediapipe
- LivePortrait: Bring portraits to life!
- SadTalker: [CVPR 2023] SadTalker:Learning Realistic 3D Motion Coefficients for Stylized Audio-Driven Single Image Talking Face Animation
- Wav2Lip: This repository contains the codes of "A Lip Sync Expert Is All You Need for Speech to Lip Generation In the Wild", published at ACM Multimedia 2020. For HD commercial model, please try out Sync Labs
- piper: A fast, local neural text to speech system
- TMElyralab/MuseTalk: MuseTalk: Real-Time High Quality Lip Synchorization with Latent Space Inpainting
- dreamtalk: Official implementations for paper: DreamTalk: When Expressive Talking Head Generation Meets Diffusion Probabilistic Models
- audio2face-3d Model by NVIDIA | NVIDIA NIM
- EmoTalk_release: This is the official source for our ICCV 2023 paper "EmoTalk: Speech-Driven Emotional Disentanglement for 3D Face Animation"
2025년 8월 21일 목요일
Coding 기반 애니메이션 생성 방법
2025년 7월 8일 화요일
인공지능 멀티 에이전트 개발 방법 정리
- Multi-Agent Report Generation with AgentWorkflow - LlamaIndex
- MAS-GPT: Training LLMs To Build LLM-Based Multi-Agent Systems with paper
- 50배 더 빠른 로컬 LLM 추론을 위한 레시피 | AI & ML 월간
- LLM 에이전트의 이해: 개념, 패턴 및 프레임워크
- 다중 에이전트 AI 애플리케이션을 구축하기 위한 최고의 5가지 프레임워크
- LangGraph 기반 에이전트 시스템
- LLM 기반 다중 에이전트 시스템의 품질 보증 테스트 방법론
- 2024년 다중 에이전트 LLM | SuperAnnotate
- AWS에서 다중 에이전트 시스템을 구축하는 세 가지 방법 - DEV Community
2025년 7월 7일 월요일
확실하게 성공하는 바이브 코딩 도구 사용 방법
- ChatGPT 에 코딩 요청을 해서 생성된 파이썬 같은 코드를 복사&붙여넣기해 프로그램을 완성해 나가는 방법
- Gemini CLI, Claude code CLI, codex CLI 도구를 사용해 프로젝트 파일 및 소스코드를 생성하는 방법
- vscode 같은 개발 IDE와 연동되는 github copilot, cursor, windsurf와 같은 도구를 사용해 바이브 코딩하는 방법
- Bubble.io나 Canva와 같은 바이브 코딩 웹서비스에서 직접 요구사항을 입력하여 제공 클라우드에 앱을 생성 빌드 실행하는 방법
- Gemini Pro 가입
- 파이썬, node.js 설치
- Github 가입
- Copilot 서비스 가입
- vscode 설치 및 코딩 언어 관련 확장(Extension) 애드인 설치
GUI 기반 텍스트 편집기를 개발할꺼야. 파이썬과 Tkinter 라이브러리를 이용할꺼야. 메뉴는 파일 메뉴, 편집 메뉴, 테마 선택 메뉴(다크모드 하위 메뉴 포함), 찾기 메뉴로 구성됨. 이 프로그램 개발을 위한 PRD를 UI 스케치를 포함해 md 포맷으로 작성해.