SON BLOG
AI Engineer · 손성준
|
Search Engine
Rust 커머스 검색 엔진, OpenSearch, Qdrant, 시맨틱 검색
90 postsAI / ML
GPU 모델 서빙, MCP Agent, 임베딩 최적화, XGEN 플랫폼
73 postsFull Stack
Python, PoC, 프론트엔드, 백엔드, 데스크톱 앱
62 postsDevOps
K8s, ArgoCD, Jenkins, Docker, 홈서버 인프라
40 postsInteractive
Knowledge Graph
278개 포스트 · 634개 태그
탐색하기 →Featured
AI
vLLM에서 llama.cpp로: LLM 서빙 아키텍처 통합 마이그레이션
vLLM Ray Serve 분산 구조에서 통합 모델 서빙 서비스로 마이그레이션한 과정. 백엔드 스위칭 매니저 설계, llama.cpp와 vLLM 런타임 전환까지.
AIgraph-tool-call: LLM Agent를 위한 그래프 기반 도구 검색 엔진
1,077개 API endpoint를 가진 커머스 플랫폼에서 LLM Agent가 적절한 도구를 찾는 문제를 해결하기 위해 그래프 기반 도구 검색 엔진을 설계하고 구현한 과정을 정리한다. OpenAPI 스펙 자동 수집...
Search EngineRust로 커머스 검색 엔진을 처음부터 만들기
NestJS 기반 검색 서비스의 한계를 넘어, Rust로 이커머스 검색 엔진을 처음부터 설계하고 구현한 과정을 다룬다.
Recent Posts
DevOps
2026.06.13
체험존 프로비저너: 신청 한 건으로 격리된 멀티테넌트 스택을 자동 발급하다
22min
DevOps
2026.06.09
XGEN Workbench 분산 실행 인프라: KVM 컴퓨트 풀, GPU 워커, PriorityClass, NetworkPolicy까지
22min
Full Stack
2026.06.09
XGEN 데스크톱 앱 고도화: Tauri에서 로컬 Ollama, 백엔드 자동기동, MCP/RAG를 한 번에 연결하기
16min
Full Stack
2026.06.09
sontrader 자동매매 시스템 설계: 전략보다 먼저 주문, 리스크, 기억 계층을 분리하기
12min
AI
2026.06.09
XGEN MCP 폐쇄망 번들 시스템: 외부망 패키지를 .tar.gz로 묶어 원클릭 도구 세션까지 연결하기
21min
AI
2026.06.09
XGEN Canvas Chat와 Harness 컴파일: 대화형 워크플로우를 실행 가능한 에이전트 파이프라인으로 만들기
20min