SON BLOG

AI Engineer · 손성준

|

All Posts Portfolio Knowledge Graph

279 posts

Search Engine

Rust 커머스 검색 엔진, OpenSearch, Qdrant, 시맨틱 검색

90 posts

AI / ML

GPU 모델 서빙, MCP Agent, 임베딩 최적화, XGEN 플랫폼

73 posts

Full Stack

Python, PoC, 프론트엔드, 백엔드, 데스크톱 앱

62 posts

DevOps

K8s, ArgoCD, Jenkins, Docker, 홈서버 인프라

40 posts

Interactive

Knowledge Graph

278개 포스트 · 634개 태그

탐색하기 →

Featured

AI

vLLM에서 llama.cpp로: LLM 서빙 아키텍처 통합 마이그레이션

vLLM Ray Serve 분산 구조에서 통합 모델 서빙 서비스로 마이그레이션한 과정. 백엔드 스위칭 매니저 설계, llama.cpp와 vLLM 런타임 전환까지.

모델서빙 리팩토링 vLLM

AI

graph-tool-call: LLM Agent를 위한 그래프 기반 도구 검색 엔진

1,077개 API endpoint를 가진 커머스 플랫폼에서 LLM Agent가 적절한 도구를 찾는 문제를 해결하기 위해 그래프 기반 도구 검색 엔진을 설계하고 구현한 과정을 정리한다. OpenAPI 스펙 자동 수집...

LLM Agent Tool Retrieval OpenAPI

Search Engine

Rust로 커머스 검색 엔진을 처음부터 만들기

NestJS 기반 검색 서비스의 한계를 넘어, Rust로 이커머스 검색 엔진을 처음부터 설계하고 구현한 과정을 다룬다.

Rust 검색엔진 OpenSearch

SON BLOG

Search Engine

AI / ML

Full Stack

DevOps

Knowledge Graph

Featured

vLLM에서 llama.cpp로: LLM 서빙 아키텍처 통합 마이그레이션

graph-tool-call: LLM Agent를 위한 그래프 기반 도구 검색 엔진

Rust로 커머스 검색 엔진을 처음부터 만들기

Recent Posts

체험존 프로비저너: 신청 한 건으로 격리된 멀티테넌트 스택을 자동 발급하다

XGEN Workbench 분산 실행 인프라: KVM 컴퓨트 풀, GPU 워커, PriorityClass, NetworkPolicy까지

XGEN 데스크톱 앱 고도화: Tauri에서 로컬 Ollama, 백엔드 자동기동, MCP/RAG를 한 번에 연결하기

sontrader 자동매매 시스템 설계: 전략보다 먼저 주문, 리스크, 기억 계층을 분리하기

XGEN MCP 폐쇄망 번들 시스템: 외부망 패키지를 .tar.gz로 묶어 원클릭 도구 세션까지 연결하기

XGEN Canvas Chat와 Harness 컴파일: 대화형 워크플로우를 실행 가능한 에이전트 파이프라인으로 만들기