Tech Stack
Spring Boot Kotlin Java Python AWS GCP Docker Terraform PostgreSQL Redis LangChain RAG
Featured Posts
모두 보기 AI
Multi-Agent 챗봇에서 컨텍스트 윈도우 관리하기 — 토큰 추정 Fallback 체인과 LLM 기반 압축
Google ADK 기반 멀티 에이전트 시스템에서 대화가 길어질수록 토큰이 폭증하는 문제를 해결하기 위해 적용한 토큰 추정 Fallback 체인, State 정리, LLM 기반 대화 요약 압축 전략을 정리한다.
AWS
ECS 인프라 비용 절감기 — NAT 정리부터 EC2 Spot 전환까지
정식 운영 전 단계에서 ECS Fargate 인프라 비용이 부담되어 NAT Gateway 제거와 EC2 Spot 전환을 적용했다. Public Subnet 배치 판단 근거와 VPC Endpoint 구성 등 각 단계의 트레이드오프를 정리한다.
AI
멀티 턴 워크플로우를 상태 머신으로 설계하기 — 에이전트 분리와 단계별 라우팅
Google ADK 기반 챗봇에서 다단계 정보 수집 워크플로우를 상태 머신 패턴으로 설계하고 Parser → Router → Domain Agent 3단계 파이프라인으로 구현한 경험을 정리했다.
Spring
Querydsl Web Support의 Entity 노출 문제를 Alias 아키텍처로 해결하기
Spring Data의 Querydsl Web Support에 Alias 시스템을 도입하여 Entity 노출 문제를 해결하고, API 스펙의 안정성과 문서화를 Single Source of Truth로 관리하는 아키텍처를 설계했다.
Test
반복 테스트에 들어가는 시간을 줄이는 방법 — 자동화 전략과 QA 협업
릴리즈마다 같은 시나리오를 수동으로 반복하는 데 시간이 너무 많이 들었다. 테스트 피라미드 재설계와 계약 테스트 도입으로 반복을 줄이고 QA가 탐색 테스트에 집중할 수 있는 구조를 만들기까지의 고민을 정리한다.