글 목록 · 5 / 6
-
context 압축 전략 — 우리가 시도한 3가지
LLM 컨텍스트 창이 길어질수록 비용과 지연이 늘어난다. 우리 팀이 실제 서비스에서 시도한 세 가지 압축 전략을 정리한다.
-
PR 사이즈를 200줄로 강제했더니 일어난 일
팀 내 PR 크기 상한선을 200줄로 정하고 3개월간 운영한 결과, 코드 리뷰 방식과 개발 습관이 어떻게 바뀌었는지 기록한다.
-
사용자 입력을 LLM에 그대로 넘기지 않는 4가지 패턴
프롬프트 인젝션과 데이터 유출을 막기 위해 우리 팀이 실제로 적용한 입력 전처리 패턴 네 가지를 공유한다.
-
fail2ban + ufw 만으로 충분한가
소규모 팀 서버에서 fail2ban과 ufw 조합이 실제로 어느 수준까지 방어해 주는지, 그리고 어디서 한계를 만나는지 정리한다.
-
agent benchmark 의 함정 — SWE-bench 와 실무 갭
SWE-bench 점수가 올라갈수록 에이전트가 실무에서도 더 유용해지는가. 우리가 경험한 차이와 그 이유를 정리한다.
-
SSR vs SSG vs ISR — 우리 사이트의 분류표
새 페이지나 서비스를 만들 때마다 렌더링 방식을 고민한다. 팀 내에서 정리한 판단 기준과 실제 적용 사례를 공유한다.
-
AI 코딩 에이전트가 만드는 코드의 평균 품질
AI 에이전트가 생성한 코드를 6개월 동안 리뷰하면서 관찰한 패턴을 정리한다. 잘하는 것과 반복적으로 실수하는 것을 구분해서 기록한다.
-
코드 리뷰 룰을 3번 바꾸면서 배운 것
세 명짜리 팀이 1년 반 동안 코드 리뷰 규칙을 세 번 바꿨다. 각 버전에서 무엇이 문제였고 어떻게 수정했는지 기록한다.
-
structured output 을 우리는 언제 쓰고 언제 안 쓰는가
JSON 스키마 강제 출력이 항상 좋은 것은 아니다. 팀이 실제로 적용하면서 만든 판단 기준을 정리한다.
-
RAG 의 사망 선고는 매해 발표된다
컨텍스트 윈도우가 백만 토큰을 넘었다는 소식이 나올 때마다 RAG 가 죽었다는 말이 따라온다. 우리가 실제로 경험한 것은 달랐다.
-
iwinv VM 한 대로 어디까지 가능한가 — 6개월 측정치
2vCPU / 2GB RAM 단일 VM 에서 실제 서비스를 6개월 운영한 결과를 수치로 정리한다. 한계와 운영 노하우를 함께 공유한다.
-
회의 없는 화요일을 1년 운영해봤다
세 명짜리 팀이 화요일 회의를 전부 없앤 뒤 1년이 지났다. 달라진 것과 달라지지 않은 것을 솔직하게 기록한다.
-
multimodal 모델로 운영 모니터링 캡처 자동 분석
대시보드 스크린샷을 매일 모델에 넘겨 이상 징후를 텍스트로 요약하는 파이프라인을 만들었다. 설계 원칙과 실제 한계를 공유한다.
-
Cloudflare 가 우리 인프라를 4단계 단순화시켰다
DNS 프록시 하나를 붙였을 뿐인데 SSL 관리, DDoS 방어, 캐시, 글로벌 CDN이 한꺼번에 해결됐다. 그 과정에서 우리가 실제로 없앤 것들을 정리한다.
-
팀이 처음 만난 날부터 100일
세 명이 처음 한 프로젝트에서 협업을 시작한 날로부터 100일이 지났다. 코드보다 사람 쪽에서 더 많이 배웠다는 것을 인정하는 글이다.
-
2026년 1분기 LLM 시장 정리: 공급, 가격, 컨텍스트
2025년 하반기부터 2026년 초까지 LLM 시장에서 실제로 달라진 것들 — 공급 다양화, 가격 하락, 컨텍스트 확장 — 을 팀 관점에서 정리한다.
-
AI가 PR을 만든다 — 코드 리뷰는 누구의 일인가
AI 도구가 풀 리퀘스트를 직접 생성하는 시대에, 코드 리뷰의 목적과 책임이 어디로 이동하는지 생각해봤다.
-
Agent Harness라는 개념을 처음 접한 날
단순히 LLM을 호출하던 코드가 왜 어느 순간부터 복잡해지는지, 그 이유를 harness라는 틀로 이해하게 된 과정을 기록한다.
-
오픈소스 LLM 을 우리는 왜 안 쓰는가
클로즈드 API 대신 오픈소스 LLM 을 쓰지 않는 이유를 팀 관점에서 솔직하게 정리했다. 비판이 아니라 현실적인 이유다.
-
Sonnet 4.6 과 Opus 4.7 — 우리 팀의 사용 분포
두 모델을 실무에서 함께 쓰면서 어떤 작업에 어떤 모델을 배치하는 것이 효율적인지 정리했다.