글 목록 · 3 / 6
-
외주 vs 내재화 — 우리가 처음 외주를 시도한 이유
세 명짜리 풀스택 팀이 처음으로 외주를 시도한 경험 — 무엇을 기대했고, 실제로 무엇을 배웠는지를 솔직하게 기록한다.
-
SSH key 회전 정책 — 우리는 분기에 한 번
팀 서버의 SSH 키를 얼마나 자주 바꿔야 하는가 — 우리가 분기 1회로 결론 낸 이유와 실제 운영 절차를 공유한다.
-
Observability — 작은 팀의 가난한 자의 스택
Datadog도 Grafana Cloud도 없는 세 명짜리 팀이 운영 중인 서비스를 어떻게 들여다보는지, 현실적인 observability 스택을 공유한다.
-
한 명이 빠졌을 때를 대비한 문서화 룰
세 명짜리 팀에서 한 명이 자리를 비울 때 어떻게 시스템이 돌아가게 할지 — 우리가 실제로 정착시킨 문서화 규칙을 공유한다.
-
RBAC 를 코드에 박지 않는 이유
역할 기반 접근 제어를 하드코딩하지 않고 데이터로 관리하는 방식을 선택한 이유와 구현 방향, 그리고 실제 운영에서 생기는 트레이드오프를 이야기한다.
-
도메인 등록부터 SSL 까지 — 24시간 내 셋업 체크리스트
새 서비스를 위한 도메인 등록, DNS 설정, SSL 적용을 24시간 안에 마치기 위한 실전 체크리스트와 자주 발생하는 실수를 정리한다.
-
PostgreSQL 과 MariaDB — 결제 도메인 선택
결제와 정산을 다루는 서비스에서 PostgreSQL 과 MariaDB 중 무엇을 선택할지 고민하는 과정과 우리가 최종적으로 선택한 이유를 정리한다.
-
오픈소스 LLM 을 더 깊게 들여다본 한 달
상용 LLM API 대신 오픈소스 모델을 직접 운영해보면서 느낀 현실적인 한계와 가능성, 그리고 우리가 내린 판단을 기록한다.
-
우리는 무엇을 만들고 있는가 (공개 가능한 부분만)
세 명이 풀스택으로 운영하는 서비스의 구조와 방향에 대해, 외부에 공개할 수 있는 범위 안에서 솔직하게 이야기한다.
-
일하는 시간을 절반으로 줄여본 한 달
팀 전체가 한 달 동안 실제 작업 시간을 기록하고 불필요한 시간을 제거한 실험과 그 결과를 솔직하게 공유한다.
-
첫 incident — 어느 새벽의 30분
서비스 운영 중 처음 겪은 장애 30분을 시간 순으로 복기하고, 우리가 그 이후 바꾼 것들을 기록한다.
-
lock-free 를 우리가 선택하지 않은 케이스
동시성 문제를 마주쳤을 때 lock-free 자료구조를 검토했지만 결국 선택하지 않은 이유와 대신 선택한 접근법을 공유한다.
-
ORM 을 우리가 쓰지 않는 도메인
ORM 이 코드를 단순하게 만들어주는 것은 맞지만, 우리 팀이 특정 도메인에서 ORM을 의도적으로 사용하지 않기로 한 이유를 솔직하게 이야기한다.
-
CDN 캐시 invalidation 의 함정
Cloudflare 앞단에 캐시를 뒀을 때 invalidation 타이밍이 왜 생각대로 동작하지 않는지, 우리가 겪은 사례와 해결책을 정리한다.
-
서비스 장애 학습회 — 형식이 바뀌는 이유
장애가 났을 때 팀이 어떻게 돌아보는지, 그 형식을 바꿔온 과정과 이유를 솔직하게 정리했다.
-
CI/CD — GitHub Actions 만으로 충분한 시점
Jenkins, ArgoCD 같은 별도 도구 없이 GitHub Actions만으로 CI/CD를 운영하는 것이 언제 합리적인 선택인지를 정리했다.
-
작은 회사의 모니터링 — 무엇을 보고 무엇을 무시하는가
소규모 팀이 운영 환경을 모니터링할 때 실제로 유용한 지표와 주의 분산만 일으키는 지표를 구분하는 기준을 공유한다.
-
일정 추정의 50% 룰 — 우리가 멈춘 지점
일정을 두 배로 잡아도 늘 부족했던 이유와, 우리 팀이 추정 방식을 바꾸면서 멈추게 된 지점을 솔직하게 적었다.
-
Redis 를 캐시로만 쓰지 않는 6가지 패턴
Redis를 단순 캐시 레이어로만 활용하는 데 그치지 않고, 우리 팀이 실제로 적용해본 6가지 활용 패턴을 정리했다.
-
backup 정책 — 우리는 매일 새벽 4시
소규모 팀이 운영 서버의 백업 정책을 어떻게 설계하고 실제로 어떻게 유지하는지 우리 팀의 사례를 공유한다.