huny.log

tag

#regression

2개의 글

AI·LLM llm · evaluation

LLM evaluation harness — 분기마다 챗봇 품질을 자동 평가하는 공장

챗봇·에이전트가 운영에 들어가면 한 번 평가가 아니라 분기 자동 평가가 필요합니다. 골든셋·regression·hyperparameter A/B를 묶는 evaluation harness 설계와 마케팅 자리에서의 적용.

통계·ML regression · classification

회귀와 분류 — 마케터가 가장 자주 만나는 두 머신러닝 모델 가족

"이 유저의 LTV는 얼마?" "이 유저가 이탈할까?" 두 질문이 머신러닝의 두 가족 — 회귀와 분류 — 의 출발점입니다. 무엇이 다르고 어디 쓰는지·어떻게 평가하는지를 한 글로 정리. ML 기초 체력의 첫 자리.