huny.log

tag

#fundamentals

15개의 글

매체 데이터 알아보기 data-pipeline · bi

광고 측정 데이터 흐름 — impression부터 BI 대시보드까지

광고 임프레션이 일어난 순간부터 BI 대시보드의 ROAS 한 숫자가 되기까지, 데이터는 5개 레이어를 거칩니다. 각 레이어의 역할·자주 깨지는 자리·운영 표준을 한 글로. 시리즈 4 마지막, 매체 기초의 마무리.

매체 데이터 알아보기 ad-tech · dsp

광고 생태계 지도 — 광고주·매체·DSP·SSP·DMP·CDP가 어떻게 연결되는가

광고 운영의 약어들 — DSP·SSP·DMP·CDP·Ad Exchange — 가 매번 헷갈립니다. 광고주에서 매체까지 한 임프레션이 어떻게 흘러가는지 한 그림으로 정리하면 그 다음 모든 광고 글이 다르게 읽힙니다. 매체 기초 체력의 첫 자리.

매체 데이터 알아보기 attribution · history

어트리뷰션의 역사 — 쿠키 last-click부터 클린룸까지의 변화

광고 어트리뷰션은 1990년대 last-click에서 시작해 multi-touch·MMM·incrementality·클린룸까지 진화했습니다. 한 도구가 다른 도구로 대체된 게 아니라 층층이 쌓인 도구상자. 그 변화의 흐름을 한 줄로 따라가는 매체 기초.

통계·ML cross-validation · k-fold

Cross-validation 기초 — 진짜 모델 성능을 측정하는 자리

학습 정확도 95% / 운영 정확도 60%의 함정은 검증 분할이 잘못됐기 때문입니다. cross-validation은 같은 데이터를 여러 번 쪼개 학습·평가해 진짜 일반화 능력을 측정합니다. K-fold·시계열 CV·운영 적용까지, ML 기초의 마지막 자리.

AI·LLM embedding · fundamentals

임베딩이란 뭔가 — 단어가 숫자가 되는 자리, 마케터를 위한 직관

"임베딩"이라는 단어가 자주 나오는데 정확히 뭔지 한 번도 안 들여다보면 RAG·추천·검색이 늘 신비로 남습니다. 단어·문장·이미지가 어떻게 숫자 벡터가 되고 그 벡터로 무엇을 할 수 있는지 — 마케터가 LLM·추천·검색을 이해하는 두 번째 기초 체력.

통계·ML evaluation · metrics

평가 지표 도구상자 — accuracy·precision·recall·AUC·MAPE 어디 쓸지

같은 모델·같은 데이터에 어떤 지표를 보느냐가 결론을 통째로 바꿉니다. accuracy 95%면 좋은 거? 클래스 불균형이면 의미 없을 수 있어요. 회귀·분류 평가 지표를 자리별로 정리한 운영 도구상자.

AI·LLM fine-tuning · rag

fine-tuning vs RAG vs prompting — 같은 LLM을 다르게 쓰는 세 도구의 분기

같은 LLM을 우리 자리에 맞게 쓰는 길이 세 갈래입니다 — prompting(지시), RAG(외부 검색), fine-tuning(모델 자체 변경). 비용·속도·정확도가 모두 다릅니다. 마케터·운영자가 어느 자리에 어느 도구를 골라야 하는지의 결정 트리.

퍼포먼스 마케팅 kpi · cpm

광고 KPI 한 그림 — CPM·CPC·CTR·CVR·ROAS·CAC·LTV의 관계

광고 운영의 약어들이 매번 헷갈립니다. 사실 7개 KPI는 단순한 곱셈·나눗셈 관계로 한 그림에 모두 들어갑니다. 임프레션부터 매출까지의 funnel을 KPI로 따라가는 매체 기초 체력.

AI·LLM llm · tokenization

LLM이 어떻게 답을 만드는가 — 토큰·다음 단어 예측·temperature 기초 체력

GPT·Claude·Gemini가 답을 어떻게 만드는지 한 번도 안 들여다보면 LLM 활용이 늘 신비로 남습니다. 토큰화·다음 단어 예측·temperature·top-p의 4가지 핵심만 잡으면 LLM이 왜 그렇게 답하는지 보입니다. 마케터가 LLM을 다룰 때의 첫 기초 체력.

AI·LLM hallucination · llm

LLM 환각이 일어나는 이유 — 자신 있게 틀린 답을 하는 자리의 이해

LLM은 모르는 자리에서 "모릅니다" 대신 그럴듯한 거짓을 만들어냅니다. 이 환각(hallucination)의 원인은 LLM이 통계적 토큰 예측기라는 본질에 있습니다. 왜 일어나는지·언제 가장 자주 발생하는지·어떻게 줄이는지를 마케터 시각으로 정리.

통계·ML loss-function · gradient-descent

손실 함수와 학습 — 모델이 데이터에서 배우는 방식의 직관

"모델이 학습한다"의 안에서 무엇이 일어나는지 한 번도 안 들여다보면 머신러닝이 신비로 남습니다. 손실 함수·gradient descent의 한 줄 직관 — "오차를 어떻게 줄이나" — 만 잡으면 회귀·분류·딥러닝이 같은 원리로 보입니다.

통계·ML overfitting · regularization

Overfitting과 정규화 — 외운 모델 vs 일반화하는 모델

학습 데이터에서 99% 정확도, 새 데이터에서 60% — 가장 흔한 ML 함정 overfitting입니다. 모델이 데이터를 외운 자리. L1·L2·Dropout·Early Stopping 같은 정규화로 일반화하는 모델로 만드는 방법, 마케터·운영자가 알아야 할 핵심 직관.

통계·ML regression · classification

회귀와 분류 — 마케터가 가장 자주 만나는 두 머신러닝 모델 가족

"이 유저의 LTV는 얼마?" "이 유저가 이탈할까?" 두 질문이 머신러닝의 두 가족 — 회귀와 분류 — 의 출발점입니다. 무엇이 다르고 어디 쓰는지·어떻게 평가하는지를 한 글로 정리. ML 기초 체력의 첫 자리.

퍼포먼스 마케팅 rtb · bidding

RTB와 입찰 — 0.1초에 일어나는 광고 경매의 모든 것

디지털 광고는 매 임프레션마다 0.1초 안에 경매가 일어납니다. RTB(Real-Time Bidding)의 흐름·입찰가가 결정되는 메커니즘·마케터가 운영에서 만지는 자리를 한 글로 정리. 매체 기초 체력의 두 번째.

AI·LLM transformer · attention

트랜스포머 직관 — attention이 LLM의 핵심이 된 이유

"트랜스포머·attention"이라는 단어가 LLM 글에 늘 나옵니다. 정확히 뭐냐고 물으면 답하기 어렵죠. 마케터가 알아야 할 단 한 가지 직관 — "어느 단어가 어느 단어를 보고 있나" — 만 잡으면 LLM의 강점·약점이 보입니다. 수식 없이 풀어가는 트랜스포머 입문.