데.분.데.문이란?
'데이터 분석으로, 데이터 관련 문제를 해결하다' 의 줄임말로,
진짜 현업에서의 데이터 기반의 의사결정을 위한 방법을 정리해 드리는
이노핏파트너스 디지털기술센터의 신규 시리즈입니다. |
|
|
|
고객의 연령대별 구매 패턴을 분석하는 것은 고객 맞춤형 마케팅 전략을 수립하고 제품 기획에 있어 필수적인 과정이다. 연령대에 따라 소비자들의 구매 행동은 크게 다르며, 이를 정확히 이해하면 특정 연령층을 대상으로 하는 사업과 프로모션 효과를 극대화할 수 있다.
본 아티클에서는 고객 연령대별 구매 패턴을 분석하기 위해 필요한 데이터를 수집하고, Excel을 활용하여 효과적으로 분석하는 방법을 제시하고자 한다. |
|
|
|
어떤 데이터를 수집할 것인가?
고객 연령대별 구매 패턴을 분석하기 위해 수집해야 할 데이터는 다음과 같다.
고객 프로필 데이터 고객의 연령대(예: 20대, 30대, 40대 등), 성별, 거주지, 직업, 가구 소득 수준, 가족 구성원 수 등을 포함한다. 이 데이터는 고객을 세분화하고 연령대별로 특성화된 마케팅 전략을 개발하는 데 필요하다.
구매 이력 데이터 고객별로 구매한 상품의 상세 내역, 구매 날짜, 구매 수량, 구매 금액, 구매 채널(온라인, 오프라인) 등의 정보를 포함한다. 이 데이터를 통해 특정 연령대가 선호하는 제품 유형과 구매 빈도를 분석할 수 있다.
재구매 데이터 고객별로 월별 구매 횟수, 재구매율, 평균 구매 간격을 포함한 데이터를 수집한다. 이 데이터는 각 연령대가 얼마나 자주 재구매를 하는지, 특정 제품에 대한 충성도가 얼마나 높은지를 평가하는 데 도움이 된다.
고객 반응 관련 데이터 각 연령대별로 진행된 마케팅 캠페인에 대한 반응 데이터를 수집한다. 일례로 이메일 열람률, 쿠폰 사용률, 프로모션 클릭률 등을 포함하며, 이를 통해 특정 연령대에 대한 마케팅 전략의 효과성을 평가할 수 있다.
다음은 수집된 데이터를 바탕으로 정리한 예시 데이터 표이다.
|
|
|
|
고객 ID |
연령대 |
구매 횟수 |
총 구매 금액 |
구매 상품 |
최근 활동일 |
innofit1 |
20대 |
6 |
2,000,000 |
태블릿 PC |
24-09-01 |
innofit1 |
20대 |
6 |
2,100,000 |
노트북 |
24-09-03 |
innofit1 |
30대 |
2 |
2,300,000 |
노트북 |
24-09-04 |
innofit1 |
30대 |
4 |
1,600,000 |
휴대폰 |
24-09-04 |
|
|
Excel 함수로 고객 구매패턴 분석하기
SUMIF 함수 (=SUMIF(B2:B6, "20대", D2:D6)): SUMIF 함수는 특정 조건을 만족하는 값을 합산할 때 사용한다. 예를 들어 20대 고객의 총 구매 금액을 합산하기 위한 경우 B2:B6은 연령대 범위, "20대"는 합산할 조건, D2:D6은 총 구매 금액 범위다.
결과: =SUMIF(B2:B6, "20대", D2:D6) 을 입력하면, 4,100,000 이 된다.
AVERAGEIF 함수 (=AVERAGEIF(B2:B6, "30대", C2:C6)): AVERAGEIF 함수는 특정 조건을 만족하는 값들의 평균을 계산하는 데 사용된다. 30대 고객의 평균 구매 횟수를 구한다면 B2:B6열은 연령대 범위, "30대"는 조건, C2:C6은 구매 횟수로 두고 위 수식을 넣는다.
결과: =AVERAGEIF(B2:B6, "30대", C2:C6)을 입력하면, 3이 된다.
COUNTIF 함수 (=COUNTIF(F2:F6, ">=2024-09-03")): COUNTIF 함수는 특정 조건을 만족하는 셀의 개수를 세는 함수다. 만약 최근 활동일이 9월 3일 이후인 고객의 수를 계산한다면, F열에 날짜를 둔 후 기준 시점을 입력하면 된다. 숫자를 넣어 적용할 수도 있으며, 부등호를 바꿀 수도 있다.
결과: =COUNTIF(F2:F6, ">=2024-09-03")을 입력하면, 3이 나온다
CORREL 함수 (=CORREL(C2:C6, D2:D6)): CORREL 함수는 두 변수 간의 상관계수를 계산하여 데이터 간의 선형 관계를 측정하는 데 사용된다. 변수 간 연관성을 파악할 때 유용한 방법이다.
구매 횟수와 총 구매 금액 간의 상관관계를 분석한다면 C2:C6은 구매 횟수 범위, D2:D6은 총 구매 금액 범위가 된다. 통상적으로 0.90 이상이 나올 경우 유의수준이 높아 연관성이 높다고 볼 수 있다.
결과: =CORREL(C2:C6, D2:D6)을 입력하면, 상관계수는 -0.236이 된다. 이는 구매 횟수와 총 구매 금액 간에 상관관계가 크지 않음을 의미한다.
|
|
|
|
FREQUENCY 함수
FREQUENCY 함수는 특정 범위 내의 값들이 다른 범위에서 얼마나 자주 나타나는지를 계산하는 함수다. 예를 들어, 구매 빈도 데이터를 분석하여 특정 구매 횟수의 빈도(예: 주 1회 구매, 주 2회 구매 등)를 파악할 때 유용하다.
- 수식: =FREQUENCY(데이터 범위, 구간 범위)
- 예시: =FREQUENCY(C2:C6, {5, 10, 15, 20})
MODE 함수
MODE 함수는 데이터 세트에서 가장 자주 발생하는 값을 반환한다. 구매 패턴 분석에서 특정 제품의 구매 빈도나 평균 구매 기간을 분석할 때 사용된다.
- 수식: =MODE(데이터 범위)
- 예시: =MODE(C2:C6)
3. MEDIAN 함수
MEDIAN 함수는 데이터 집합에서 중간 값을 반환한다. 데이터가 왜곡되었을 때(예: 극단적인 값이 있을 때) 평균보다 더 적합한 중앙값을 분석할 때 자주 사용된다. AVERAGE 값을 함께 같이 구하는 것이 좋다.
사용법
- 수식: =MEDIAN(데이터 범위)
- 예시: =MEDIAN(D2:D6)
4. PERCENTILE 함수
PERCENTILE 함수는 주어진 데이터 집합에서 지정된 백분위수에 해당하는 값을 반환한다. 예를 들어, 상위 10%의 고객의 총 구매 금액을 파악하거나 하위 25% 고객의 구매 패턴을 분석할 때 유용하다.
사용법
- 수식: =PERCENTILE(데이터 범위, n%)
- 예시: =PERCENTILE(D2:D6, 0.9)
- D2:D6은 총 구매 금액 범위, 0.9는 상위 90% 백분위수를 나타낸다.
5. RANK 함수
RANK 함수는 특정 값이 데이터 세트 내에서 차지하는 순위를 반환한다. 예를 들어, 각 고객의 구매 금액이 전체 데이터에서 몇 번째 순위에 해당하는지를 파악할 때 유용하다.
사용법
- 수식: =RANK(값, 데이터 범위, [순서])
- 예시: =RANK(D2, D2:D6, 0)
- D2는 순위를 매길 구매 금액 값, D2:D6은 전체 구매 금액 데이터 범위, 0은 내림차순 정렬(값이 클수록 높은 순위)을 의미한다.
- 이 함수는 특정 구매 금액이 전체 데이터에서 몇 번째에 위치하는지를 계산한다.
|
|
|
|
교육 후 즉시 현업에 적용 가능한 이노핏의 '데이터 분석' 교육 |
|
|
|
데이터가 넘쳐나는 시대에 리더가 마주하는 중요한 과제는 데이터를 직접 분석하는 것이 아니라, 데이터를 바탕으로 신속하고 정확한 의사결정을 내리는 것이다. 데이터를 통해 중요한 인사이트를 도출해도, 이를 어떻게 의사결정에 반영할지 모른다면 분석 자체는 큰 의미가 없다. |
|
|
|
| [이미지] 이노핏파트너스가 제안하는 데이터 기반 의사결정을 위한 5단계 프레임워크 |
|
|
|
| 산업군, 기업의 개별 데이터 형식에 딱 맞춘 문제해결형 데이터 분석 전문 교육 |
| |
| 데이터로 고객의 맥락을 파악해 문제를 찾아내고 해결하는 교육 |
| |
|
|
이노핏파트너스 innofit@innofitpartners.com 서울 서초구 방배로 52, 감정평가사회관 3F
|
|
|
|
|