개요

  • 데이터 : [롯데카드] 서울시 성별 연령대별 음식 업종 소비트렌드(2023년 8월)
  • 출처 : 금융데이터거래소

데이터 살펴보기

  • crym : 결제 월
  • ana_mgpo_nm : 행정구역 (서울시)
  • ana_ccd_nm : 행정구역 (25개 구)
  • tco_btc_nm : 결제 업종
  • ma_fem_dc : 성별
  • ana_agegrp_dc : 연령대
  • sl_am : 업종 구분 (롯데카드 자체 구분)
  • sl_ct : 이용 금액


주제 1 - 연령대 별 결제 금액의 평균 살펴보기

data.groupby(['ana_ccd_nm','ana_agegrp_dc', 'ma_fem_dc'])['sl_ct'].count().to_frame()

subject1 = data['sl_ct'].groupby(data['ana_agegrp_dc']).mean()

sns.barplot(x=subject1.index, y=subject1, data=data)
plt.xlabel('연령대')
plt.ylabel('금액(원)')
plt.title(label='2023년 8월 연령대 별 평균 지출 금액')
plt.show()

  • 40대가 구매력이 가장 높다
  • 50대부터 금액이 적어지는 이유는 가족에 의한 결제, 절대적인 식사 양의 감소 등이 있을 수 있다.
  • 20대부터 40대까지 평균 지출금액이 대략 2배씩 증가한다.

주제 2 - 행정구역(구)별 평균 지출 금액 살펴보기

subject2 = data.groupby(data['ana_ccd_nm'])['sl_ct'].mean().to_frame().sort_values(by='sl_ct')

plt.figure(figsize=(20, 5))
sns.barplot(x=price_by_area.index, y='sl_ct', data=price_by_area)
plt.title(label='2023년 8월 구별 평균 지출 금액')
plt.xlabel('행정구')
plt.ylabel('금액(원)')
plt.show()

  • 강남구의 평균 지출 금액이 가장 높다
  • 아파트 평균 단위가격과 비교해 소위 '땅값'이라 불리는 데이터와 비교해 이를 비교할 수 있다.

 

temp = pd.merge(subject2, apt_price_data, left_on='ana_ccd_nm', right_on='구')
tmep = temp[order]

plt.figure(figsize=(20, 5))
sns.barplot(x=temp['구'], y=temp['sl_ct'])
sns.lineplot(x=temp['구'], y=temp['2023년 08월'])
plt.title(label='2023년 8월 구별 평균 지출 금액')
plt.xlabel('행정구')
plt.ylabel('금액(원)')
plt.show()

평균단위매매가격_아파트 출처 - 부동산통계정보시스템

  • 부동산통계정보의 '평균단위매매가격_아파트' 데이터와 병합하여 확인한 결과, 평균단위매매가격과 적은 유사성을 보인다.

+ Recent posts