728x90
개요
- 데이터 : [롯데카드] 서울시 성별 연령대별 음식 업종 소비트렌드(2023년 8월)
- 출처 : 금융데이터거래소
데이터 살펴보기
- crym : 결제 월
- ana_mgpo_nm : 행정구역 (서울시)
- ana_ccd_nm : 행정구역 (25개 구)
- tco_btc_nm : 결제 업종
- ma_fem_dc : 성별
- ana_agegrp_dc : 연령대
- sl_am : 업종 구분 (롯데카드 자체 구분)
- sl_ct : 이용 금액
주제 1 - 연령대 별 결제 금액의 평균 살펴보기
data.groupby(['ana_ccd_nm','ana_agegrp_dc', 'ma_fem_dc'])['sl_ct'].count().to_frame()
subject1 = data['sl_ct'].groupby(data['ana_agegrp_dc']).mean()
sns.barplot(x=subject1.index, y=subject1, data=data)
plt.xlabel('연령대')
plt.ylabel('금액(원)')
plt.title(label='2023년 8월 연령대 별 평균 지출 금액')
plt.show()
- 40대가 구매력이 가장 높다
- 50대부터 금액이 적어지는 이유는 가족에 의한 결제, 절대적인 식사 양의 감소 등이 있을 수 있다.
- 20대부터 40대까지 평균 지출금액이 대략 2배씩 증가한다.
주제 2 - 행정구역(구)별 평균 지출 금액 살펴보기
subject2 = data.groupby(data['ana_ccd_nm'])['sl_ct'].mean().to_frame().sort_values(by='sl_ct')
plt.figure(figsize=(20, 5))
sns.barplot(x=price_by_area.index, y='sl_ct', data=price_by_area)
plt.title(label='2023년 8월 구별 평균 지출 금액')
plt.xlabel('행정구')
plt.ylabel('금액(원)')
plt.show()
- 강남구의 평균 지출 금액이 가장 높다
- 아파트 평균 단위가격과 비교해 소위 '땅값'이라 불리는 데이터와 비교해 이를 비교할 수 있다.
temp = pd.merge(subject2, apt_price_data, left_on='ana_ccd_nm', right_on='구')
tmep = temp[order]
plt.figure(figsize=(20, 5))
sns.barplot(x=temp['구'], y=temp['sl_ct'])
sns.lineplot(x=temp['구'], y=temp['2023년 08월'])
plt.title(label='2023년 8월 구별 평균 지출 금액')
plt.xlabel('행정구')
plt.ylabel('금액(원)')
plt.show()
- 부동산통계정보의 '평균단위매매가격_아파트' 데이터와 병합하여 확인한 결과, 평균단위매매가격과 적은 유사성을 보인다.