์๊ฐ ๋ฐ์ดํฐ๋ฅผ DataFrame์ผ๋ก ์ฒ๋ฆฌํ ๋ Pandas resample() ํจ์๋ฅผ ์ฌ์ฉํ์ฌ ์๊ฐ์ ์ฌ์กฐ์ ํ ์ ์๋ค.
import pandas as pd
df = pd.read_csv("../input/bigdatacertificationkr/basic2.csv", parse_dates=['Date'], index_col=0)
์๊ณ์ด ๋ฐ์ดํฐ๋ฅผ ๋ถ๋ฌ์ต๋๋ค.
์ฃผ ๋จ์์ ์ปฌ๋ผ ํฉ๊ณ๋ฅผ ๊ตฌํด๋ณด์!
resample('W') ์ฌ์ฉ
df_w = df.resample('W').sum()
df_w
Date ์ปฌ๋ผ์ ๋ณด๋ฉด ์ฃผ ๋จ์๋ก ๋ณ๊ฒฝ ๋ ๊ฒ์ ๋ณผ ์ ์๋ค.
์ ๋จ์์ ์ปฌ๋ผ ํฉ๊ณ๋ฅผ ๊ตฌํด๋ณด์.
resample('M') ์ฌ์ฉ
df_m = df.resample('M').sum()
df_m
Date ์ปฌ๋ผ์ ๋ณด๋ฉด ์(๋ง์ง๋ง๋ ๊ธฐ์ค) ๋จ์๋ก ๋ณ๊ฒฝ ๋ ๊ฒ์ ๋ณผ ์ ์๋ค.
resample('MS') ์ฌ์ฉ
df_ms = df.resample('MS').sum()
df_ms
Date ์ปฌ๋ผ์ ๋ณด๋ฉด ์(์์ ์ผ ๊ธฐ์ค) ๋จ์๋ก ๋ณ๊ฒฝ ๋ ๊ฒ์ ๋ณผ ์ ์๋ค.
์ฃผ๊ธฐ ๋จ์ ์ ๋ฆฌ
๋ ์ง ์คํ์ ๋น๋ ๋ฌธ์์ด์ค๋ช
์ฐธ๊ณ : https://pandas.pydata.org/pandas-docs/stable/user_guide/window.html
DateOffset | ์์ | ์ผ๋ฐ ์คํ์ ํด๋์ค, ๊ธฐ๋ณธ๊ฐ์ ์ ๋ 24์๊ฐ์ ๋๋ค. |
BDay๋๋BusinessDay | 'B' | ์์ ์ผ(ํ์ผ) |
CDay๋๋CustomBusinessDay | 'C' | ๋ง์ถค ์์ ์ผ |
Week | 'W' | ์ผ์ฃผ์ผ, ์ ํ์ ์ผ๋ก ์์ผ์ ๊ณ ์ |
WeekOfMonth | 'WOM' | ๋งค์ y๋ฒ์งธ ์ฃผ์ x๋ฒ์งธ ๋ |
LastWeekOfMonth | 'LWOM' | ๋งค์ ๋ง์ง๋ง ์ฃผ์ x๋ฒ์งธ ๋ |
MonthEnd | 'M' | ์ญ์๋ง |
MonthBegin | 'MS' | ์ญ์ ์์ |
BMonthEnd๋๋BusinessMonthEnd | 'BM' | ์์ ์๋ง |
BMonthBegin๋๋BusinessMonthBegin | 'BMS' | ์์ ์ ์์ |
CBMonthEnd๋๋CustomBusinessMonthEnd | 'CBM' | ๋ง์ถคํ ์์ ์๋ง |
CBMonthBegin๋๋CustomBusinessMonthBegin | 'CBMS' | ๋ง์ถคํ ๋น์ฆ๋์ค ์ ์์ |
SemiMonthEnd | 'SM' | 15์ผ(๋๋ ๋ค๋ฅธ day_of_month) ๋ฐ ์ญ์๋ง |
SemiMonthBegin | 'SMS' | 15์ผ(๋๋ ๋ค๋ฅธ day_of_month) ๋ฐ ์ญ์ ์์ |
QuarterEnd | 'Q' | ๋ฌ๋ ฅ ๋ถ๊ธฐ๋ง |
QuarterBegin | 'QS' | ๋ฌ๋ ฅ ๋ถ๊ธฐ ์์ |
BQuarterEnd | 'BQ | ์ฌ์ ๋ถ๊ธฐ๋ง |
BQuarterBegin | 'BQS' | ์ฌ์ ๋ถ๊ธฐ ์์ |
FY5253Quarter | 'REQ' | ์๋งค(์ผ๋ช 52-53์ฃผ) ๋ถ๊ธฐ |
YearEnd | 'A' | ๋ฌ๋ ฅ ์ฐ๋ง |
YearBegin | 'AS'๋๋'BYS' | ์ญ๋ ์์ |
BYearEnd | 'BA' | ์ฌ์ ์ฐ๋ง |
BYearBegin | 'BAS' | ์ฌ์ ์ฐ๋ ์์ |
FY5253 | 'RE' | ์๋งค(์ผ๋ช 52-53์ฃผ) ์ฐ๋ |
Easter | ์์ | ๋ถํ์ |
BusinessHour | 'BH' | ์์ ์๊ฐ |
CustomBusinessHour | 'CBH' | ๋ง์ถค ์ ๋ฌด ์๊ฐ |
Day | 'D' | ์ ๋์ ์ธ ํ๋ฃจ |
Hour | 'H' | ํ ์๊ฐ |
Minute | 'T'๋๋'min' | 1๋ถ |
Second | 'S' | ์ผ์ด |
Milli | 'L'๋๋'ms' | 1๋ฐ๋ฆฌ์ด |
Micro | 'U'๋๋'us' | 1๋ง์ดํฌ๋ก์ด |
Nano | 'N' | 1๋๋ ธ์ด |
'Study > Python' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
[pandas] ๋ฐ์ดํฐํ๋ ์ ํ ์ด๋ํ๊ธฐ .shift() (0) | 2023.06.15 |
---|---|
[pandas] ์ค๋ณต ์ฒ๋ฆฌ(duplicated, drop_duplicates) (0) | 2023.06.14 |
[python] ๋ฐ์ดํฐํ๋ ์ ๋ณํฉํ๊ธฐ pd.merge() (0) | 2023.06.10 |
[python] read_csv๋ก ๋ฐ์ดํฐ ๋ถ๋ฌ์ฌ ์ parse_dates ์ต์ ์ผ๋ก datetime ํํ๋ก ์ง์ ํ๊ธฐ (0) | 2023.06.09 |
[python] ์ธ๋ฑ์ค๋ฅผ ์ด๋ก ๋ณํ (reset_index) (0) | 2023.06.06 |