시계열 데이터 탐색하기

Datetime 형태로 변환하기

  • pd.to_datetime()
import pandas as pd
dates = ["2020-01-01", "2020-03-01", "2020-09-01"]
ts_dates = pd.to_datetime(dates)  # 리스트형태의 변수만 가능

 

 

Datetime 기간 설정

  • pd.period_range()
timestamp_df = pd.date_range(start = "2020-01-01",
                             end = None,
                             periods = 6,
                             freq = "Y",
                             tz = 'Asia/Seoul')

출력값

  • freq에 가능한 설정 : Y, M, D, H, MIN, S

 

 

문자형 데이터에서 년,월,일 추출하여 새로운 칼럼에 넣기

date_df

  • split() 함수 사용
date_df['년'] = date_df.Date.str.split('-').str[0]
date_df['월'] = date_df.Date.str.split('-').str[1]
date_df['일'] = date_df.Date.str.split('-').str[2]
date_df

  • 인덱스 슬라이싱 이용
date_df['년'] = date_df['Date'].str[0:4]
date_df['월'] = date_df['Date'].str[5:7]
date_df['일'] = date_df['Date'].str[8:10]

Datetime 형태의 데이터에서 년,월,일 추출하여 새로운 칼럼에 넣기

 

newdt_df

newdt_df['년'] = newdt_df['new_Date'].dt.year
newdt_df['월'] = newdt_df['new_Date'].dt.month
newdt_df['일'] = newdt_df['new_Date'].dt.day

[응용] to_period() 사용

# 년도, 년-월, 년-월-일 3개 컬럼 생성하기
newdt_df['년도'] = newdt_df['new_Date'].dt.to_period(freq='Y')
newdt_df['년-월'] = newdt_df['new_Date'].dt.to_period(freq='M')
newdt_df['년-월-일'] = newdt_df['new_Date'].dt.to_period(freq='D')

출력값

 

'Python > 데이터분석' 카테고리의 다른 글

04_판다스_파일 저장 및 열기  (0) 2022.07.04
03_판다스_Index  (0) 2022.07.04
02_판다스_데이터프레임  (0) 2022.06.15
01_판다스_Series  (0) 2022.06.15
판다스 데이터 전처리 - 결측치 제거  (0) 2022.06.13