02_판다스_데이터프레임

2. DataFrame

2차원 데이터(Series들의 모음)

 

Data 준비

예) 슬램덩크 주요 인물 8명에 대한 데이터

data = {
    '이름':['채치수','정대만','송대섭','서태훈','김백호','변덕규','황태산','윤대협'],
    '학교':['북산고','북산고','북산고','북산고','북산고','능남고','능남고','능남고'],
    '키':[197,184,168,187,188,202,188,190],
    '국어':[90,40,80,40,15,80,55,100],
    '영어':[85,35,75,60,20,100,65,85],
    '수학':[100,50,70,70,10,95,45,90],
    '과학':[95,55,80,75,35,85,40,95],
    '사회':[85,25,75,80,10,80,35,95],
    'SW특기':['Python','Java','Javascript','','','C','PYTHON','C#']}
type(data)  # dict 출력

data['이름']  
#['채치수', '정대만', '송대섭', '서태훈', '김백호', '변덕규', '황태산', '윤대협'] 출력

data['키']
#[197, 184, 168, 187, 188, 202, 188, 190] 출력

DataFrame 객체 생성

  • pd.DataFrame()
import pandas as pd
df = pd.DataFrame(data)

Data 접근

df['이름']

"""출력값
0    채치수
1    정대만
2    송대섭
3    서태훈
4    김백호
5    변덕규
6    황태산
7    윤대협
"""
# 두개 이상의 칼럼은 [[]]
df[['이름','키']]

출력값

DataFrame 객체 생성(Index 지정)

df = pd.DataFrame(data, index=['1번','2번','3번','4번','5번','6번','7번','8번'])

출력값

DataFrame 객체 생성(Column 지정)

data 중에서 원하는 column만 선택하거나, 순서 변경 가능

df = pd.DataFrame(data, columns=['이름','학교','키'])

출력값

df = pd.DataFrame(data, columns=['이름','키','학교'])

출력값

 

'Python > 데이터분석' 카테고리의 다른 글

04_판다스_파일 저장 및 열기  (0) 2022.07.04
03_판다스_Index  (0) 2022.07.04
01_판다스_Series  (0) 2022.06.15
시계열 데이터 탐색하기  (0) 2022.06.14
판다스 데이터 전처리 - 결측치 제거  (0) 2022.06.13