import pandas as pd df = pd.read_excel('score.xlsx', index_col='지원번호') Column 수정 replace() df['학교'].replace({'북산고':'상북고', '능남고':'무슨고'}) *) 저장하려면 inplace = True 시행 lower() df['SW특기'] = df['SW특기'].str.lower() upper() df['SW특기'] = df['SW특기'].str.upper() 문자열 추가 df['학교'] = df['학교'] + '등학교' Column 추가 df['총합'] = df['국어'] + df['영어'] + df['수학'] + df['과학'] + df['사회'] df['결과'] = 'Fail' # 결과 Column 추가하고 전체 ..
import pandas as pd df = pd.read_excel('score.xlsx', index_col='지원번호') df.sort_values('키') # 키 기준으로 오름차순 정렬 df.sort_values('키', ascending=False) # 키 기준으로 내림차순 # 수학 점수는 오름차순, 영어 점수는 내림차순 df.sort_values(['수학', '영어'], ascending=[True, False]) df['키'].sort_values() df.sort_index(ascending=False) # 인덱스 내림차순 정렬
import pandas as pd df = pd.read_excel('score.xlsx', index_col='지원번호') fillna df.fillna('') # NaN 데이터를 빈 칸으로 채움 df.fillna('없음') # NaN 값을 '없음'으로 채움 --> 저장시 inplace=True 또는 변수로 다시 설정 df['SW특기'].fillna('확인중', inplace=True) # SW특기 데이터 중에서 NaN에 대해서 채움 데이터 제외하기 dropna df.dropna(inplace=True) # 전체 데이터 중에서 NaN을 포함하는 데이터 삭제 - dropna 조건 : axis, how -- axis : index or columns -- how : any or all df.dropna(..
import pandas as pd df = pd.read_excel('score.xlsx', index_col='지원번호') df['키'] >= 185 filt = (df['키'] >= 185) df[filt] df[-filt] df[df['키'] > 185] df.loc[df['키'] > 185, '수학'] df.loc[df['키'] >= 185, ['이름', '수학', '과학']] 그리고 & df.loc[(df['키'>=185) & (df['학교'] == '북산고')] 또는 | df.loc[(df['키'] 180)] str 함수 filt = df['이름'].str.startswith('송') # 송씨 성을 가진 사람 df[filt] 1. contains filt ..
import pandas as pd df = pd.read_Excel('score.xlsx', index_col='지원번호') Column 선택(label) df['이름'] df['키'] df[['이름','키']] Column 선택(정수 index) df.columns df.columns[0] df.columns[2] df[df.columns[0]] df[df.columns[-1]] 슬라이싱 df['영어'][0:5] df[['이름', '키']][:3] df[3:] loc df.loc['1번'] df.loc['1번','국어'] df.loc[['1번','2번'],'영어'] df.loc['1번':'5번', '국어':'사회'] iloc df.iloc[1] df.iloc[1,1] df.iloc[[1,2],4] d..
파일 불러오기 import pandas as pd df = pd.read_excel('score.xlsx', index_col='지원번호') DataFrame 확인 df.describe() df.info() df.head() # 처음 5개의 row 출력 df.tail() # 마지막 5개 row 출력 df.values df.index df.columns df.shape # (row, column) Series 확인 df['키'].describe() df['키'].min() # 최소값 df['키'].max() # 최대값 df['키'].nlargest(3) # 키 큰 사람 순서대로 3명 데이터 df['키'].mean() # 평균값 df['키'].sum() # 합계 df['SW특기'].count() df['학교..