스파르타/파이썬

파이썬_02주차_Pandas 실전

옒르 2023. 1. 5. 19:01

1)실제 데이터 import 해보기

df = pd.read_excel('종목데이터.xlsx')
 
 
 
#처음과 끝의 데이터 5개만 추출하고 싶은 경우
df.head() or df.tail()

#소수점 둘째자리까지 추출하기

pd.options.display.float_format = '{:.2f}'.format

2)엑셀을 DataFrame으로 읽기

  • 어제 오른 종목들만 골라보기
df = pd.read_excel('종목데이터.xlsx')

cond=df['change_rate'] >0
df[cond]

 

  • per가 0 인 종목들을 제거하기
df = pd.read_excel('종목데이터.xlsx')

cond=df['change_rate'] >0
df=df[cond]

cond=df['per'] >0
df= df[cond]

 

  • 순이익, 종가를 추가하기

👉per = 시가총액 / 순이익 = 주가 / 주당순이익

 -> 주가 : per * eps(주당순이익)

 -> 순이익 : marketcap(시가총액) / per

df['close'] = df['per'] * df['eps']
df['earning'] = df['marketcap'] / df['per']

 

  • date 컬럼을 없애기
del df['date']
 
 
  • pbr < 1 & 시총 1조 이상 & per < 20 을 추려보기
cond=(df['pbr'] <1 ) & (df['marketcap'] > 1000000000000) &(df['per'] <20)
df = df[cond]

 

# marketcap으로 내림차순 정렬하기

df.sort_values(by='marketcap',ascending=False)

 
#데이터 수치들을 한눈에 보기
df.describe()