본문 바로가기

파이썬/판다스(Pandas)

[파이썬 라이브러리]판다스(pandas) OPERATIONS과APPLYING FUNCTIONS

1번째 step 
df.['Salary [$/h]'] 를 함으로써 시급의 컬럼을 뽑아낸다 그다음
df.['Salary [$/h]'].max()를 함으로써 시급의 컬럼중 가장 큰 값 을 뽑아내면 38이라는 값이 나온다
df['Salary [$/h]'] == df['Salary [$/h]'].max()
=>여기에서 ==을 사용함으로써 최댓값과 같은 컬럼만 뽑아내라

0    False
1    False
2     True
3    False
Name: Salary [$/h], dtype: bool

 

df.loc[   ,  ] 을 사용함으로써(왼쪽 행,오른쪽 열) 행렬을 뽑아낸다
df.loc[ df['Salary [$/h]'] == df['Salary [$/h]'].max() ,  ] 을 사용하면
트루 값인 것만 골라서 행렬에 뽑아내준다

새로운 컬럼을 만들고 함수를 적용하여 컬럼을 만들자
df['Salary [$/h]'].apply(  get_group  )

,apply( 함수명)
데이터 컬럼을 가져 와서 내가 만든 함수(함수명)를 적용해라
기존에 있는 함수명을 적용해도 된다

df.sort_values('Years of Experience') 오름차순 정렬

df.sort_values('Years of Experience' , ascending=False) 내림차순 정렬