DataFrame에서 boolean값을 통해 해당되는 값만을 추출하는 방법에 대해 공부해보자.
boolean selection으로 row를 선택하는 방법은 numpy에서와 동일한 방식이다.
우선 head()를 통해 DataFrame을 살펴보자.
import pandas as pd
train_data = pd.read_csv('./train.csv')
train_data.head()
- DataFrame boolean Selection
30대이면서 1등석에 탄 사람을 선택해보자.
age >= 30, Pclass = 1인 조건을 찾으면 될 것이다.
age_ = (train_data['Age'] >= 30) & (train_data['Age'] < 40)
class_ = train_data['Pclass'] == 1
class_ & age_
train_data[class_ & age_] # boolean selection은 DataFrame에서 [] 대괄호에서 row로 동작한다.
DataFrame에서도 boolean selection은 대괄호에서 row 레벨로 동작하는 것을 기억해두자.
다음엔 DataFrame에 새로운 column을 추가하거나, 삭제하는 방법에 대해서 공부해겠다.
'python > pandas' 카테고리의 다른 글
14. pandas DataFrame column간 상관관계 (0) | 2023.02.20 |
---|---|
13. pandas DataFrame - column 추가, 삭제 (0) | 2023.02.18 |
11. pandas DataFrame -row, slicing(loc, iloc) (0) | 2023.02.18 |
10. pandas - DataFrame의 [column] 선택 출력 (0) | 2023.02.18 |
9. pandas DataFrame - csv 파일로부터 DataFrame 생성 (0) | 2023.02.18 |