Python에서 pandas 라이브러리를 사용하여 DataFrame의 특정 열(column) 값에 따라 데이터를 필터링하는 것은 매우 일반적인 작업입니다. 이를 위해 불리언 인덱싱(Boolean indexing)을 주로 사용합니다. 아래에서는 기본적인 예시를 통해 이 방법을 설명하겠습니다.
먼저, pandas가 설치되어 있어야 합니다. 설치되어 있지 않다면, 다음 명령어로 설치할 수 있습니다:
pip install pandas
이제, 예를 들어 DataFrame에서 특정 조건을 만족하는 행(row)만 필터링하는 방법을 살펴보겠습니다.
import pandas as pd
# 샘플 데이터 생성
data = {'Name': ['John', 'Anna', 'Peter', 'Linda'],
'Age': [28, 34, 29, 32],
'City': ['New York', 'Paris', 'Berlin', 'London']}
df = pd.DataFrame(data)
# 'Age'가 30 이상인 행만 필터링
filtered_df = df[df['Age'] >= 30]
print(filtered_df)
이 예시에서는 'Age' 열의 값이 30 이상인 행만 선택하여 filtered_df라는 새로운 DataFrame에 저장합니다.
또한, 여러 조건을 조합하여 필터링할 수도 있습니다. 예를 들어 'Age'가 30 이상이고, 'City'가 'Paris'인 행을 필터링하려면 다음과 같이 작성할 수 있습니다:
# 'Age'가 30 이상이고, 'City'가 'Paris'인 행 필터링
filtered_df = df[(df['Age'] >= 30) & (df['City'] == 'Paris')]
print(filtered_df)
이 때, 각 조건을 괄호로 묶고 & (AND) 연산자를 사용하여 두 조건을 모두 만족하는 행을 필터링합니다. 만약 조건 중 하나라도 만족하는 행을 찾고 싶다면, | (OR) 연산자를 사용할 수 있습니다.
이러한 방법을 통해 pandas에서 다양한 조건에 따라 데이터를 효과적으로 필터링할 수 있습니다.
'python > tips' 카테고리의 다른 글
Dataframe 특정 컬럼이 있는지 확인하는 방법 (0) | 2024.03.29 |
---|---|
Dataframe에서 특정 행에 대한 항목이 없을때 (0) | 2024.03.29 |
excel 파일을 읽어서 Dataframe으로 변환 (0) | 2024.03.29 |
특정 directory의 하위 디렉토리 포함해서 모든 excel 파일 찾기 (0) | 2024.03.29 |
python으로 파일이 존재하는지 확인 (0) | 2024.03.15 |