728x90
반응형
DataFrame으로 Data를 처리할 때,
전체 컬럼이 아닌 특정 문자열이 포함된 인자(column)만 가져오고 싶을때가 많습니다.
그런경우 pandas Dataframe의 filter 함수를 이용하면 쉽게 가져올 수 있습니다.
DataFrame 만들기 - 실행 환경 Jupyter
import pandas as pd
data = {'name' : ['홍길동','아무개','김O희', '김O수'],
'age':[20,21,29,31],
'address' :['서울시 강남구', '인천광역시 중구', '대구광역시 중구', '부산광역시 남구']}
df = pd.DataFrame(data)
아래 형태와 같이 DataFrame이 생성됩니다.
name | age | address | |
0 | 홍길동 | 20 | 서울시 강남구 |
1 | 아무개 | 21 | 인천광역시 중구 |
2 | 김ㅇ희 | 29 | 대구광역시 중구 |
3 | 김ㅇ수 | 31 | 부산광역시 남구 |
이제 원하는 문자열이 있는 column만 가져와 볼까요?
'dd'가 column명에 포함된 컬럼만 가져오기
df.filter(regex='원하는 문자열') 형태로 사용하면 됩니다.
df.filter(regex='dd')
address | |
0 | 서울시 강남구 |
1 | 인천광역시 중구 |
2 | 대구광역시 중구 |
3 | 부산광역시 남구 |
이런식으로 활용하면 원하는 column만 가져올수 있습니다.
728x90
반응형
'python > pandas 활용' 카테고리의 다른 글
pandas groupby() 활용 - 데이터 그룹화 (0) | 2024.03.09 |
---|---|
pandas datetime, 숫자 타입 변환 (0) | 2023.08.13 |
dataframe combine_first() - 두 DataFrame 합치기 (0) | 2022.08.30 |
pandas - pivot, pivot_table (0) | 2022.04.20 |