python/pandas 활용

padnas(dataframe) 문자열이 포함된 column 가져오기

Memory! 2022. 4. 11. 11:36
728x90
반응형

DataFrame으로 Data를 처리할 때,

전체 컬럼이 아닌 특정 문자열이 포함된 인자(column)만 가져오고 싶을때가 많습니다.

 

그런경우 pandas Dataframe의 filter 함수를 이용하면 쉽게 가져올 수 있습니다.

 

DataFrame 만들기 - 실행 환경 Jupyter

import pandas as pd

data = {'name' : ['홍길동','아무개','김O희', '김O수'], 
	'age':[20,21,29,31], 
    	'address' :['서울시 강남구', '인천광역시 중구', '대구광역시 중구', '부산광역시 남구']}
df = pd.DataFrame(data)

아래 형태와 같이 DataFrame이 생성됩니다.

  name age address
0 홍길동 20 서울시 강남구
1 아무개 21 인천광역시 중구
2 김ㅇ희 29 대구광역시 중구
3 김ㅇ수 31 부산광역시 남구

 

이제 원하는 문자열이 있는 column만 가져와 볼까요?

'dd'가 column명에 포함된 컬럼만 가져오기

df.filter(regex='원하는 문자열') 형태로 사용하면 됩니다.

df.filter(regex='dd')
  address
0 서울시 강남구
1 인천광역시 중구
2 대구광역시 중구
3 부산광역시 남구

 

이런식으로 활용하면 원하는 column만 가져올수 있습니다.

728x90
반응형