파이썬)날짜, 문자열이 섞인 데이터프레임의 열에서 날짜로 검색하기
위 표의 A열과 같이 날짜와 문자가 섞여있는 데이터프레임의 컬럼에서
날짜데이터(2015.11 과 같은)를 가지고 특정 행을 검색하고 싶습니다.
어떤 식으로 파이썬을 코딩해야 할까요? 질문드립니다.
안녕하세요. 날짜 데이터가 포함된 컬럼을 검색하는 방법을 문의 하셨군요.
보통 정규식을 많이 사용합니다. 정규식을 사용해 숫자 4자리와 점 기호, 숫자 2자리가 조합된 문자열이 컬럼에 있는지 찾는 프로그램을 작성하면 됩니다.
검색을 위한 정규식은 "[0-9]{4}\.[0-9]{2}" 정도면 되겠네요. 다음 문서를 참고하세요.
채택 부탁드립니다. 감사합니다.
[소스코드]
# -- coding: utf-8 --
"""
Created on Sun May 30 01:12:21 2021
@author: raven90
"""
from pandas import DataFrame
data = [
["보고서1 2017.02", 412453],
["정기보고서 2016.05", 2343423],
["중간보고서 2015.11", 23123],
["첨부 2015.08", 5453],
["첨부2 2015.09", 234133],
]
columns = ["A", "B"]
df = DataFrame(data=data, columns=columns)
#참고 : https://www.delftstack.com/ko/howto/python-pandas/pandas-get-index-of-row/
print ('인덱스 =', df.index[df['A'].str.contains('2015.11')].tolist())
print (df.loc[df['A'].str.contains('2015.11')])
[실행결과 캡쳐]