소규모 문서 타입 분류 딥러닝 모델 추천

소규모 문서 타입 분류(Classification)를 할 때 어떤 백본 모델(ResNet, EfficientNet 등)이 성능이 좋은가요?

2개의 답변이 있어요!

  • 안녕하세요. 김민구 정보처리기사입니다.

    소규모 문서 타입 분류에서는 보통 EfficientNet-B0/B1 이 가장 무난하고 성능도 좋은 편입니다.

    ResNet50 은 비교 기준으로 쓰기 좋은 안정적인 베이스라인 모델이라 함께 많이 사용됩니다.

    데이터가 적을수록 사전학습(pretraining)된 모델을 전이학습(transfer learning) 해서 쓰는 것이 훨씬 유리합니다.

    또한 문서 분류는 일반 사진과 달리 layout 과 텍스트 정보의 영향이 커서, OCR을 함께 쓰면 성능이 더 좋아질 수 있습니다.

    실제로는 백본 선택보다 입력 해상도, 데이터 증강, 클래스 불균형 처리가 결과에 더 큰 영향을 주는 경우가 많습니다.

    답변이 도움이 되셨으면 좋겠네요^^

  • 안녕하세요. 조원우 정보처리기사입니다.

     일반적으로 ResNet은 구조가 단순하고 학습이 안정적이어서 데이터가 적은 환경에서도 과적합 위험이 비교적 낮아 기본 모델로 적합합니다. 

     반면 EfficientNet은 파라미터 효율이 높고 성능이 우수하지만, 데이터가 부족한 경우에는 과적합이 발생할 수 있어 주의가 필요하며, 사전학습된 모델을 활용한 전이학습 환경에서 특히 강점을 보입니다.

     데이터 규모가 작다면 ResNet 계열을 우선적으로 고려하는 것이 적절하며, 전이학습을 활용할 경우에는 EfficientNet도 좋은 선택이 될 수 있습니다. 

     또한 문서 분류가 텍스트 기반이라면 CNN 모델보다 BERT와 같은 자연어 처리 모델을 사용하는 것이 더 높은 성능을 기대할 수 있습니다