안녕하세요. 과학전문가입니다.
정확한 기준은 없습니다만.. 용량기준으로 수십테라바이트정도되는 대규모 데이터를 주로 그렇게 부르고 있습니다.
의미적으로 보자면 여러가지 기준이 있는데..
1. 사람이 일일이 다 보기 어렵고, 다 계산/정리하기 버거운 수준
--> 이게 사실 빅데이터라고 말하고 이를 다루는 기술에 대해 언급하기 시작한 최초의 목적입니다.
2. 통계적, 머신러닝에서 의미가 있는 최소 숫자
--> 통계적으로는 방식/이론에 따라 다르지만 보통 30개이상정도되면 통계로써 의미를 가진다고 볼 수 있어서 그정도 숫자를 보통 보고 있습니다. 머신러닝은 초반에 학습을 해야하기 때문에 학습에 필요한 최소 데이터 수 이상이 있고, 학습을 제외한 실제 데이터가 또 있어야하니 그 두종류의 데이터 숫자 합이 최소숫자겠지요?
데이터 사이언스에서는 그 이상의 데이터를 빅데이터라고 부르기도 합니다.