합성데이터는 현실에서 직접 수집한 데이터가 아니라 인공지능, 시뮬레이션, 알고리즘을 이용해 인위적으로 생성한 데이터입니다.
개인정보 보호, 수집 비용이나 시간 문제로 실제 대이터를 쓰기 어려운 경우에 대안으로 사용됩니다.
장점은 원하는 조건, 다양성을 자유롭게 설정할 수 있어 AI 학습 품질을 높일 수 있다는 점이죠.
그런데 현실과 차이가 큰 합성데이터는 AI 성능을 떨어뜨리는 이유도 됩니다.
그래서 최근 정부나 기업 모두 합성데이터 품질 표준화와 검증 기술 개발에 투자하고 있습니다.