자격증
Wer 산출식 오류율에 대한 질문입니다!
안녕하세요. 현재 음성인식 정확도 평가를 위해 WER(Word Error Rate)를 다음 공식으로 산출하고 있습니다.
WER = (S + D + I) / N S: Substitution (치환) D: Deletion (삭제) I: Insertion (삽입) N: 정답 문장(Reference)의 총 단어 수
그런데 아래 예시 문장에서 오류 유형을 어떻게 구분해야 할지 헷갈립니다.
1. 정답 문장 (Reference)
왼쪽 무릎이 계단을 오를 때마다 욱신거려서 걷기가 불편해요
2. 인식 문장 (Hypothesis)
왼쪽 무릎이 계단을 오를때마다 욱신거려서 걷기가 불편해요
이 경우 띄어쓰기 오류로 인해 ‘오를 때마다’가 ‘오를때마다’로 합쳐졌습니다.
여기서 오류를
Substitution (S): ‘때마다 → 오를때마다’ (1건)으로 처리해야 하는지,
Substitution + Deletion (S=1, D=1): ‘오를 → 오를때마다’ (S=1), ‘때마다’는 누락된 단어로 (D=1), 총 2건으로 처리해야 하는지,
궁금합니다. 전문가 여러분의 의견을 듣고 싶습니다. 감사합니다!
2개의 답변이 있어요!