안녕하세요. 김계민 과학전문가입니다.
음성인식기는 매 1/1000 초 단위로 그 시점에 있는 약 0.02초 길이의 음성의 편을 가져와 분석하는 방식입니다.
그 짧은 길이의 음성 파형은 여러 단계의 신호 처리를 거쳐 최종적으로 10개 이상의 숫자들이 나오고,
음성 파형 분석은 성대 진동 횟수와 입 모양을 그릴 수 있는 숫자들을 분석하는 것입니다.
음성인식에서 보면 "휴대폰" 이라고 하면 성대의 진공주기는 언어정보와 관련은 없습니다.
음성인식기가 빠르게 음성을 인식하는 방법은 모든 음성단어 후보군을 나열한 후 정답이 아닌것은 빨리 버리면 됩니다.
이후 음성인식이 처리가 되었을때 남은단어가 음석인식의 결과가 되는것입니다.