안녕하세요. 류경범 과학전문가입니다.
음성 인식 기술은 기본적으로 음성에 대한 파형을 분석합니다.
그리고 음성을 1/1000초 단위로 음성을 작게 잘라 각 단위마다 개별로 숫자 같은 신호로 인식을 합니다.
이 숫자들은 바로 말하는 시점에서의 성대와 성도의 상태를 나타내는 숫자들이며, 발성시점의 성대 진동 횟수와 입 모양을 그릴 수 있는 숫자들은 바로 해당음이 되기에 이것들 조합하여 음성인식 시스템에 미리 입력해둔 DB에서 데이터를 찾아 맞는 단어 등을 조합하는 것입니다.