음성인식 기술은 사람과 기계간의 인터페이스를 편리하고 자연스럽게 만들 수 있기 때문에 음성인식 기술의 연구 개발이 국내외에서 꾸준히 진행 되어 왔으며, 그 결과 단순한 단어 인식을 ...
음성인식 기술은 사람과 기계간의 인터페이스를 편리하고 자연스럽게 만들 수 있기 때문에 음성인식 기술의 연구 개발이 국내외에서 꾸준히 진행 되어 왔으며, 그 결과 단순한 단어 인식을 넘어 자연스럽게 발성한 음성도 인식할 수 있는 수준으로 발전해 왔다. 특히 근래 애플이 발표한 시리는 아이폰에 탑재되는 자연어 음성인식 처리 소프트웨어로 많은 이들의 관심을 지속적으로 받고 있다. 이러한 연속 음성 인식 소프트웨어들은 대부분 확률 통계 이론에 기반을 둔 HMM 기법을 활용해 개발된 고가의 수입 소프트웨어 들이며 그 구현 비용이 너무 비싸 음성인식의 높은 효용성에도 불구하고 많이 보급되지 못 하고 있는 실정이다.
실제 국내에서 음성 인식을 도입한 통신사 및 몇몇 카드사의 사례들도 미국의 Nuance 엔진을 이용 구현 되었다. 일부 국산 음성 인식 소프트웨어를 활용해 구현한 사례들도 있으나 그 대부분은 단어 위주의 인식 서비스로 구성 되어 있으며, 이 또한 잡음처리 및 음성 에너지 조절 기능들이 부족해 만족할 만한 인식률을 보이지 못하고 있으며 또한 요구된 발성 규칙을 따르지 못한 음성 질의들은 아예 처리하지 못하고 있는 실정이다. 본 논문에서는 이러한 현실적 어려움을 개선할 수 있는 방안으로 음성인식 엔진에 독립적이며, 또한 단순히 잡음 제거 기능만 수행하는 전처리 엔진이 아니라 규칙에 따르지 않은 음성 질의도 처리 할 수 있는 핵심어 추출 기능, 더 나아가 그 핵심어를 수식하는 전 술부 및 그 해당 음성 질의로부터 수행하기를 원하는 후 술부 까지도 추출할 수 있는 다목적 전처리 프로세서 설계 방법을 제안 하고자 한다. 더불어 스마트 폰 등에서 사용 가능한 음성 dictation 기능으로부터 발성자의 음성 질의 의도도 파악할 수 있는 후 처리 설계 방법도 같이 제안 하고자 한다. 이러한 후 처리기는 음소 별로 독립적으로 부여된 고유 값을 이용 인식 단어들 전체의 동질성 값을 계산하는 기능을 갖추어 dictation 결과가 잘못되었을 시 이를 보정할 수 있는 기능을 갖추고 있다. 이렇게 설계된 전 처리기를 기존 음성 인식 솔루션에 병행 사용하여 그 인식 기능을 제고할 수 있음을 G사의 직원 자동 연결 시스템과의 연동에서 확인 할 수 있었으며, 국내 통신 회사의 실제 고객들 음성 질의도 처리 할 수 있음을 확인 하였다. 후 처리기 또한 국내 카드사의 스마트 폰에 음성 처리 능력을 지원하는 데 사용되어 그 상업적 유용성을 입증하였다. 본 논문을 통해 제안된 처리기는 소프트웨어적으로 구현되었고 음성 인식 소프트웨어에 독립적으로 설계되었기에 인식 단어 또는 문장의 증가 시 그 처리 능력이 떨어 질 수 있으나 더욱 빨라진 하드웨어 처리 능력으로 이를 극복할 수 있을 것으로 생각되며 앞으로 이와 같은 처리기 관련 연구를 촉발하는 데 기여할 수 있기를 기대한다.
,韩语论文网站,韩语论文网站 |