인구의 고령화와 더불어 소리가 잘 들리지 않는 즉, 난청 현상을 겪는 난청인이 증가 하고 있다. 난청 현상은 사회적 활동에 큰 부분을 차지하는 의사소통에 심각한 영향을 주기 때문에 이를...
인구의 고령화와 더불어 소리가 잘 들리지 않는 즉, 난청 현상을 겪는 난청인이 증가 하고 있다. 난청 현상은 사회적 활동에 큰 부분을 차지하는 의사소통에 심각한 영향을 주기 때문에 이를 해결하기 위한 연구의 필요성이 증가하고 있다. 난청인의 줄어든 청력을 보상해주기 위한 보조 도구로 보청기가 사용되고 있다. 보청기를 구성하는 주요 알고리즘으로는 피드백 제거, 잡음 제거 알고리즘, 적합법을 들 수 있다. 현재 사용되는 보청기의 피드백 제거 알고리즘의 경우 입력 신호로 음성 신호가 들어오면 피드백 추정을 위한 적응 필터의 계수가 잘못된 방향으로 업데이트되어 음질을 왜곡시키는 단점이 존재한다. 음성 신호에 잡음이 섞여 있을 경우 보청기의 난청 보상 알고리즘에 의해서 음성 신호 뿐만 아니라 잡음 신호까지 증폭되어 난청인의 언어인지도가 안 좋은 영향을 미친다. 또한, 난청인에게 적합한 이득을 제공해주는 적합법이 영어를 기반으로 개발되었기 때문에 한국어를 이용하는 한국인에게는 적절한 이득을 제공해주지 못하는 실정이다.
본 논문에서는 이와 같은 문제점을 해결하기 위해서 향상된 성능을 갖는 중요 요소 알고리즘에 대한 연구를 진행하였다. 피드백 제거 알고리즘의 단점을 개선하기 위해서 GSAP (global speech absence probability)를 이용한 가변 학습률을 갖는 VSS-AP (variable step size-affine projection) 알고리즘을 제안하였고, 우수한 잡음 전력 추정을 통해서 향상된 잡음 제거 성능을 보여주는 잡음 제거 알고리즘을 제안하였다. 이때, 잡음 전력 추정을 위해서 시간축 상에서 동작하는 GNL (gneralized normal-Laplace) 기반의 음성 검출기와 주파수 상에서 동작하는 DBN (deep belief network) 기반의 음성 검출기를 제안하였다. 마지막으로 한국어의 주파수 특성을 반영한 한국어 기반의 적합법을 개발하였다. 이때 음성 명료도를 측정하기 위해서 SII (speech intelligibility index) 프로그램이 사용되었고, 한국어의 특징을 반영하기 위해서 한국어의 장기 평균 어음 스펙트럼(long-term averaging speech spectrum, LTASS)와 주파수 중요 기능(band importance function)를 이용하였다.
제안한 피드백 제거 알고리즘의 성능 검증을 위해서 NLMS (normalized least- mean-square)와 AP (affine projection) 기반의 피드백 제거 알고리즘과 비교하였고, 검증 요소로 불일치도(misalignment)를 이용하였다. 다양한 상황에 대한 실험 결과 제안한 GSAP 기반의 VSS-AP 피드백 제거 알고리즘을 이용하여 보청기에 음성 신호가 들어올 경우 피드백 경로 추정이 잘못된 방향으로 업데이트되는 것을 방지할 수 있었고, 기존 피드백 제거 알고리즘에 비해서 빠른 수렴 속도와 향상된 추가 이득을 얻을 수 있었다. 다음으로, 제안한 잡음 제거 알고리즘의 성능 평가를 위해서 다양한 잡음 상황(white, babble, car)에서 PESQ (perceptural evaluation of speech quality)를 비교하였다. 실험 결과 제안한 잡음 제거 알고리즘이 기존의 IMCRA (improved minima controlled recursive averaging) 기반의 잡음 제거 알고리즘에 비해서 약 3∼6dB의 향상된 신호 대 잡음비(SNR)을 제공하여 난청인에게 보다 향상된 음질을 제공함을 알 수 있었다. 제안한 한국어 적합법의 성능 검증을 위해서 삼성서울병원 IRB 승인 후 난청인을 대상으로 어음 인지도 검사와 선호도 검사를 진행하였다. 실험 결과 실험 참여 인원의 약 72%에 대해서 기존 적합법(national acoustic laboratories’-nonlinear version 1)에 비해 향상된 언어 인지도를 보여주었고, 약 66%의 난청인이 한국어 적합법을 선호하였다. 마지막으로 피드백 제거, 잡음제거, 한국어 적합법이 통합된 보청기 시스템의 성능을 평가하기 위해서 건청인을 대상으로 실험을 진행하였다. 건청인에게 난청 특성이 반영된 음질을 제공하기 위해서 NIOSH (national institute of occupational safety and health)에서 개발한 난청 보상 시뮬레이터를 이용하였고, 어음 인지도 검사와 MOS (mean opinion score)의 실험 결과 약 3.85% 의 언어 인지도 향상과 0.41의 MOS 향상을 보여주었다.
본 논문을 통하여 제안한 GSAP기반의 VSS-AP알고리즘을 보청기에 적용한다면 향상된 추가 이득으로 인해서 보청기의 최대 증폭 이득이 증가될 것이고, 이는 고막형과 같은 작은 사이즈 보청기의 제한된 증폭 이득으로 인해서 중․고도 난청인에게 처방하지 못했던 문제점을 해결할 수 있을 것이다. 또한, 향상된 잡음 제거 알고리즘과 한국어 적합법을 통해서 보다 명료하고 향상된 음질을 제공하여 난청인의 보청기에 대한 만족도 높일 수 있을 것이다. 이는 제안한 통합 보청기 시스템을 통해서 현재 한국 난청인의 7%만이 보청기를 착용하고 있는 시장의 활성화에 큰 영향을 줄 것이다.
,韩语论文题目,韩语论文网站 |