다양한 전송 왜곡에 의한 한국어 음성의 지각특성의 변화에 관한 연구 [韩语论文]

资料分类免费韩语论文 责任编辑:金一助教更新时间:2017-04-27
提示:本资料为网络收集免费论文,存在不完整性。建议下载本站其它完整的收费论文。使用可通过查重系统的论文,才是您毕业的保障。

본 논문은 다양한 전송 왜곡 중, 주파수 왜곡, 잡음 왜곡 및 진폭 왜곡에 의한 한국음성지각특성변화에 관하여 연구되었다. 본 연구를 위하여 표준어권 출신의 아나운서 발화자 2명...

본 논문은 다양한 전송 왜곡 중, 주파수 왜곡, 잡음 왜곡 및 진폭 왜곡에 의한 한국음성지각특성변화에 관하여 연구되었다. 본 연구를 위하여 표준어권 출신의 아나운서 발화자 2명이 스튜디오에서 발성한 무의미 한국어 단음절 음성(CV음절 144종, VC음절 56종, V음절 8종, 이중모음 11종, 총 219종)을 대상으로 주파수, 잡음, 및 진폭을 인위적으로 왜곡하여 만든 자극음을 정상 청력을 가진 표준어권의 20대 청취자 6명이 PC를 통해 헤드폰으로 들으면서 들리는 대로 적기방식의 지각실험이 수행되었다.
먼저, 주파수 왜곡의 경우, 차단주파수(300 Hz, 500 Hz, 700 Hz, 1000 Hz, 1500 Hz, 2000 Hz, 2500 Hz, 3000 Hz, 5000 Hz)를 달리하여 저역 또는 고역을 각각 버터워스 8차 디지털 필터를 통과시켜 만든 음성자료를 지각실험에 사용하였다.
실험 결과를 살펴보면 1500 Hz를 전후하여 HPF에서는 그 이하, LPF에서는 그 이상의 주파수 대역이 손상되면 전체적인 인식률이 급격히 나빠진다. 그리고 LPF필터를 통과시킬 경우는 2000 Hz 이하에서, HPF의 경우는 1000 Hz 이상에서 음소 인식율이 80% 정도 확보됨을 보이고 있어서 명료도의 확보에 1000 Hz에서 2000 Hz의 대역이 중요함을 알 수 있다.
주파수 대역 왜곡에 의한 지각오류의 경향을 모음 및 자음의 발화 형태에 따라 분석하였다. 예를 들어 저 주파수 대역 차단(HPF)에 의한 자음의 결과를 보면, 조음방법 간 비교에서 마찰음 /ㅅ/과 파찰음이 상대적으로 주파수 왜곡에 강함을 보이는데 이는 마찰소음이 고주파수대에 있기 때문이다. 조음장소 간 비교에서 초성파열음의 경우는 ‘초성연구개음 > 초성치경음 > 초성양순음’ 순으로 주파수 왜곡에 강함을 보이는데 이는 이들의 locus순과 일치하고 있다. 종성파열음은 보다 넓은 주파수대의 정보를 필요로 하는 반면 상대적으로 종성유음은 높은 주파수대(비교적 1500 Hz HPF) 정보만으로도 80% 이상의 인식률을 보인다.
잡음 왜곡이 한국어 음성의 지각에 미치는 영향을 살펴보기 위하여 발화자가 발성한 한국어 단음절 음성을 대상으로 백색잡음을 신호대잡음비(-15dB, -10dB, -5dB, 0dB, 10dB, 20dB) 별로 섞은 음성자료를 지각실험에 사용하였다.
실험 결과를 살펴보면, 모음은 공명도(sonority)가 큰 것이 잡음의 영향에 강하다. 저모음이 고모음보다 잡음에 강하다. 고모음은 전설모음일수록 잡음에 강하다. 이중모음이 단모음보다 더 강한 결과를 보인다. 자음은 공명도(sonority)가 큰 것이 잡음의 영향에 강하다. 마찰음/파찰음이 강하게 잡음의 영향을 받는 것은 그 조음 특성상 마찰잡음이 포함되어 있기 때문으로 보인다. 초성자음의 잡음에 강인한 정도는 ‘비음 > (탄설음/파열음) > (마찰음/파찰음)’ 순서이다. 초성비음은 /ㅇ/, /ㅁ/, /ㄴ/ 순으로 강하다. 종성자음의 잡음에 강인한 정도는 ‘유음 > 비음 > 파열음’ 순서이다. 종성비음 중에는 /ㅁ/이 /ㄴ/이나 /ㅇ/보다 다소 강하다.
진폭 왜곡이 한국어 음성의 지각에 미치는 영향을 살펴보기 위하여 단음절 음성(CV음절 18종, VC음절 7종, V음절 1종 총 26종, 모음은 /아/모음만을 대상)에 대하여 최대진폭음성을 기준으로 모든 음성에 대하여 피크 클리핑(98, 99, 99.3, 99.5, 99.7, 99.9, 99.99 %)과 센터 클리핑(1, 5, 10, 15, 20 %)한 음성자료를 지각실험에 사용하였다.
실험 결과를 보면, 피크 클리핑에 비해 센터 클리핑의 영향이 현저하였다. 피크 클리핑의 경우에 전체의 98%을 잘라내도 평균 90%이상을 올바로 인식한다. 한편 센터 클리핑의 경우는 1%의 클리핑으로 90%의 인식률을 보이나 5%의 클리핑으로는 55% 정도의 인식률을 보이고 있다. 전반적으로 최대진폭을 보이는 음절을 기준으로 클리핑 된 결과이므로 상대적으로 진폭이 낮은 음절(음소)의 경우 그 영향이 현저하다.

This researches on changes in perceptual characteristics of Korean speeches caused by various transmission distortions in frequency, noise and amplitude. The study is based on perception experiment which was conducted by providing stimulation to...

This researches on changes in perceptual characteristics of Korean speeches caused by various transmission distortions in frequency, noise and amplitude. The study is based on perception experiment which was conducted by providing stimulation tones, generated through creating distortions of frequency, noise and amplitude in Korean non-word single syllable speeches (total 219 syllables including 144 CV syllables, 56 VC syllables and 11 diphthongs) which were phonated by two standard language using announcers in a recording studio, and having six standard language users listen to those stimulation tone through personal computers with headphones and write down what they hear.


Frequency Distortion
In frequency distortion experiment, speech data generated by processing low or high frequency bands with different cut-off frequencies (300 Hz, 500 Hz, 700 Hz, 1000 Hz, 1500 Hz, 2000 Hz, 2500 Hz, 3000 Hz, 5000 Hz) through the 8th Butterworth Digital Filter was used for perception experiment.
The result shows that:
The overall rate of cognition decreases sharply if damaged is caused to frequency band which is no less than around 1500 Hz with LPF(low pass filter) or no more than around 1500 Hz with HPF(high pass filter). About 80% rate of phoneme cognition is obtained in frequency bands no more than 2000 Hz with LPF and no less than 1000 Hz with HPF, indicating that frequency band through 1000~2000 Hz plays important role in obtaining articulation. Tendencies in perception errors caused by frequency band distortion is analyzed with different utterance forms of consonants and vowels.
Results on consonants with frequency band cutoff(HPF) show that:
Regarding manners of articulations, fricative /ㅅ/ and affricates are relatively resistant to frequency distortions, which is due to friction noise being located in high frequency band. Regarding places of articulations, strength of resistance to frequency distortion is in order of ‘initial position velar > initial position alveolar > initial position bilabial’, which corresponds with their locus order. Final position plosives require information of broader frequency band, while final position liquids show high cognition rate of more than 80% with only high frequency band(relatively 1500 Hz HPF) information.
Noise Distortion
Regarding how noise distortion influence perception of Korean speech, phonated Korean monosyllable speeches mixed with white noise with different signal-to-noise ratios(-15, -10, -5, 0, 10, and 20dBs) were used for perception experiment.
The result shows that:
Vowels with higher sonority are more resistant to noise influence. Low vowels are more resistant to noises than high vowels. Front vowels show more resistance among high vowels. Diphthongs show stronger resistance than monothongs. Consonants with higher sonority are more resistant to noise influence. The reason fricatives/affricates are strongly influenced by noise is because they include friction noise by their articulation characteristics. Strength of noise resistance of initial position consonants is in order of ‘nasal > (flap/plosive) > (fricative/affricate)’. With initial position nasals the order is /ㅇ/, /ㅁ/, /ㄴ/. Strength of noise resistance of final position consonants is in order of ‘liquid > nasal > plosive’. With final position nasals /ㅁ/ is slightly stronger than /ㄴ/ or /ㅇ/.
Amplitude Distortion
Regarding how amplitude distortion influence perception of Korean speech, single syllable speeches (total 26 types including 18 types of CV syllables, 7 types of VC syllables and a V type syllable, only /아/ for vowel), processed through peak clipping(98, 99, 99.3, 99.5, 99.7, 99.9 and 99.99%) and center clipping(1, 5, 10, 15 and 20%) based on maximum amplitude speech, were used for perception experiment
The result shows that:
Center clipping resulted in more significant influence than peak clipping. With peak clipping, average of over 90% is correctly cognized even with 98% cut. Whereas with center clipping, cognition rate is 90% when 1% is clipped while the rate drops to 55% when 5% is clipped. The above result comes from clipping done on syllables with overall maximum amplitude, which indicates that the influence grows more stronger in case of syllables(phonemes) with relatively low amplitude.

韩语论文网站韩语论文
免费论文题目: