음성인식

▶플래쉬데모

음성인식(Voice Recognition) 음성(Voice) 혹은 화자인식(voiceprint) 기법은 다른 생체인식 분야와 달리 원격지에서도 전화를 이용하여 신분 확인을 할 수 있고, 사용하기 위한 별도의 교육이 필요하지 않으며 시스템 가격이 저렴하다는 장점이 있다. 반면, 감기나 기타 요인에 의해 목이 쉬었을 때, 의도적으로 타인의 목소리를 흉내내거나, 주변환경에 큰 소음이 있을 경우 취약하므로 보안 분야에 적용하기 위해서는 잡음 처리 후 음성 신호를 추출하는 기술이 우선되어야 한다. 최근, 전화기 휴대폰 등에 단축 다이얼의 형태로 음성인식 방법이 결합되어져 사용되고 있기도 하지만, 보안보다는 편리성에 더 초점을 맞추고 있는 실정이다. 일부 시스템의 경우 발성 기관의 특성을 추출함으로서 99.9%까지의 신뢰성을 보장할 수 있다고 주장하고 있으며 실제로 미국에서는 범죄 수사 목적으로 널리 사용되어지고 있다.

내 목소리만 알아듣는 똑똑한 컴퓨터 음성 포털 붐 타고 화자인증 시장 가시화 음성인식 기술은 80년대만 해도 복잡한 운용체계와 프로그램을 어려워하는 사용자들을 사로잡을 수 있을 것이라는 기대로 많은 기업들이 수백만달러를 투자했다. 하지만 80년대 후반에는 음성인식 기술의 정확도가 낮고 처리 속도도 느렸기 때문에 투자자들의 관심에서 곧 사라졌다. 국내에도 ‘우리 집’ 하면 전화를 걸어주는 휴대폰이 나왔지만 소비자의 눈 높이에는 부응하지 못했다. 정확한 목소리를 녹음해야 하고 키도 여러 번 눌러야 하거나 절차가 복잡해 신뢰성을 얻지 못한 음성인식시스템이 다시 스포트라이트를 받고 있다. 거의 30년전부터 연구돼온 음성인식시스템은 1970년대초 출입통제용 음성인식 기술로 Texas Instrument에서 처음 보고됐다고 알려져 있다. 음성인식은 말할 때 나타나는 특징을 분석하는 것으로, 이러한 음성의 특징은 성도(입과 코를 잇는 관), 입, 콧구멍 등 말할 때 사용되는 인간의 신체 메커니즘에 의해 사람마다 다르게 나타난다. 디지털 방식으로 변환되어 음성인식 장치에 저장된 사용자의 음성은 폭넓은 응용성과 편리한 사용으로 인해 점점 그 영역을 확장해가고 있다. 전화 등을 통해 원거리에서 인증을 해야 할 때 유용하게 사용된다. 메릴랜드 대학에서는 음성사서함에 비밀번호 대신 사용하고 있으며, GTE는 이동전화 위조방지에 사용하고 있고, 전화를 통한 신용카드 인증에도 사용되고 있다. 세계의 많은 전화 운영 회사들은 화자인식 시스템을 개발중이다. AT&T와 Bell은 이 분야에서 가장 앞선 기술력을 보유하고 있으나 아직 상용화된 제품은 없다. 이외에 VeriVoice, ITT, Veritel, T-Netix, Qvoice 등 6개 정도의 업체가 개발에 참여하고 있다.

국내 음성인식업체 화자인증 기술 개발 박차 국내로 눈을 돌려보면 L&H코리아가 보안전문업체 사이버패트롤과 공동으로 화자인증(SV: Speaker Verification) 기술을 접목한 보안시스템을 북한 KEDO 원전에 공급한 것을 들 수 있다. 이 회사는 홈뱅킹, 사이버트레이딩, 인터넷 물리적 보안 분야 등 다양한 분야에 자사의 솔루션을 접목시켜 나가고 있다. 근래에는 강원대 실험실 벤처기업인 디앤엠테크놀로지가 1년의 연구개발 기간을 거쳐 생체인식 기술의 하나인 화자인증 솔루션을 개발해 화제가 되기도 했다. 디앤엠이 개발한 화자인증은 사용자가 최소한의 훈련만으로 화자의 목소리를 등록할 수 있도록 했으며, 또 시간의 흐름에 따라 사용자 목소리의 변이를 추적해 인증토록 설계된 점이 특징이다. 디앤엠테크놀로지측은 “화자인증 기술이 사용의 편의에도 불구, 홍채나 지문인식에 비해 정확도가 떨어져 상용화에 어려움이 많았으나 이번에 개발한 기술은 지문인증에 필적할 만큼 정확도가 뛰어나 상용화에 별다른 어려움이 없다”고 설명한다. 이 회사는 앞으로 생체인식, 보안장비업체 등과 제휴, 이번에 개발한 솔루션을 출입통제시스템과 도어록 등에 적용할 계획이라고 한다. 코스닥등록 홈쇼핑전문업체 씨앤텔은 오는 12월 초부터 씨앤텔 인터넷 쇼핑몰(www.cn tel.co.kr)에서 비밀번호입력과 함께 회원의 목소리로 사용자의 신원을 검증하는 화자인증보안프로그램을 도입하게 된다고 밝혔다. 이 기술이 씨앤텔 인터넷쇼핑몰에서 공식 서비스에 들어가게 되면, 로그인 할 때는 비밀번호를 문자로 입력 할 필요가 없게 된다. 대신 ID 입력 후 화면에 뜨는 번호 네자리를 마이크에 대고 읽으면 된다. 이때 인증프로그램이 회원의 목소리를 식별하여 정상사용자인지 여부를 판별하게 된다. 번호는 로그인 할 때마다 바뀌므로 도용위험은 없다. 마이크를 사용하지 않을 경우에는 기존의 방법대로 문자로 비밀번호를 입력하면 된다. 씨앤텔은 지난 8월25일 화자인증프로그램 개발업체인 웹프로텍과 양해각서를 체결함으로써 화자인증프로그램을 도입하게 됐다. 숭실대 창업보육센터에 자리하고 있는 웹프로텍은 현재 웹사이트를 통해 네티즌들이 음성인식을 시험할 수 있도록 서비스하고 있다. 중급 이상 성능의 마이크를 갖고 있는 네티즌의 경우 자신의 목소리를 인증할 수 있다. PC보안솔루션 전문업체인 F&F시큐어텍은 최근 음성인식기술 전문업체인 L&H코리아와 제휴, 음성인식을 결합한 새로운 PC보안제품을 공동 개발중이다. 이번에 개발하는 음성인식 보안제품은 F&F시큐어텍의 PC보안제품인 ‘가드마스터’에 L&H코리아의 화자인증기술(SV)을 접목시키는 것으로, 개인 음성의 고유한 특징을 이용해 본인 인증을 할 수 있으며, 음성 암호화를 통해 불법도용을 원천 차단할 수 있다. 일반 PC에 이 보안제품을 탑재할 경우, 주인의 음성명령에 의해서만 전원을 켤 수 있을 뿐 아니라, 보안기능 설정을 통해 중요 프로그램 및 파일에 대한 접근도 통제할 수 있다는 것이 관계자의 설명이다. 이들 업체들은 모두 음성으로 모든 전자 기기를 제어할 수 있게 하겠다는 야심을 갖고 있다. 소비자들도 말을 알아듣는다는 꿈같은 컴퓨터 기술에 주목하고 있다.

 http://www.newcess.com/0010/tech-1.htm

가장 기본적인 인류의 커뮤니케이션 방식
30여 년의 비교적 긴 역사를 가지고 있는 음성인식 기술은 말할때 나타나는 특징을 분석하는 것으로,이러한 음성의 특징은 성 도(입과 코를 잇는 관)와 입,콧구멍 등 말할 때 사용되는 인간의 신체 메커니즘에 의해 사람마다 다르게 나타난다. 이러한 사실에 기반한 음성인식 기술에 대한 연구와 아이디어 개발로 그간 다양한 솔루션이 시장에 선보여 왔지만,사실 대중의 이목을 집중시킬 수 있을 만한 제품은 거의 없었던 것이 사실이다.

그러나, 최근 들어 가장 자연스러운 인간의 의사소통 수단 인 이 음성을 이용한 다양한 솔루션 개발을 위해 투자와 연구가 집중되면서,그동안 음성인식 기술의 상용화의 가장 큰 걸림돌로 지적돼 왔던 확실한 기술력,즉 인식률에 대한 문제와 사용자 인 터페이스로 적용했을 때의 효율성 등의 문제를 완전히 해결할 수 있는 기술력을 확보한 업체들이 생겨났고,이에 따라 음성인식 시장에 대한 관심 또한 점차 확산되고 있다. 이렇듯,디지털 방식으로 변환되어 음성인식 장치에 저장된 사 용자의 음성은 폭넓은 응용성과 사용의 편리함으로 인해 점점 그 영역을 확장해 나가고 있는 추세다.

특히, 전화 등 음성 커뮤니케이션 수단을 통해 원거리에서 인증을 해야 할 때 유용한 수단인 음성인식 기술을 이용,미국 메릴랜드 대학에서는 음성사서함에 적용하고 있으며,GTE에서는 이동전화 위조방지에,또는 전화를 통한 신용카드 인증시에도 사용되고 있다. 음성이라는 특성상,현재 이 분야에서는 AT&T 와 Bell 등 세계적 인 전화회사들이 가장 앞선 기술력을 보유하고 있는 것으로 평가 되고 있고,이외에도 VeriVoice,ITT,Veritel,T-Netix,Qvoice 등 의 업체가 개발에 나서고 있는 상황이다.

한편,국내에서는 KAIST등의 대학 연구실과 삼성종합기술원,LG 종합기술원,ETRI,KT 연 구소 등을 중심으로 전문적인 연구가 진행되고 있으며,활발한 움직임을 보이고 있는 국내 업체로는 KAIST 재학생 및 졸업생들이 모여 설립한 S L 2 와 LG EDS 및 종합기술원 출신들이 모여 만든 보 이스웨어 등을 꼽을 수 있다. 그러나 음성인식 기술에도 아직 숙제는 많이 남아있다.입력기 와의 직접적인 접촉을 필요로 하지 않는다는 큰 장점을 갖추고는있지만, 개개인의 음성을 모두 구별해 내는 기술이 말처럼 그리 쉽게 구현되기는 힘들다는 지적이다.

예를 들어, 감기에 걸렸거나 목이 쉬었을 때 등의 건강상태 에 따라 달라지는 음성의 인식을 가능케 하기 위해서 는 아직 가야할 길이 남아있는 것으로 보이며,또 주 위환경에 잡음이 많을 때의 오류가능성,그리고 다른 생체인식 기술에 비해 늦은 처리속도 또한 음성인식 기술에도 숙제로 남겨져 있다.

(정보보호21C 3월호)