Recent Posts
Recent Comments
관리 메뉴

PC Geek's

KT경제경영연구소가 내놓은 ‘인공지능기반 음성인식, 사람보다 낫다’ 보고서 본문

기술과 유행/공정, 제작과정, 노동대체

KT경제경영연구소가 내놓은 ‘인공지능기반 음성인식, 사람보다 낫다’ 보고서

경향신문이 이 보고서를 인용해 기사를 썼습니다.

그래서인지 일반 기사와는 달리 깊이가 좀 있네요.


'손 안의 비서' 이젠 목소리만 듣고 응답한다 - 경향신문 2016.10.09.

[경향신문] ㆍNO터치! ‘음성인식’ 대중화

http://media.daum.net/digital/others/newsview?newsid=20161009214134468


  • 음성인식 기술은 일찍이 1952년 미국 벨 연구소가 숫자 인식 시스템 ‘오드레이’ 개발을 시작
  • KT쪽에서는 통상 음성인식 솔루션을 통해 입력하는 속도는 키보드나 마우스 등 물리적 인터페이스 대비 2~3배 빠르다고 평가. 미국쪽에서는 영문의 경우 4배까지도 빠를 수 있다고 함. 즉, 잘 알아듣기만 하면 받아쓰기 비서는 유망하다는 이야기.

KT 보고서의 원문

언급된 여러 사례는 생락하고, 주의를 끈 일부를 발췌.


콜센터 음성인식


미국 AT&T의 콜센터가 음성인식 기술을 이용해 실시간으로 속기록을 생성하고 고객의 감정 상태를 파악하는 시스템을 구축했다. 이 시스템은 고객과 상담원의 대화 내용 음성을 인식해 이를 실시간으로 받아쓰기 해서 글자로 바꿔 주고 고객의 말투를 분석해 이 고객이 화가 났는지, 차분한 상태인지 등을 파악하고 데이터베이스와 대조한 후 해당 상태에 적합한 답변을 상담원이 보는 화면에 띄워 준다.


이 시스템은 '기계 학습'(Machine Learning)을 활용하여 컴퓨터가 과거 경험에 따라 반응 양식을 바꿔 나가고 변하며, 이를 이용해 인간 상담원은 더 나은 고객상담 서비스를 할 수 있게 된다. 또한 이를 바탕으로 고객이 다음에 어떤 질문을 할지 예상해서 상담원들이 화면을 보고 대비할 수 있도록 하는 기능도 있다.


한편 KTDS는 고객의 목소리를 인식하고 구별하며 변환하는 솔루션 ‘씽크 투 텍스트(Think To Text, 이하 TTT)’를 출시했다. TTT는 단순한 단어 인식을 넘어 음성·텍스트 변환과 연속 음성과 문장의 의미를 추출하고 분석하는 기능으로 차별화를 시도했다. 자체테스트한 결과 음성을 문자로 변환했을 때 정확도는 80~85%를 보였다.


Dragon Medical 360 뉘앙스커뮤니케이션즈社의 ‘드라곤 메디컬 360’(Dragon Medical 360)은 전 세계 1만 곳 이상 의료기관에서 약 45만 명의 의사가 활용하고 있는 음성녹취서비스로 음성인식기술을 활용해 환자 상담과 처방 내용을 전자문서화해 EMR(Electronic Medical Record 전자의무기록) 작성을 지원한다.


IMC社 ‘위스퍼 포 헬스케어’(WiSPER for Healthcare), Dolbey社 ‘퓨전 스피치 EMR(Fusion Speech EMR) 그리고 M*Modal社 ‘플로엔시 다이렉트’(Fluency Direct) 역시 음성인식 기술을 활용한 의료 녹취 기술사업자로 서비스를 제공한다. 이중 Dolbey社 퓨전 스피치 EMR은 음성으로 인식된 데이터를 EMR 뿐만 아니라 제3 자 프로그램에서도 활용 가능해 사용자 편의성이 뛰어나다



이 글과 같은 분류 글목록으로 가기 / 최신글목록으로 가기
0 Comments
댓글쓰기 폼