관리 메뉴

PC Geek's

한컴의 통번역 서비스(앱) 말랑말랑 지니톡 관련/ 인공지능 자동통번역 서비스 본문

기술과 유행/인공지능-2

한컴의 통번역 서비스(앱) 말랑말랑 지니톡 관련/ 인공지능 자동통번역 서비스

이번 평창동계올림픽에 공식 앱이라는 이름을 달았더군요.

http://www.interfree.com/if/companyIntro/pyeongchang.do


http://www.interfree.com/if/productService/genieApp.do#utm_source=hancom&utm_medium=display&utm_campaign=2018_%ED%8F%89%EC%B0%BD%EB%8F%99%EA%B3%84%EC%98%AC%EB%A6%BC%ED%94%BD_%EC%A7%80%EB%8B%88%ED%86%A1


며칠 전 TV뉴스에서 보고 관심이 생겨서, 관련 기사를 모아 보았습니다.


[위클리 스마트] 올림픽 언어장벽 없애주는 동시통번역 앱 인기 - 연합뉴스 2018/02/17

공식 솔루션 한컴 지니톡, 다운로드 120만 돌파 

  • 지니톡과 파파고는 올림픽에 앞서 경찰청과 협력해 경찰업무와 관련한 통번역 서비스를 제공
  • 지니톡 이야기는 아니지만, 구글번역기 오류로 해프닝도 있었다고 합니다. "노르웨이 대표팀 요리사들이 최근 평창의 한 마트에 달걀 1천500개를 주문했는데 구글 번역기의 알 수 없는 오류로 달걀 1만5천개 배달"

이번 올림픽은 AI통역기, 번역기를 실전투입한 올림픽이 되었습니다. :)



'파파고'·'지니톡' 동시 통역앱, 평창서 언어 해결사로

최대 10개국 언어 동시 통역…문자·이미지 번역도 가능 - 뉴스토마토 2018.2.18

  • 토종 서비스 2종: 지니톡과 파파고 모두 인공신경망 기반.
    (국내 서비스는 네이버, 시스트란, 한컴인터프리, 플리토, 카카오 등)
  • 지니톡은 한국어를 기반으로 영어, 중국어, 일본어, 스페인어, 프랑스어, 러시아어, 독일어, 아랍어에 대한 8개 언어 쌍의 음성, 문자, 이미지(OCR) 번역기능 제공. 
  • 강원도 지역과 동계스포츠 전문용어 데이터베이스 등 올림픽 특화 데이터베이스(DB)를 구축해 전문화
  • 스마트폰에 지니톡을 설치한 후 말을 하거나 문자, 이미지를 입력하면 원하는 외국어로 자동 통번역 되는 방식으로 문자번역, 이미지 번역 기능도 수행
  • 네이버 파파고의 다운로드수는 1000만 건 돌파. 영어, 일본어, 중국어(간체), 스페인어, 프랑스어, 한국어, 중국어(번체), 베트남어, 태국어, 인도네시아어 등 10종
  • 번역서비스 플리토는 맛집정보 앱과 연계해, QR코드를 써서, 식당에서 메뉴판 번역을 요청하면 디지털로 제공하는 서비스 시작. 플리토에 관한 기사는: 언어장벽 허문 청계천…다국어 번역 ‘랭귀지 프리존’조성 - 디지털타임스 2017.12.29 참조.
[연구실탐방]ETRI 음성지능연구그룹, 평창에서 세계에 선보이는 '지니톡' 산실 - 전자신문 2018.2.5
평창올림픽에 배치되는 통번역 시스템은 넥밴드형 웨어러블 기기에 ETRI가 개발한 음성 구간 검출 기술 접목. 소음필터링 등이 중요.
(지니톡은 넥밴드형 '지니톡 프리핸즈'와, 무선연결없이 사용하는 '지니톡 오프라인', 스피커에 넣어 다자간 통화를 편하게 했다는 '지니톡 페어' 세 가지 형태로 올림픽에 제공되었다고 합니다. 숙박업소와 음식점, 관광안내소에 지니톡 오프라인 약 3500개를 무료 배포했다고 하네요. - 출처는 아래 기사)

여기엔 사람얼굴로봇 사진이 있는데, 며칠 전 TV에 나온 로봇은, 얼마나 구현했는 지는 모르겠지만, 모니터에 수호랑 얼굴이 들어가 있더군요. 그게 훨씬 나았습니다. :) 만화로 감정을 전달하는 것이 난이도가 낮고 비용이 적게 들고 더 효과적일 것입니다. 데포르메한 얼굴 모델을 사용한 감정 표현은 일본에선 그 문화때문에 잘 받아들여지는 것 같고, 서구 연구실에서도 오래 전부터 연구되고 있는 모양이던데요.

확장팩 설치시 29개 언어 지원… 문자 번역도. 평창올림픽 전문용어 AI로 학습. 
소음에 약해 인식률 개선 숙제 - 디지털타임스 2018-02-04
다른 기사에서, ETRI에서 도와줬다는 게 저 소음처리제였던 모양이군요. 


[인터뷰] 김무중 한컴인터프리 연구원 “지니톡 번역 비결은 사용자 타깃팅”

구글 등 타사 번역앱과 정확도 차이없어…“새로운 상황에 대한 대응 능력 봐야” - 시사저널e 2018.01.22

운동경기대회, 국제군사훈련 등 사용자 집단에 따라 특화한 확장팩으로 정확도 향상.

음성인식 정확도는 95%에서 더 향상시키는 것이 어렵다.

"인천부터 서울에서 강원도까지 이동 동선을 다 찾아서 고유명사, 합성어 등 관련 단어와 문장을 다 수집했다. 5만건에서 10만건 정도의 데이터를 학습시켰다." 


한글과컴퓨터, AI 자동통번역기 ‘지니톡 오프라인’ 출시(보도자료네요)

OTG USB 메모리 형태로 서비스 제공 - 로봇신문 2017.9.18

- ‘한컴 말랑말랑 지니톡’을 인터넷이 안되는 환경에서도 사용할 수 있도록 한 것.

-  해외 불통지역, 비행기 안에서도 통번역 서비스를 사용할 수 있도록 소형 OTG USB 메모리 형태의 ‘지니톡 오프라인’ 출시. 사용자는 ‘지니톡 오프라인’을 스마트폰에 꽂기만 하면 한국어, 영어, 중국어, 일본어 자동통번역 서비스를 사용.

- ‘지니톡 오프라인’은 음성인식과 음성 합성기술을 이용해 통역
- 문자나 SMS 등 직접 입력한 텍스트 번역 가능.
- 1개의 ‘지니톡 오프라인’으로 3대의 휴대폰까지 사용 가능.


원어민이 100점이면 통역사 90점, AI는 60~70점

인공지능 자동통번역 급격한 향상. 평창올림픽서도 8개 언어 통번역 지원 - 아시아경제 2018.02.11

70점이라는 게 낮은 점수같아도, 보통 사람보다 잘 하는 겁니다. 누구나 통역사를 대동할 수는 없쟎아요? 영어, 일본어, 중국어는 하는 사람이 마침 주변에 있을 지 몰라도 그 외 언어는 또 아니쟎아요?


KT경제경영연구소 "인공지능으로 날개 단 자동통번역 서비스 - 김슬기 2018.2.6"


○ (정의) 자동통번역 서비스는 컴퓨터의 처리능력을 활용해 어떤 언어를 다른 언어로 변환하는 서비스를 일컬음

- 자동통역과 자동번역의 차이점은 말소리를 옮기는 것과 텍스트를 옮기는 것의 차이

- 자동통역은 음성인식(Auto Speech Recognition, ASR), 음성언어번역(Spoken Language Translation, SLT), 음성합성(Text-to-Speech, TTS)기술로 구성, 비문이 많고 문장 전체에 대한 정보가 부족해 난이도 높음

- 자동번역은 전체 텍스트 정보가 입력되고 문단구분/문장부호 등의 정보가 존재하므로 난이도가 낮은 편

○ (전망) 자동통번역 시장은 향후 지속 발전될 것으로 전망, 구글/네이버 등 국내외 ICT기업은 고유의 인공지능 기반 기계번역 기술을 개발해 활발히 서비스 중

○ 자동통번역 기술은 ‘규칙기반 기계번역’에서 ‘통계기반 기계번역’ 발전했고, 최근엔 사람의 뇌가 학습하는 과정을 본딴 ‘신경망 기계번역’ 으로 진화함

- 원어민의 언어구사능력을 100점으로 본다면 전문 통번역사는 90점, 신경망 기계번역은 60~70점, 통계기반 기계번역은 30~40점 정도로 추정


○ 국내외 사업자의 자동통번역 서비스 동향

  1. 구글(구글번역기, 워드렌즈, 구글 신경망 기계번역(GNMT), 픽셀버드, 구글어시스턴트)
  2. 마이크로소프트(빙 번역기, 마이크로소프트 트랜슬래이터, 스카이프 실시간 음성번역서비스 프리뷰, 신경망 기계번역)
  3. 페이스북(컨볼루션 신경망(CNN)적용. 오픈소스 공개)
  4. 아마존(사파바 인수 후 아마존닷컴내 서비스)
  5. 네이버(N2MT기술 적용 파파고)
  6. 시스트란 인터내셔널(프랑스 시스트란이 한국 번역SW회사 CSLi를 인수해 설립. 산업별 특화 솔루션)
  7. 한컴인터프리(지니톡. 설치한 단말기끼리는 거리가 가까워지면 자동으로 인식, 자동언어세팅하는 기능 있음)
  8. 플리토(집단지성 번역서비스 플랫폼)
  9. 카카오(NMT적용 번역서비스 개발, 카카오 아이(I))
□ 신경망 기계번역, 데이터 확보 및 학습 지속되면 발전속도 커질 것
○ 구글, 네이버, MS 등 주요 사업자들이 대부분 신경망 기계번역으로 전환, 스스로 학습하면서 더 정확한 결과 값 기대 가능
○ 품질향상을 위해 크라우드 소싱(crowd sourcing)을 통해 향상 중
- 구글, ‘번역 커뮤니티’ 운영, 2개 국어 이상 익숙한 사용자들이 직접 참여해 번역문장과 기존 번역 수정을 수행, 구글 번역 알고리즘 개선에 활용
- 네이버 파파고짐(Gym), 주어진 문장을 보고 그 아래 제시된 여러 개의 번역 문장 중 적절한 것을 선택하거나 더 나은 번역을 제안, 파파고 학습데이터 및 번역 결과로 활용

□ 실시간 통번역 서비스을 위한 기기 다변화 및 음성인식 기술 발전

○ 텍스트 입력 기반의 자동번역에서 나아가 음성을 알아듣고 실시간 자동 통역을 수월하게 해줄 수 있는 디바이스로 확대 다변화 중

- 이어폰, HMD 등 웨어러블 기기: 구글 ‘픽셀버드’ 및 ‘안드로이드 웨어’, 일본 ‘Logbar’사의 ‘목걸이형 통역기’, 시스트란 ‘안경형 디스플레이’, 네이버 ’마스’등

- 인공지능 스피커: 네이버 파파고의 ‘웨이브’ 적용, 시스트란의 ‘SK 누구 미니’ 적용

- 로봇: 한컴인터프리 ‘통역하는 안내로봇’ 등

○ 음성인식(ASR) 분야도 함께 발전해야 실시간 자동통역 품질 향상 가능

- 글로벌은 뉘앙스, 구글, 애플 등 업체가 주도 중이지만, 국내에도 AI 스피커 붐이 일면서 국내 기업들도 음성인식 연구 활발, 기술력 향상 중


카카오와 지니톡의 번역이 미흡하다는 작년 기사가 하나 보였는데, 국내 번역기들이 아직은 구글 번역보단 못하더군요. 아무리 신경망이라 해도 차이가 커서가 아닐까요. 연구에 투입하는 인재의 차이는 혹시 모른다 해도 그것말고 바깥에서 보기에도 투입하는 자원량의 차이.. 이용자수의 차이, 무료서비스로 경험치를 늘려 성능을 향상시키는 예산과 계산량의 차이가 커서 결국은 (미국 대기업 서비스가 한국어를 후순위로 간주하는 동안) 특화서비스와 데이터베이스 보조로 살아남아야 할 것 같은데. 결국 여기도 '선택과 집중'인가..



이 글과 같은 분류글목록으로 / 최신글목록 이동
Comments
Viewed Posts
Recent Comments
Recent Posts