관리 메뉴

PC Geek's

기계 학습(machine learning ; 머신 러닝) - zdnet 연재물 본문

기술과 유행/로봇

기계 학습(machine learning ; 머신 러닝) - zdnet 연재물

간단 검색 결과 메모, 그리고 정리. 링크만 하려다 재미있어서 기사를 좀 보다 내용이 늘어버렸다.. 구글 검색은 '머신 러닝'으로 하면 다 나온다.


개발자를 위한 머신 러닝 - 임백준

위 문서에서 참고자료로 언급한 사이트 링크:

http://openclassroom.stanford.edu/MainFolder/CoursePage.php?course=MachineLearning

http://www.whydsp.org/237



ZDNET 머신러닝 특집 (2014.12)

1)구글CEO도 흥분시킨 머신러닝의 세계 

2)머신러닝이 몰고올 IT 진화 시나리오 

3)머신러닝, 제대로 쓰기 위한 3가지 키워드  


- "머신러닝은 아무것도 모르는 기계가 법칙을 알게 만드는 것이다" ???

- 빅데이터와 머신러닝은 연관성은 있지만 각자의 길을 걷는 기술. 머신러닝은 인공지능의 일부.

- ‘인공지능은 워낙 광범위한 범위를 포함하고 있고 그 중 머신러닝은 예측에 대한 부분을 주로 맡는다" - 이건복

- ” 딥러닝은 머신러닝의 방법 중 하나로 아주 복잡한 모델링까지 가능하면서 인기”, "딥러닝은 컴퓨터 공학자들이 사람 뇌가 어떻게 작동하고 있나를 단순하게 모델링한 것이다” - 김정희


- "데이터를 활용하는 알고리즘을 정교하게 만들면 컴퓨터가 스스로 학습해가며 사용자들에게 의미있는 결과물을 제공할 수 있다." 빅 데이터시대에 어쩔 수 없는 대세.

- 소프트웨어가 데이터를 처리하는 기준이 과거의 데이터를 처리하며 얻은 결과의 피드백에 따르는 것. 데이터드리븐(data driven). 이전에는 룰드리븐(rule driven)이라고 해서 프로그래머가 소스를 짤 때 정해줌. 그런데 이 말만으로는 좀 애매하다. 요즘 세상 프로그램은 어느 정도 데이터드리븐이니까. 그 개념을 어떻게 구현하느냐..



아, 받아적으면서도 뜬구름잡는 느낌 ㅠ.ㅠ



현재

- 네이버: 자동 사진분류서비스 개발 중

- 구글: 고양이를 찾아내!라면 고양이 그림을 골라내는 인공지능, 구글나우, 페이지링크

- 페이스북: 얼굴 사진에서 프로필 추출. 성별, 헤어스타일, 옷 스타일, 얼굴 표정 등. 시작은 광고 최적화가 용도.

- 넷플릭스: 구매이력을 분석해 추천하는 서비스

- 야후, 트위터: 이용자가 태그를 달지 않아도 그림, 영상 등을 분류하는 머신러닝 개발사 인수.

- IBM : 왓슨

- 마이크로소프트 : 아담, 애저(Azure) 클라우드 서비스. 스카이프에 음성 자동통역기능 추가.

   KAIST 스마트 트래픽 연구

- 아마존 파이어플라이 서비스: 입력된 소리를 분석해 영화, 음원 등 상품을 나열. 그 외 아마존 에코(Echo) 등


그러고 보면, 영상 속에 들어 있는 사람 이미지 분석은, 수사드라마에서도 볼 수 있고 실제로도 어느 정도 쓰이는 기술이다. 수많은 CCTV를 모두 사람이 지켜볼 수는 없으니까 결국 컴퓨터가 분석해야 한다.


"머신러닝 기반 이미지 인식이 로봇에 적용되면 로봇이 이미지를 통해 주변 사물을 인지하고 뭔가 행동를 할 수 있게 구현할 수도 있다" - 김정희/네이버 랩스 수석연구원



머신 러닝의 요소:  ▲데이터 ▲인력 ▲컴퓨팅 파워

- 방대한 데이터가 더 나은 인공지능을 만든다.

- 한국과 달리 외국은 개방된 공공데이터, 거래되는 기업데이터가 많다


- 기계+데이터만으로는 아무 일도 일어나지 않는다. 사람이 필요하다. "데이터 사이언티스트"

- 알고리즘을 짜고, 적절한 케이스를 적용해 학습시키고.. 기계가 데이터를 이해하기 전에 그 기계를 디자인하는 사람이 데이터를 이해해야.

- 공개된 머신러닝 알고리즘은 많다. 하지만 그것을 잘 이해하는 인재는 국내에 적다.

- "복잡하지 않은 패턴이라면 공개된 알고리즘을 가져다 적용하면 된다. 그러나 누구나 똑같은 알고리즘을 쓴다면, 머신러닝을 쓸 이유는 없다. 사람의 작업 일부를 기계가 대신하게 할 뿐이다."

- 우수한 인재를 스카웃하는 목적은 단지 그의 지식을 이용하는 자동화된 기계를 만드는 데 있지 않다. 인재를 더 많이 양성해서 더 많은, 더 진보된 기계를 설계하는 것이다. (시장은 확대 일로다)

“머신러닝의 기본 지식은 컴퓨터 과학쪽이고. 그 기본은 수학” - 김정희

- “폴리노미아 함수, 일반함수 피팅, 시그노이드 함수. 확률 피팅, 리그레션, 뉴럴넷, 서포트백터머신 등이 많이 쓰이는 알고리즘들이에요. 머신러닝을 잘하고 싶으면 고급수학을 잘 알아야 합니다. 공업수학 수준은 아니더라도, 확률(제1), 미적분 정도인데 학부수준이 아니라 수학과 전공수준의 해석학 정도는 해야 합니다. 그래야 고급 확률을 할 수 있을 거에요. 선형대수학도 아주 중요합니다. 처음 시작하는 사람이라면 선형대수학과 확률해석학, 함수해석 정도를 공부하는 게 좋겠습니다.”  - 유인관/ 티그레이프


- 논문작성 수준이라면 GPGPU도 가능. 하지만 상업적인 수준을 목표로 한다면 수퍼컴퓨터에 준하는 저장량과 처리 능력이 필요.

- 머신러닝 툴은 누구나 쓸 수 있는 상황

- 누구나 리눅스 소스를 받아 수정하거나 컴파일, 빌드할 수 있는 것처럼, 머신러닝도 공개된 자료를 가지고 이것저것 해볼 수는 있다. 당신이 일하는 분야가 어디든 간에, 머신 러닝에 관심이 있다면 해보라..는 말.


이 글과 같은 분류글목록으로 / 최신글목록 이동
Comments
Viewed Posts
Recent Comments
Recent Posts