"美 대선에서 드러난 ‘빅데이터’의 오류 - ‘GIGO’를 넘어라"

모바일, 통신/SNS - 문화, 매체 .☞ 펌보다 링크

미국 SNS의 문화와 새로 적용될 기술, 트렌드 해석을 잘 봐야 합니다.

우리가 4년 앞서 경험했지만, 미국에서 배울 게 분명히 있을 거라고 저는 생각합니다.


美 대선에서 드러난 ‘빅데이터’의 오류

‘GIGO’를 넘어라…가치 있는 데이터를 선별적으로 수집·가공해야

2016.12.4 한경 매거진

  • 주요 기관, 업체들이 힐러리 당선을 예상했지만 결과는 트럼프 압승.
    (주별 승자독식인 미국 선거방식의 특징은 미국 회사들이 제일 잘 알고 있을 것이니 문제가 아님)
  • "트럼프와 클린턴 등 두 대선 후보는 물론 많은 기관들 역시 선거 판세 전망을 위해 빅데이터 기술에 천문학적 비용을 투자한 것으로 알려졌다. 이런 차원에서 이번 미국 대선은 빅데이터 기술의 가치와 한계에 대한 활발한 논의를 촉발하는 계기가 됐다."
  • 구글 트렌드 스크린샷이 기사에 있습니다. ^^; 위, 아래 그래프를 보면 질문을 잘 해야 좋은 대답을 얻는다는 얘기?
    구글 트렌드가 여론조사나 종래의 빅데이터 분석보다 효과적이었다는 이야기. 구글이 사용자수 절대과점을 자랑하는 검색엔진이기 떄문에 바탕 자료의 신뢰도는 높겠죠.

  • "전문가들은 빅데이터 기술을 통해 복잡한 현상의 이해는 물론 미래의 발생 가능한 사건까지 예상할 수 있을 것이라고 주장" .. 마이너리티 리포트?
  • 거대한 데이터를 통계적으로 처리하고 이를 기반으로 의사 결정을 수행하는 것은 인간의 즉흥적 판단으로 야기할 수 있는 실패의 위험을 낮출 수 있음
  • 현재 여러 국가의 정부와 글로벌 기업들은 (이미) 합리적인 전략 및 정책 수립을 위해 빅데이터 기술을 사용해 평가[각주:1]
  • "최근 빅데이터 기술이 부상하게 된 주요 요인은 PC·인터넷·모바일을 중심으로 데이터가 폭발적으로 증가했기 때문" .. 즉, 사람들간 정보 유통량 중 의미있는 수준 이상의 양이 전자통신을 통해 이루어지므로 그 데이터가 현실을 예측하는 데 쓸모가 생겼다는 얘기로 읽으면 될 듯.
  • "빅데이터의 잠재 가치에 새롭게 주목한 많은 기관들은 자체적인 데이터 모니터링 및 분석 기술을 강화하고 시시각각 변하는 정보 및 트렌드를 습득"

  • "데이터는 본질적으로 출처 및 전달 경로, 수용 목적에 따라 서로 다른 의미와 가치를 지님"
  • "대부분의 데이터는 객관적 사실과 정보보다 주관적 성향과 판단이 획득, 해석 과정에 끼어듬"
  • "대부분의 언론과 선거 조사 기관들은 접근하기 쉬운 유권자를 대상으로 선호도를 조사했기 때문에 일부 편향된 시각이 전체 여론을 대변하는 것처럼 오인됐을 가능성이 높다."

  • 이번 미국 대선 예측이 어긋난 이유 중 하나는 부동층.
    다른 하나는 지지자 간 적대감표출때문에, 그리고 트럼프의 주장에 공감하지만 "정치적으로 올바르지" 않다는 평가를 부담스러워해 지지를 숨기고 투표로 말한 "샤이 트럼프".

    하지만 방법 후보가 없는 건 아님.
  • "인도의 인공지능 기술 스타트업 ‘제닉 AI(Genic AI)’가 만든 선거 예측 프로그램 ‘모그 IA(Mog IA)’는 페이스북·트위터 등 소셜 네트워크 서비스(SNS)에서 2000만 개의 데이터를 추출하고 이를 자체 알고리즘으로 분석해 트럼프 후보의 승리를 맞혔다고 주장"
  • "구글 검색을 기반으로 사회 트렌드를 보여주는 ‘구글 트렌드’ 역시 지난 1년간 클린턴 후보보다 트럼프 후보를 검색한 횟수가 더욱 많았기 때문에 트럼프 후보가 대통령이 될 것으로 추정할 수 있었다고 설명"

  • (이미) 정치·경제·스포츠·기후 등 여러 분야에 걸쳐 빅데이터 기술은 폭넓게 활용되고 있음.
  • 각종 학문의 난제를 풀고 복잡하게 얽혀 있는 사회 현안의 개선 용도로도 쓰임.
  • 사물인터넷과 머신러닝이 발전하면, 앞으로 더 많은 인간 활동 데이터가 전자신호로 쏟아져들어올 테고, 기술은 그걸 더 정교하게 해석하고 인류 생활에 피드백하게 될 것임. 

  • 빅 데이터는 많은 데이터. 하지만 많기만 하면 장땡인가? 감당할 깜냥이 돼야지!
  • GIGO(Garbage In, Garbage Out): 데이터 분석을 통한 성과 도출의 수준은 적절한 데이터의 수집과 검증에 의해 좌우된다
  • "빅데이터 기술을 효과적으로 사용하기 위해서는 먼저 빅데이터 활용 전략부터 차근차근 고려해야"
  • "해당 분야에 대한 철저한 이해를 바탕으로 데이터 분석 목적과 활용 방안을 정의하고 이를 통해 필요한 데이터를 수집하고 도출 결과의 활용 방안 등 구체적인 계획을 우선적으로 수립해야"
  • "특히 광범위한 데이터 축적보다 구체적인 목표 아래 가치 있는 데이터를 선별적으로 수집하고 가공할 수 있는 능력이 빅데이터 시대의 핵심 역량"[각주:2]


  1. 인공지능과 데이터를 다루는 기술과 인재의 수준이, 국제신용평가기관이 국가신용도를 정하는 데 영향을 주는 요소로 간주될 날이 올 지도 모릅니다. [본문으로]
  2. 인간 게놈이 해석된 지 이십 년이 돼 가지만, 누구에게나 개방돼 있는 그 코드를 해석해 열매를 따내는 연구는, 아무나 시도할 수 있지만 아무나 해내지는 못한 것처럼. [본문으로]
이 글과 같은 분류 글목록으로 가기 / 최신글목록으로 가기
트랙백이 없고, 댓글이 없습니다.
☞ 링크/트랙백관련

댓글을 달아 주세요