관리 메뉴

PC Geek's

짧은 생각: 알고리즘기반 뉴스 노출, 개인화 뉴스추천 서비스의 단점 본문

모바일, 통신/SNS - 문화, 매체

짧은 생각: 알고리즘기반 뉴스 노출, 개인화 뉴스추천 서비스의 단점

이런 느낌이 들어.. 구글은 알고리즘기반이라며 변명하고 이후 이의제기는 무시하고 내부적으로 개선하고, 네이버는 알고리즘기반이라 했다가 욕먹고 사람이 개입했다가 인위적이라며 욕먹고 다시 알고리즘으로 돌아가고, 다음은 사람이 하다가 알고리즘으로 바꿔서 칭찬듣고. 다음은 뉴스포털 하나 붙잡고 네이버의 콩라인 이상은 못 바라보고 기우나 했지만 카카오가 먹으면서 부활한 느낌이다.

물론, 나는 이런 거 전문가도 아니고 잘 모른다. 이 글을 적어 가며 공부한다고 보면 맞다. 그냥 다음과 네이버의 뉴스란을 즐겨 읽는 이용자 관점에서 느낀 점이다. 옛날부터 다음이 네이버보다는 종이신문을 보는 느낌을 주었고, 인력이든 자동이든 이슈를 정리하는 쪽도 앞서서 다음을 즐겨 보았다. 하지만 네이버가 다른 면에서 많이 따라가면서(그리고 이상하게 몇 년 전부터 오랫동안, 다음은 웹페이지를 열어놓기만 해도 CPU를 먹었다. 지금에 와서는 웹사이트가 개선되었는 지 웹브라우저가 개선되었는 지 잘 모르겠지만 그런 면은 줄어든 것 같(?)지만.) 지금 내가 양쪽 뉴스포털을 이용하는 빈도는 비슷비슷하다.



다음뉴스 전면 개편…’미디어랩’ 신설 - 2016.11

  • 이슈 및 해시태그 키워드는 카카오가 자체 개발한 ‘MC2(Media Contents Cluster, 미디어 콘텐츠 클러스터)’ 시스템을 활용해 자동으로 분류
  • 미디어랩은 이용자들에게 뉴스를 보는 새로운 방법을 제시하는 공간이다. 키워드, 쿼트(최신 기사에서 추출된 화제 발언. 인력인지 자동인지는 기사에 없었음)별로 뉴스를 모아볼 수 있도록 구성
  • 자동요약은 다음뉴스에 게재된 뉴스를 200자 내외로 요약해주는 기능(기사요약 서비스 서버 및 방법 특허)

‘가짜뉴스’와 관련해 카카오는 '가짜뉴스 바로알기'와 ‘언론사별 팩트체크' 코너를 마련 - 2017.4.21


그런데, 요즘 네이버에 대해서 뉴스포털에 사용하는 알고리즘을 공개하라는 요구가 많지만, 카카오의 MC2시스템 알고리즘을 공개하라는 말이나, 카카오가 그것을 공개했다는 기사는 나는 찾지 못했다. 구글은 알고리즘으로 나열하고 요약하는 논문을 공개했다고 한다. 그런데, 그 논문을 기반으로 구체적인 사례, 예를 들어 "왜 종군위안부를 매춘부라고 표현했는 지" 설명한 적은 없고 그럴 수 있는 외부인도 없다. 사안은 다르지만 구글만이 그런 것도 아니고, 알고리즘을 공개하든 하지 않든 이슈가 생기면 외부에서 회사를 보는 눈은 대동소이할 것이다.



"루빅스"라는, 카카오의 개인 맞춤형 뉴스 서비스 알고리즘에 대해서는 논문이 있다고 한다. 2015년 6월부터 적용했다고 한다. 그리고 다음으로 확장했다고.

https://brunch.co.kr/@kakao-it/57

다음(Daum)의 개인 맞춤 뉴스 알고리즘 ‘루빅스(RUBICS)’ Personalized News Recommendation Algorithm ‘RUBICS’


그런데.. 카카오든 네이버든 구글이든 페이스북이든 말인데,

개인화 서비스는 좋기는 하지만 좋기만 할까?

  • "이용자마다 선호가 다르므로 더 즐겨 볼 만 한 뉴스목록을 다르게 구성해 추천한다"는 말은, 더 많은 시간동안 자사 서비스에 머무르게 한다는 뜻이며, 그것은 더 많은 광고수입으로 연결된다. 
  • 이것은 이용자가 여러 페이지를 뒤적거리며 볼 만 한 뉴스를 찾는 수고를 덜어 준다.

  • 한편 이용자는 서비스가 제공하는 뉴스를 읽고 자기의 생각을 강화하는 쪽으로 변하기 쉽다. 왜냐 하면 서비스는 결국, "이용자의 눈치를 보며 팔릴 만 한 메뉴만 추천하는 웨이터"기 때문이다. 영양사도 아니고 주치의도 아니다.

  • 결국 이용자는 개인화된 서비스에서 왕으로 받들어지지만. '상소를 골라 읽는 왕'이다.
  • 또한 서비스는 그 '왕'과 비슷한 의견과 세계관을 가진 다른 '왕'을 친구추천하고, 그 결과는 유유상종이다.
  • 그리고 이들의 편식과 편먹기가 되먹임되면 그런 유유상종 집단 사이의 간극은 점점 멀어지고 만나기라도 하면 적대적이 될 가능성이 높아지만, 서비스는 이것을 어떻게 할 생각은 아직 없는 것 같다. 양약은 고어구요, '지적질'은 돈이 안 되니까?

  • 인터넷과 뉴스포털은, 본래 돈이 많이 들어 하나 또는 소수의 매체만 구독하던 사람들에게, 업종과 취향과 빈부에 무관하게 시간만 있으면 모든 매체를 원하는 대로, 혹은 우연히 접할 수 있도록 하는 자유를 주었다.
  • 하지만 개인화 서비스는 그 반대로, 개인이 환경적 제약에 의해서가 아니라 바로 그 자신이 원해서, 다시 굴속으로 들어가기에 좋은 조건을 제공하고 있다.

이것이 내 생각이다.


네이버도 올해, 서비스 개인화를 중요한 과제로 발표했는데..

개인화하면 각 개인은 자기가 보고 싶은 뉴스를 보니까 좋을 것이다.

그리고 자기만의 세상에 몰입하지 않을까.


사람들이 원하는 것은 결국, 자기가 보기 좋은 뉴스 목록을 다른 사람도 보기를 바라는 것일 게다. 그런데 한편으로 남의 주관적 기호가 들어간 뉴스 목록을 보는 것은 극구 싫어할 것이다. 그것이 지금의 이슈쟎아? 내 기호가 덜 반영된 것 같은데 이게 부당한 처사의 결과가 아니냐는.



가끔은 쿠키와 방문기록같은 거 없이 구성한 뉴스 목록을 보는 게 바람직하지 않을까. 그리고 실시간 검색어도 없고, 많이 읽은 기사 추천도 없고, 댓글많은 기사 목록도 없고, 공감글 목록도 없는. 어떻게 하면 그런 걸 다 빼고 그럴 듯 한 기사 목록을 구성할 수 있을까? 그리고 그렇게 구성된 목록이 군중보다, 서비스 주체보다 더 큰 누군가의 입맛에 맞게 조정된 게 아니려면 프로그램을 어떻게 짜야 할까. 중립은 색이 없는 것이지 좋은 것이라는 보장은 없다. 그리고 중립이든 랜덤이든 자기 뜻대로 움직이고자 시도하는 누군가나 집단은 있을 것이다.[각주:1] 빨강공과 파랑공이 10개씩 든 주머니에서 하나 꺼낼 때 파랑공을 더 자주 뽑게 하고 싶다면 파랑공을 100개 더 넣으면 된다는 걸 모르는 사람은 없을 테니까.



카카오는 알고리즘 윤리 헌장이라는 것을 2018년 1월에 발표했는데

https://www.kakaocorp.com/kakao/ai/algorithm 간단 요약은 http://www.irobotnews.com/news/articleView.html?idxno=12989

당연한 소리고, 별다른 이야기는 없다. 정보를 공개한 건 아니고 두루뭉실하다. 네이버가 두둘겨맞으니까 2번 타자가 되기 전에 미리 꺼낸 것 같은 인상. 얼마든지 옆으로 해석될 수 있고 법적인 의무도 없다. 하지만 있어서 나쁠 것도 없다.


2017년 여름 기준 네이버와 다음 뉴스포털을 비교한 블로터 기사:

뉴스포털에 들어가고자 하는 매체 관점에서 쓴 기사라 하면 될 텐데,
궁금했던 점을 몇 가지 설명해주고 있다.

뉴스를 만드는 사람 관점에서 사람들이 잘 읽고 포털이 잘 픽업해 줄 뉴스는? 하는 이야기다.


덧붙이면, 예나 지금이나 다음(카카오)는 은근히 약은(?) 부분이 하나 있다. 


네이버는 옛날부터, 뉴스포털에 게재된 모든 기사는 기사원문 보기 링크가 기사 제목에 이웃해 있어서, 그 링크를 클릭하면 해당 매체의 웹사이트 그 기사로 연결된다. 적어도 그 점에서 네이버는 언론사를 배려했다. 하지만 다음은 그런 거 없었고 지금도 없다.


미디어다음에는 없지만 네이버 뉴스에는 있는 것: 언론사 해당기사 원문 바로가기


이젠 거의 포기하다시피했지만, 나는 이렇게 기사를 보고 글을 쓰던 초기에는 되도록 포털사이트 링크를 사용하지 않고 매체의 원문 링크를 사용하려고 했더랬다. 그 때 네이버는 클릭 한 번에 원문을 볼 수 있었다. 하지만 다음은 언제나 기사 제목을 범위지정한 다음 그것으로 구글검색을 해서 결과물을 찾아 클릭해야 해당 매체의 기사를 확인할 수 있었다.


그럼 이렇게 해서 다음이 얻는 이득은 무엇인가? 물론 기사가 끝난 다음에 하단 열거된 연관 기사를 클릭하면 해당 매체로 이동할 수 있다(그것은 네이버도 마찬가지다). 하지만 이렇게 함으로써 독자가 다음 안에서 맴돌게 하는 효과를 노렸을 것이다.


  1. 알고리즘이 공개되지 않았다면 다양한 시도를 해 윤곽을 파악하려 할 것이고, 알고리즘이 공개되었다면 그것을 파훼해 의도대로 동작하게 할 코드를 짤 것이다. [본문으로]
이 글과 같은 분류글목록으로 / 최신글목록 이동
Comments
Viewed Posts
Recent Comments
Recent Posts