관리 메뉴

PC Geek's

미국 오픈AI의 ChatGPT에 대응하는 중국 AI모델이라는 'DeepSeek R1'에 관한 기사 하나 (링크) 본문

기술과 유행/챗GPT, 스테이블디퓨전 등 생성형인공지능

미국 오픈AI의 ChatGPT에 대응하는 중국 AI모델이라는 'DeepSeek R1'에 관한 기사 하나 (링크)

 

How a top Chinese AI model overcame US sanctions
With a new reasoning model that matches the performance of ChatGPT o1, DeepSeek managed to turn restrictions into innovation.
By Caiwei Chenarchive page
January 24, 2025

중국 최고 AI 모델이 미국 제재를 극복한 방법
DeepSeek은 ChatGPT o1의 성능과 일치하는 새로운 추론 모델을 통해 제한을 혁신으로 전환하는 데 성공했습니다.

https://www.technologyreview.com/2025/01/24/1110526/china-deepseek-top-ai-despite-sanctions/

 

How a top Chinese AI model overcame US sanctions

With a new reasoning model that matches the performance of ChatGPT o1, DeepSeek managed to turn restrictions into innovation.

www.technologyreview.com

(......) 노스웨스턴 대학교에서 컴퓨터 과학을 전공하고 현재 박사과정에 있는 지한 왕(Zihan Wang)에 따르면, DeepSeek은 R1을 개발하기 위해 GPU의 부담을 줄이기 위해 학습 프로세스를 재작업해야 했습니다. 이 GPU는 중국 시장을 겨냥해 엔비디아가 출시한 종류로, 성능이 최고 제품 속도의 절반으로 제한되어 있습니다. 

DeepSeek R1은 특히 수학과 코딩 분야에서 복잡한 추론 작업을 처리하는 능력으로 연구자들에게 칭찬을 받았습니다. 이 모델은 ChatGPT o1에서 사용하는 것과 유사한 "사고의 사슬" 접근 방식을 사용하여 쿼리를 단계별로 처리하여 문제를 해결할 수 있습니다.

Microsoft의 AI Frontiers 연구실의 수석 연구원인 디미트리스 파파일리오풀로스는 R1에 대해 가장 놀라운 점은 엔지니어링의 단순성이라고 말합니다. 그는 "DeepSeek은 모든 논리적 단계를 자세히 설명하는 대신 정확한 답을 목표로 했으며, 높은 수준의 효율성을 유지하면서 컴퓨팅 시간을 크게 줄였습니다."라고 말합니다.

DeepSeek은 또한 노트북에서 로컬로 실행할 수 있을 만큼 작은 R1의 6가지 작은 버전을 출시했습니다. 그 중 하나가 특정 벤치마크에서 OpenAI의 o1-mini보다 성능이 뛰어나다고 주장합니다. "DeepSeek은 o1-mini를 대체로 복제하여 오픈 소스화했습니다." Perplexity CEO Aravind Srinivas가 트윗했습니다. DeepSeek은 MIT Technology Review 의 의견 요청에 응답하지 않았습니다.

R1에 대한 화제에도 불구하고 DeepSeek은 상대적으로 알려지지 않았습니다. 중국 항저우에 본사를 둔 DeepSeek은 정보 및 전자 공학을 전공한 저장대학교 동문인 량원펑이 2023년 7월에 설립했습니다. 량이 2015년에 설립한 헤지펀드인 High-Flyer에서 인큐베이션되었습니다. (......) -기사에서

 

 

이후 이것에 대한 이야기.

그리고 미국의 금수조치에 대한 조금 비관적인? 비판적인 늬앙스도 적고 있는데,

 

 

카네기 국제평화재단의 AI 연구원인 맷 쉬핸은 "미국의 수출 통제는 본질적으로 중국 기업들을 제한된 컴퓨팅 리소스로 훨씬 더 효율적으로 일해야 하는 궁지에 몰아넣었습니다."라고 말했습니다. "우리는 미래에 컴퓨팅 부족과 관련된 많은 통합을 보게 될 것입니다." - 기사에서

 

 

나는 금수조치는, 그래야 할 필요가 있었다면 그렇게 한 효과가 있었다고 생각한다. 

 

반도체든 소프트웨어든 간에, 중국이 자체 개발이든 해킹/스파잉이든, 정부차원의 제재 영향을 받지 않는 오픈소스 커뮤니티에 기여하고 또 수혜받는 것을 포함해  다른 방법을 찾을 것을 예상할 수 있었던 이상,

이런 종류의 금수조치는 본질적으로 시간벌기다.[각주:1] 그리고 시간벌기가 유효하려면, 그리고 시간벌기의 목적은, 상대의 발을 걸어 발전을 늦추는 동안 나는 더 많은 투자를 해 간격을 벌이는 것이다.

그런데 상대의 발만 걸었지 내가 더 멀리 도망가려고 더 열심히 하지 않았다면,

어떻게든 살아남기 위해 진화한 상대에게 한 방 먹는 건 예상되는 결과일 것이다.

 

 

  1. 유감스럽게도 이것은 북한 핵개발과 핵무기 생산에 대한 문제에도 적용된다. 6자회담이 파행하며 북한을 고립시키기 실패한 2천년대 초 시점에서 이미, 한국은 핵무기 개발을 시작했어야 했다(그럼에도 지난 정부는, 이미 보유하고 있는 민간 핵기술마저 땅속에 파묻어, 한국의 원자력 기술수준을 영원히 핵무기개발을 시도할 상상도 할 수 없게 만들어버리려고 시도했다). 그것만이 북한이 핵무기를 가져서 노리는 것을 무력화할 수 있다. [본문으로]
이 글과 같은 분류글목록으로 / 최신글목록 이동
Comments
Viewed Posts
Recent Comments
Recent Posts