관리 메뉴

PC Geek's

딥시크 R1과 반도체 업계 기사 조금 본문

기술과 유행/인공지능-2

딥시크 R1과 반도체 업계 기사 조금

딥시크 발표로는 정말 적은 리소스/비용 사용.. 국내 중소기업/기관들 이건 본받을 만하지 않을까하고 관심

뜯어보면 상당한 비용을 사용한 것. 기반연구와 자재비, 인건비까지 빼고 그저 전기요금만 적게 들었다 정도. 하지만 관심가질만.

 

오픈소스에서 배워간 것, 치팅한 것, 발표한 비용에 포함하지 않은 백그라운드 투자비용과 외부 도움 이런 걸 고려하면

일단 정공법을 버리고 따라갈 정도는 아니라는 게 중론.

 

하지만 일단 실용적으로 쓸 만하다는 체감을 주는 데 성공했다면 이건

ㅡ 소프트웨어쪽에서는 가성비 인공지능이 대확산하는 계기가 될 수 있어. 딥시크 R1은 MIT라이선스.

ㅡ 하드웨어쪽에서는 SW쪽에서의 공급요구가 당장은 예산이 부족하거나 가성비를 추종하는 기업들이 떨어져나갈 수 있으니 예상보다 줄어들 수 있어

ㅡ 장기적으로는 이쪽이 워낙 임팩트가 큰 분야라 돈이 있으면 누구나 달려드니 투자가 줄 일은 없다고. 가성비 로직이 발명됐다면 발전이 더 가속하면 가속했지.

 

1.

"가성비 AI 어쩌나" 국내 증시도 촉각…SK하이닉스 '초긴장'
한국경제신문 2025.01.30

엔비디아 3일간 12%↓…투심 위축
AI 반도체 수요 감소 우려 확산
韓 반도체주 향배는…삼성전자·SK하이닉스 영향 다를 듯

딥시크는 R1 기반 서비스와 함께 이 모델의 개발 논문 격인 기술보고서를 공개했다. 이 보고서에 따른 딥시크의 R1은 AIME, MATH-500, SWE-벤치 등 정보기술(IT) 업계 주요 벤치마크 테스트 결과 챗GPT의 GPT4 o1보다 나은 성능을 보였다. 챗GPT는 시장에 공개된 대규모 AI 서비스로는 자타공인 ‘1타’다. (......) R1은 대형 AI 모델에서 핵심적인 ‘액기스’ 지식을 추출해 소형 AI 모델로 전달하도록 하는 증류 방식을 적용한 것도 특징이다. 이를 통하면 보다 적은 연산 자원을 가지고도 AI 성능을 유지할 수 있다. (......) - 한경

 

ㅡ 딥시크는 V3의 기술보고서에서, 합법적인 중국수출이 가능한 H800 칩 2048개를 썼다며 전기료로 80억이란 훈련단계 비용을 계산했지만, 미국 테크기업들은 딥시크가 미국 제재를 피하려고 발표를 그렇게 했을 뿐이지 중국수출금지된 하이엔드 H100을 5만 개 이상 보유해 사용할 것으로 추정. 

ㅡ 또한 공개하지 않은 여러 항목들을 고려하면 80억은 그저, 시장에 충격을 주기 위한 선전용 숫자에 불과하다. (이것은 마치 인텔 14세대 i3칩의 개발비를 말하며 14세대 i7칩의 개발비를 빼고 전기료만 공개한 것과 비슷?) 

ㅡ 개발에 실제 투입한 비용과 리소스는 사람들의 상식을 크게 벗어나지 않을 것으로 추정된다.

 

ㅡ 국내 반도체주에 주는 영향은, 딥시크의 "가성비AI"주장이 사실일 경우,

단기적으로는 딥시크방식의 개발에 눈이 돌아갈 것이므로 투자심리 약화

장기적으로는 고성능 AI개발이 가속되 것이므로 순항

 

(사실 이것보다는, 삼전과 하이닉스의 턱밑까지 쫓아온 중국반도체기업들이 nVidia에 HBM을 납품하느냐가 더 큰 이슈일 것이다)

 

 “딥시크가 공개한 R1도, 미국 기업들이 공개한 각종 모델도 각 기업이 가지고 있는 전부가 아닐 것”, “각자 ‘비장의 카드’는 숨겨둔 채로 AI 경쟁이 격화할 전망이라 이번 발표로 HBM 수요가 꺾일 것이라 보긴 어렵다”, “딥시크의 R1 발표로 미국 AI 수퍼 사이클이 가속화하면 했지, 투자가 줄지는 않을 것” - 한경

 

 

MIT라이센스로 공개된 딥시크 R1, 활용 가능성은?

ㅡ 선발기업들과 후발기업들 사이의 상업서비스 품질 간격을 확 줄일 수 있다. 이 점에서 후발 기업에게 기회고, 많은 서비스가 빠르게 개발될 수 있다.

ㅡ 발표가 사실이라면 리소스를 적게 먹는 소형 모델이라는 점에서 활용도는 대단히 많다.

ㅡ 하지만 딥시크의 코드를 잘 이해하는 전문가가 필요하다. 공개 코드는 신뢰도와 보안, 평판이 중요한다. 딥시크는 생소한 신참회사고 그것도 배경을 알 수 없는 중국회사다. 잘 모르고 사용하는 것은 상당히 어렵다.

ㅡ (구글 크로뮴 브라우저와 비슷하게) 딥시크 R1의 코드를 개발에 사용한다는 것은 이쪽 생태계에 포함된다는 뜻이다. 

여러 모로, 중국 IT기업들과는 달리, 우리나라 회사들은 특히 정부관계나 정부사업을 따야 하는 회사들은 손대기 쉽지 않다.

 

다른 기사를 보면,

ㅡ 한국내 딥시크 이용자는 이미 120만 명을 넘어서서 챗GPT에 이어 두 번째 점유율.

ㅡ 이미 우리나라를 포함, 각국의  정부기관들은 딥시크 사용금지령을 내린 상태. AI에게 뭘 물어보려면 먼저 정보를 제공해야 하니까.

ㅡ 발빠르게 딥시크를 자사 AI서비스에 통합하는 IT대기업, 중소기업들도 있는데, 우리나라에서도 이미 모 의학영상분석업체가 그렇게 하겠다고 발표했다는 기사. 보안문제를 고려해 장벽을 세웠다고는 말하고 있다.

 

(AI시장도 AI 자체를 직접 개발하는 업체는 소수고 그걸 활용하는 업체가 다수인데, 오픈소스 SW을 사용하는 것도, 오픈소스를 사용해 제공되는 서비스를 유상으로 이용하는 것도, 회사에 전문가(AI전문가)가 있어야 단순 사용만 하려고 해도 순간의 실수로 회사가 기우는 일(아파치 서버 설정을 초기값대로 쓰다가 보안취약점을 털린 회사처럼?) 이 없다는 느낌.)

 

2.

中 딥시크에 화들짝 놀란 오픈AI…결국 칼 빼들었다
中 데이터 도용 조사하고 최신모델 무료 배포

한국경제신문 2025.1.30

 

ㅡ "오픈AI의 최대 주주인 마이크로소프트(MS)의 보안 연구원들도 지난해 가을 딥시크와 연관된 것으로 추정되는 사람들이 오픈AI의 응용프로그램 인터페이스(API)를 활용해 대량의 데이터를 빼돌리는 것을 확인한 것으로 알려졌다.", “딥시크가 오픈AI의 모델에서 지식을 추출했다는 상당한 증거가 있다”, “증류라고 불리는 기술을 포함해 미국의 첨단 AI 모델을 복제해 왔다"

 

ㅡ ‘딥시크 쇼크’에 오픈AI는 챗GPT 무료 사용자에게도 최신 추론 특화 거대언어모델(LLM) o3-미니 모델도 제공하기로 했다. 그동안 유료 이용자들을 대상으로 최신 AI 모델을 사용할 수 있는 권한을 줬는데 딥시크가 오픈소스 기반 추론 모델 ‘R1’ 시리즈를 공개하자 급선회

 

 

3.

딥시크 V3

https://dic.hankyung.com/economy/view?seq=16212

(......) 이 모델의 주목할 만한 특징은 뛰어난 GPU 효율성이다. 딥시크 V3는 메타의 라마보다 1.5배 큰 매개변수를 가졌음에도 불구하고, 훈련에 사용된 GPU는 라마의 10분의 1에 불과했다. 약 557만 달러의 비용으로 개발되어, 메타의 라마 모델 개발 비용의 약 10분의 1 수준에 그쳤다. (......) 한편, 이 모델은 중국의 민감한 정치적 이슈에 대해서는 응답하지 않는 제한점이 있다. 예를 들어, 천안문 광장에 대한 질문에는 대답하지 않는다. 그럼에도 불구하고, 딥시크 V3는 오픈소스로 공개되어 개발자들이 상업용을 포함한 다양한 애플리케이션에 활용할 수 있어, AI 기술 발전에 큰 기여를 할 것으로 기대된다. (......)

 

이 글과 같은 분류글목록으로 / 최신글목록 이동
Comments
Viewed Posts
Recent Comments
Recent Posts