-
deepseek 딥시크 이것 뭐에요?KN 2025. 1. 26. 21:05반응형
어제부턴가 나의 주식선배님들이 계시는 블라인드 주식투자방에 딥시크라는 키워드가 등장하기 시작했다.
엔비디아만 가지고 있으면 90살까지 부자로 살게 되는지 알았는데 엔비디아를 위협하는 딥시크 너는 누구냐..?
일단 딥시크가 무엇?
DeepSeek 은 2019년 설립된 중국의 AI 스타트업으로 대규모 언어 모델(LLM) 개발에 주력하고 있다. 창업자가 자오창이라는 사람인데 바이두 AI 연구원 출신이라고 한다. 최근 선보인 AI 모델 ‘DeepSeek-R1’은 제한된 자원으로도 미국의 주요 AI 기업들의 모델과 견줄 만한 성능을 보이고 있다고 한다.
딥시크의 주요 특징과 성과는 무엇?
딥시크는 제한된 하드웨어 자원을 극복하기 위해 소프트웨어 중심의 최적화와 혁신적인 모델 아키텍처를 개발했다고 한다. 이를 통해 에너지 절약과 효율적인 모델 훈련을 달성했다고..
또한 자사의 모델을 오픈소스로 공개해서, 학계와 산업계의 협력을 촉진하고 있다. 이러한 접근 방식은 빠른 혁신과 발전을 가능하게 한다. Meta의 최고 AI과학자인 Yann LeCun 이라는 분은 오픈소스 모델이 독점 모델을 능가할 수 있다고 강조했다.
그리고 딥시크는 강화학습을 활용하여 복잡한 문제 해결 능력을 향상시켰다고 한다. 기존의 지도 학습 데이터에 의존하지 않고도 고급 추론 능력을 개발할 수 있게 한다.
딥시크는 어떻게 GPU 사용량을 최소화 했나?
딥시크(DeepSeek)는 모델 아키텍처를 경량화하여 적은 GPU 자원으로도 고성능을 유지할 수 있게 설계했다.
메모리와 연산량을 줄이기 위해 모델의 파라미터 수를 줄이면서도 효율적인 계산이 가능한 기술을 적용했고, 양자화와 희소성 등의 기술로 GPU 연산 자원 소모를 최적화했다.
또한 데이터 배치 크기와 순환 학습을 최적화하여 학습 속도를 개선했으며, 단일 노드 기반 학습 방식을 도입하고 기존 모델의 학습 데이터와 파라미터를 재활용하여 훈련 시간과 GPU 사용량을 절감했다.
GPU 연산에 최적화된 커스텀 소프트웨어로 딥러닝 프레임워크를 개선하여 GPU 클러스터의 과도한 사용을 방지하고, 개별 GPU의 성능을 극대화하는 훈련 방식을 채택했다.
아울러 모델이 학습 과정에서 스스로 효율적인 패턴을 찾도록 설계하고, 자체적으로 데이터를 생성하고 가공하는 방식을 통해 데이터 준비 과정의 연산량을 감소시켰다.
그럼 이제 엔비디아(NVIDIA)의 시대는 끝인걸까? (난 아직 시작도 못해봤는데..)
현재로서는 엔비디아(NVIDIA)의 주가에 직접적인 영향을 미칠 가능성은 낮아 보인다고 한다. 엔비디아는 GPU 분야에서 독보적인 위치를 유지하고 있고 AI연구와 개발에 필수적인 하드웨어를 제공하고 있으므로 딥시크와 같은 기업의 성공은 AI 분야의 전반적인 발전을 촉진해서 오히려 AI 산업의 성장과 함께 긍정적인 영향을 줄 수 있을 것으로 기대한다고 한다.
딥시크는 하드웨어에 의존하지 않는 소프트웨어 중심의 AI 개발 철학을 내세웠다. 이러한 기술적 접근은 제한된 자원에서 혁신을 만들어 내는 사례로 AI 개발의 새로운 패러다임을 제시하고 있다.
반응형'KN' 카테고리의 다른 글
파나마 운하랑 중국이랑 무슨 관계이길래..? (0) 2025.01.28 트럼프 형님은 왜 파나마 운하를 장바구니에 넣었을까? (0) 2025.01.27 금리가 내려가면 왜 환율이 상승할까? (1) 2025.01.25 돈에도 가격이 있다고요? (0) 2025.01.24 금리를 내리면 무엇이 좋고 나쁜걸까? (0) 2025.01.23