AI 생태계에 대한 DeepSeek의 함의
어웨어 리서치 원칙
우리가 리서치를 할 때 제 1 원칙은 한국어로 된 자료를 참고하거나 믿지 않는것이다. 제 2 원칙은 원 출처에 기반할 것이다. 제 3 원칙은 소셜 미디어에서 유명한 사람(인플루언서)의 말을 신뢰하지 않는것이다.

에이브러햄 링컨, 인터넷 정보에 대한 밈
신뢰할 수 없는 정보의 예시
다음은 DeepSeek에 대한 신영증권 반도체 담당 박상욱 선임연구원의 코멘트이다.
DeepSeek, AI 기술주 급락 코멘트
중국 딥시크(DeepSeek)의 영향으로 브로드컴, 엔비디아, 마이크론 등 AI 관련 업체들의 주가가 약세를 보임.
딥시크는 2023년에 설립된 중국의 AI 스타트업으로, 효율적인 AI 모델 개발로 주목받고 있음. 딥시크가 발표한 바에 따르면 첨단 하드웨어가 없이도 저비용으로 고성능 AI를 구현 가능함. 실제로 챗GPT o1과 비교했을 때 답변 수준이 유사한 것으로 확인됨.
외신에 따르면 딥시크는 대중 규제로 성능이 하향된 H800 칩을 사용했음. 딥시크는 H800을 시간의 2달러의 비용으로 2개월을 대여했다고 추측되며 총 비용은 약 58만달러로 라마3 학습 비용의 10분의 1수준임. 딥시크는 제한된 자원으로 고성능 AI 개발이 가능하단 점을 입증함.
딥시크의 발표로 향후 미국 빅테크 업체들의 효율성 중심 개발 트렌드가 강화될 가능성 높다는 판단. 비용 효율화가 비용 절감을 뜻 하는건 아니지만 투자를 보수적으로 집행할 가능성 높음. 1월 말부터 시작될 빅테크 업체들의 실적발표에 주목할 필요 있음.
또한 금번 발표로 인해 대중 수출 규제 강화될 가능성 높음. 중국이 낮은 비용으로 고성능 AI를 구현 가능한게 확인되면서 H800과 같은 대중 수출용 AI 반도체도 규제에 걸릴 것으로 전망됨. 반도체 소재, 부품, 장비 또한 규제에서 자유롭지 않다는 판단. 딥시크는 미중 무역 분쟁 심화의 계기가 될 것으로 예상됨.
당사는 딥시크가 H800으로 AI를 학습시켰는지에 대한 사실 여부를 확인할 필요 있다고 판단함. 중국은 미국 수출 규제를 우회해 H100 등 최신 AI 반도체를 수입하고 있다고 파악됨. 최근 Scale AI CEO인 Alexandr Wang은 CNBC 인터뷰에서 딥시크가 이미 5만개 이상의 H100을 보유하고 있다고 밝힘. 5만개의 H100의 가격은 대략 15억달러로 딥시크의 AI 개발 비용으로 추정되는 58만달러의 2,586배 수준. 루이싱커피, 이항 등 내부 정보를 통제했던 사례들을 고려하면 딥시크에 대한 정보도 과장됐을 가능성 존재한다는 판단.
논란이 된 건 DeepSeek의 V3 모델로, 기존보다 저비용에 OpenAI의 o1 모델과 비슷한 수준의 성능을 낸다고 주장하면서 AI 인프라(GPU 등)에 대한 과잉투자가 이루어진 것 아니냐는 우려를 일으켜 월요일 AI 관련주의 패닉셀을 불러 일으켰다. AI 인프라 대장주인 엔비디아(NVDA)의 경우 하루만에 16.97% 폭락할 정도로 투자자 심리에 거대한 악영향을 끼쳤다고 할 수 있다.
원 출처에 기반한 정보

DeepSeek-V3 훈련비용 | DeepSeek-V3 Technical Report
DeepSeek는 V3 Technical Report에서 훈련 비용이 $5.57 million, 즉 557만 달러라고 밝혔다. 박상욱 연구원의 58만 달러는 어디서 나온 숫자인지 모르겠는데, 부디 오타이길 바란다.
DeepSeek는 엔비디아의 H800 GPU 2,048개가 NVLink와 NVSwitch로 연결되어 있는 GPU 클러스터를 사용하여 V3 모델을 학습했다고 밝혔다.
해당 클러스터로 Pre-Training에 사용된 H800 GPU Hours를 나누면 약 2개월이 못 미치는 기간이 나온다. 모든 과정이 두 달만에 완료되었다는 이야기는 아니다.
DeepSeek는 "위에서 언급한 비용은 DeepSeek-V3의 공식 트레이닝에만 해당되며, 아키텍처, 알고리즘, 데이터와 관련된 사전 연구나 ablation에 들어간 비용은 포함되지 않는다"고 명시했다.
원 정보를 토대로 가공된 지식
Riot Games에서 연구원으로 일하며 Johns Hopkins 대학에서 인공지능 석사를 수료한 Eryk이 운영하는 블로그 글 Deepseek-V3 Training Budget Fermi Estimation의 핵심 내용을 요약해보자.
DeepSeek-V3 훈련 비용: 557만 달러는 전체 훈련 비용이 아니라 GPU 임대 시간 기준으로 계산된 값이다.
훈련 시간 및 토큰 수치: 논문에서 제시한 2.788M GPU 시간과 14.8조 토큰 수치는 충분히 가능하다고 판단된다.
병목현상 감소: fp8 혼합 정밀도와 MoE 최적화 덕분에 훈련 효율성을 높였다.
결론: 논문에서 주장한 훈련 시간과 비용은 현실적이며, 기술적 개선으로 이를 가능하게 했다.
DeepSeek-V3 논문에서 주장한 훈련 시간과 토큰 수치는 충분히 검증 가능한 수준이다. 논문에서 주장한 557만 달러의 비용은 모델 전체의 훈련 비용이 아니라 GPU 임대 시간 기준으로 계산된 값이다. 결론적으로, DeepSeek-V3가 14.8조 토큰을 2.788M GPU 시간으로 훈련했다는 주장은 현실적이며, 논문에서 제시된 모델 최적화와 병목현상 감소가 이를 뒷받침하고 있다.
음모론 검증 및 결론
신영증권 박상욱 연구원 등을 비롯한 음모론자들이 제기하는 "DeepSeek가 실제로는 H800 보다 성능이 높은 (중국에 수출이 제한된)H100 GPU를 이용해서 훈련을 했을것이다"는 주장은 신빙성이 떨어진다. DeepSeek 연구진은 H100 대비 인터커넥트 대역폭이 제한된 H800 클러스터의 병목현상을 보완하기 위해 여러 최적화 기법(fp8 훈련, load-balancing MoE, DualPipe 등)을 동원해서 이를 약 13% 줄인것으로 추정되는데, H100을 이용해서 훈련했었으면 이 정도의 최적화는 필요 없었을 가능성이 매우 높다.
DeepSeek는 논문을 통해 실현 불가능한 수준의 주장을 한게 아니다. 일부가 논문의 내용을 확대해석해서 "누구나 550만 달러가 있으면 GPT o1에 비견하는 모델을 두 달 만에 만들어낼 수 있다"는 잘못된 주장을 하고 있는것이 문제의 본질이다. OpenAI GPT o1이나 DeepSeek V3 수준의 모델을 만드려면 뛰어난 인력들의 광범위한 선행연구와 여러번의 모델 훈련이 필요하다. DeepSeek는 V3 모델의 가장 성공적인 훈련을 실행하는데 557만 달러가 들었다고 밝힌것이다.
전략적 대응 방안
음모론과 우려들이 가중되면서 DeepSeek V3의 발표가 AI 인프라 관련주인 엔비디아(NVDA)와 아리스타 네트웍스(ANET)등의 10~20%대 폭락이 일어났다. 해당 기업들의 투자자로서 우리는 어떻게 대응해야할까? 아니, 대응을 해야할까?

슈카의 "대응해야 하나?" 밈
우선 신뢰할 수 있는 정보를 토대로 보았을 때 DeepSeek가 V3 모델을 통해 상당한 수준의 효율화를 이루어낸것은 사실이라고 판단되나, 그 자체가 곧 AI 인프라에 대한 투자가 쓸모없다는 이야기는 아니다.
지난주 금요일 GPU를 세계에서 가장 많이 구매하는 기업 중 하나인 메타 플랫폼즈(META)는 올해 AI 인프라를 확대하기 위해 600억 달러 이상의 설비투자를 집행하겠다고 예고했으며, 이는 2024년 대비 50% 늘어난 수준이다. 마이크로소프트 CEO 사티야 나델라 또한 올해 800억 달러를 지출하겠다고 밝혔다.
이미 미국 빅테크 기업들은 모델 경량화와 최적화에 큰 관심을 가지고 있으며, 관련 기술도 축적하고 있다. 그럼에도 불구하고 계속해서 AI 인프라에 대한 투자를 확대하는것은 그들이 이 시장을 장기적으로 보고, 궁극적으로 더 뛰어난 AI 모델을 개발하는데 우선 집중하겠다는것을 뜻한다.
또한 DeepSeek가 V3 모델의 가장 성공적인 훈련을 실행하는데 557만 달러가 들었지만, 해당 훈련까지 도달하기까지 엄청난 수준의 연구와 훈련에 사용된 것보다 훨씬 더 강력한 GPU 클러스터가 필요했을것 이고, 이는 최소 수천억원의 전제 비용을 의미한다.


- NEW경제사모펀드의 자금 수요, 공급을 한참 웃돌다Private Equity’s Fundraising Demands Far Outstrip SupplyInstitutional Investor지의 Michell Celarier는:베인앤컴퍼니(Bain & Co.)에 따르면 현재 약 18,000개의 사모자본 펀드가 자금을 모집 중이며, 그 목표 금액은 총 3.3조 달러에 달한다. 문제는, 일반운용사(GP)들이 3달러를 요청할 때 투자자들이 실제로 배정할 수 있는 자금은 1달러에 불과하다는 점이다. 베인은 이를 “수요 공급의 불균형 문제”라고 표현했다.기존 펀드들로부터의 현금 분배 부족 또한 상황을 악화시키면서, 일부 투자자들이 자신들의 투자금에 손실(헤어컷)을 감수하는 데까지 이르고 있다. 베인에 따르면, “LP(유한책임출자자)들은 점점 더 지분 일부 매각이나 소수 지분 매각 방식에 만족하지 못하고 있으며, 시장 상황이 어려움에도 불구하고 완전한 회수를 요구하고 있다.” 실제로 ILPA(기관 유한출자자 협회)가 진행한 웨비나 설문조사에서어웨어・2031
- 멤버십 전용NEW경제배당수익률 9.2% : 글로벌 화학 대기업 LYB 집중 해부안녕하세요, 카레라입니다.화학 업종이 몇 년째 안 좋은 퍼포먼스를 보여주고 있지만 코로나-19 이후 오히려 공격적으로 배당을 늘려서 지금은 연 9%가 넘는 배당을 분기마다 주는 화학 대기업이 있다?오늘 소개할 종목은 바로 LyondellBasell Industries(LYB)입니다. 이 친구는 배당만큼은 이를 빠득빠득 갈면서 잘 주는 편입니다. 최근 몇 년간 분기배당을 계속 늘렸고 지금은 1주에 1.37달러씩 줍니다. 주가가 대략 60달러 언저리라 현 시점 배당수익률이 9.1%가 넘습니다. 화학 업종이라 경기 사이클을 상당히 타서 주가 등락이 제법 크긴 한데 싸게 담아두고 배당으로 수익률을 버티다 보면 사이클 반등 타이밍에 이득을 볼 수 있는 구조입니다.LYB가 어떤 기업이고 왜 이렇게 배당을 세게 주는지, 그리고 앞으로도 계속 믿고 들고갈 만한지 확실히 뜯어보도록 하겠습니다.고건・50196
- 멤버십 전용NEW경제존슨콘트롤즈인터내셔널(JCI) 리서치기업 개요존슨콘트롤즈인터내셔널(JCI)은 1885년 세계 최초의 실내 전기 온도 조절기 발명을 시작으로 140년간 빌딩 기술 분야를 선도해 온 글로벌 리더이다.동사는 난방, 환기, 공조(HVAC), 빌딩 제어, 소방 및 보안 시스템에 이르는 포괄적인 포트폴리오를 기반으로 전 세계 빌딩의 설계, 건설, 운영 및 유지보수에 핵심적인 역할을 수행한다. 최근 동사는 수익성이 상대적으로 낮은 주거용 및 경상업용 사업부의 매각을 결정, 이를 통해 확보된 자원과 역량을 수익성 높은 상업용 및 산업용 시장에 집중하는 전략적 선택을 단행했다. 이는 데이터센터, 헬스케어, 첨단 제조 시설 등 미래 성장 산업의 핵심 인프라 파트너로서의 입지를 강화하기 위함이다.현재 JCI는 단순 하드웨어 제조사를 넘어, AI와 IoT 기술을 집약한 디지털 플랫폼 'OpenBlue'를 통해 빌딩의 자율 운영과 에너지 최적화를 구현하는 통합 솔루션 기업으로의 진화를 가속화하고 있다.산업 개요스마트 빌딩 산업은 현재 거대한어웨어・20254