루머 : DeepSeek R1 추론 기능은 화웨이 910C 칩셋 기반으로 구동중

출처 | https://wccftech.com/deepseek-r1-is-repo...c-ai-chip/ |
---|
최근 AI 시장에 큰 충격을 가져온 DeepSeek에 대해 흥미로운 루머가 나왔습니다.
여기에 따르면, 딥시크가 최근 공개한 오픈소스 LLM인 DeepSeek-R1의 경우 모델을 훈련하기 위해 기술규제가 적용된 엔비디아의 수출 전용 칩셋인 H800을 사용했지만, 현재 서버에서 R1의 추론 모델을 구동하고 있는 것은 화웨이에서 제조한 Ascend 910C 칩셋이라고 합니다.
Ascend 910C는 미국의 첨단기술 수출 규제로 인해 H100 같은 프로세서를 사용할 수 없게 된 중국시장을 타겟으로 화웨이가 개발한 제품입니다. 910C는 이제 막 출시된 제품으로 정확한 성능은 알려져 있지 않지만, 소식을 전한 Alexander Doria는 이 제품의 성능이 엔비디아 제품보다 떨어지고 AI 모델 훈련용으로는 아직 적합하지 않지만, 추론 모델을 구동하는 데에 최적화되어 출시된 제품이며 딥시크에서는 차기 V4 모델은 910C로 트레이닝 시키는 것을 검토중이라고 합니다.
또 현재 화웨이에서는 엔비디아 블랙웰 B200 급의 성능을 목표로 한 Ascend 920C 칩셋을 개발중이라고 말했습니다.
Comment 3
Comment Write

DeepSeek R1은 오픈소스로 풀었기 때문에 성능 허풍을 칠 수가 없습니다. 램 500기가 넘게 박을 수 있는 수 억짜리 서버가 있으면 개나소나 다운로드해서 벤치마크 돌릴 수 있거든요. 심지어 경량화 버전은 200만원짜리 컴퓨터로도 돌릴 수 있어요..
