L'intelligenza artificiale sorprendentemente economico di Deepseek sfida i giganti del settore. Vantando un'autointroduzione di "Chiedi qualsiasi cosa, ottieni una risposta sorprendente", l'IA di Deepseek è diventata una grande concorrente del mercato, causando persino calo significativi del prezzo delle azioni di Nvidia. Il suo successo deriva da una combinazione unica di tecnologia innovativa e da investimenti sostanziali, sebbene non divulgati.
Immagine: Ensigame.com
I progressi tecnologici chiave includono:
- Previsione multi-token (MTP): prevede contemporaneamente più parole, aumentando l'accuratezza ed efficienza.
- Miscela di esperti (MOE): impiega 256 reti neurali, attivando otto per ogni token, accelerando la formazione e migliorando le prestazioni.
- Attenzione latente multi-testa (MLA): estrae ripetutamente informazioni chiave dai frammenti di testo, minimizzando il rischio di trascurare i dettagli cruciali.
DeepSeek inizialmente ha rivendicato un costo di allenamento di soli 6 milioni di dollari per il suo modello DeepSeek V3 utilizzando 2048 GPU. Tuttavia, la semianalisi ha rivelato un'infrastruttura molto più ampia, che comprende circa 50.000 GPU di nvidia Hopper (tra cui unità H800, H100 e H20) diffuse su più data center. Questa infrastruttura rappresenta un investimento di server totale di circa $ 1,6 miliardi, con spese operative stimate in $ 944 milioni.
Immagine: Ensigame.com
DeepSeek, una consociata di High-Flyer, un hedge fund cinese, possiede i suoi data center, fornendo controllo sull'ottimizzazione e un'implementazione più rapida dell'innovazione. Il suo stato autofinanziato migliora l'agilità. La società attira i migliori talenti, con alcuni ricercatori che guadagnano oltre $ 1,3 milioni all'anno, principalmente dalle università cinesi.
La cifra iniziale di $ 6 milioni probabilmente riflette solo i costi di pre-allenamento GPU, escluse la ricerca, la raffinatezza, l'elaborazione dei dati e le spese complessive di infrastruttura. L'investimento totale per lo sviluppo dell'intelligenza artificiale di Deepseek supera $ 500 milioni. La sua struttura semplificata consente un'innovazione efficiente rispetto ai concorrenti più grandi e burocratici.
Immagine: Ensigame.com
Mentre il successo di Deepseek mostra il potenziale competitivo di una società di intelligenza artificiale indipendente ben finanziata, l'affermazione del "bilancio rivoluzionario" è fuorviante. Il loro successo è attribuito a investimenti sostanziali, scoperte tecnologiche e una squadra forte. Tuttavia, anche con queste spese significative, i costi di Deepseek rimangono notevolmente inferiori rispetto ai concorrenti. Ad esempio, il modello R1 di Deepseek è costato $ 5 milioni per l'allenamento, rispetto ai $ 100 milioni di CHATGPT4.
Immagine: Ensigame.com