Deepseek: l’impatto sul settore tech
Una società cinese di intelligenza artificiale, DeepSeek, ha recentemente annunciato di aver sviluppato un modello linguistico open source di grandi dimensioni, relativamente poco costoso da addestrare e che richiede meno energia e potenza di elaborazione rispetto alle principali applicazioni. Il risultato è stato un significativo sell off dei titoli tecnologici statunitensi, in particolare delle società di semiconduttori specializzate in chip per applicazioni AI.DeepSeek è un laboratorio cinese di IA di alto livello, anche se relativamente piccolo. Il suo team è autore di numerosi articoli di ricerca, possiede una vasta esperienza con le GPU (unità di elaborazione grafica) ed è stato scorporato da un hedge fund quantitativo cinese. Ha attirato l’attenzione lanciando un modello avanzato di linguaggio di grandi dimensioni (LLM) che è stato presumibilmente addestrato a un costo sostanzialmente inferiore rispetto a modelli simili esistenti.
Il 25 dicembre 2024, DeepSeek ha rilasciato il suo modello V3 come software open source. Nel loro documento, hanno dichiarato che il costo finale dell’addestramento per il modello è stato di soli 5,6 milioni di dollari, ma hanno affermato che il V3 dimostra prestazioni paragonabili a quelle del principale LLM, il GPT-4. Il modello V3 è simile ai modelli esistenti e offre la........
© Wall Street Italia
