
In data 20 gennaio 2025, la società cinese DeepSeek ha rilasciato DeepSeek-R1, un innovativo modello di intelligenza artificiale che ha rapidamente scalato le classifiche dell’App Store di Apple, raggiungendo il primo posto e lasciandosi addirittura alle spalle ChatGPT. Ma cos’è DeepSeek e cosa lo distingue rispetto agli altri modelli sul mercato?
Origini e obiettivi di DeepSeek.
Il progetto DeepSeek è stato avviato nel 2023 da Liang Wenfeng, co-fondatore di High-Flyer, azienda specializzata in analisi dei dati finanziari e attualmente unico investitore di DeepSeek, con l’ambizioso obiettivo di sviluppare una Intelligenza Artificiale Generale (AGI) capace di superare le capacità umane in numerosi ambiti.
Per costruire il team tecnico, sono stati reclutati brillanti neolaureati provenienti da prestigiose università cinesi. Da questa iniziativa è nato DeepSeek, un sistema avanzato di intelligenza artificiale basato su modelli di linguaggio di grandi dimensioni (LLM) open source, tra cui DeepSeek-R1 e DeepSeek-R1-Zero.
Cosa rende DeepSeek-R1 diverso dagli altri modelli?
Rispetto ad altre IA, come ad esempio ChatGPT, DeepSeek-R1 si distingue per tre aspetti fondamentali:
- Metodo di apprendimento innovativo.
A differenza di molte IA, DeepSeek-R1 si basa esclusivamente su apprendimento per rinforzo, dove l’algoritmo migliora attraverso l’interazione con l’ambiente, senza l’uso dell’apprendimento supervisionato (che prevede l’addestramento con set di dati pre-etichettati). Questo approccio consente al modello di sviluppare un ragionamento più avanzato e una maggiore capacità di adattamento a nuove situazioni. - Approccio open source.
Il codice di DeepSeek-R1 è completamente accessibile, consentendo a sviluppatori e ricercatori di analizzarlo e migliorarlo liberamente. Questo lo differenzia da modelli proprietari come quelli di Google e favorisce la collaborazione nella comunità scientifica, rendendo la tecnologia più accessibile anche a chi dispone di risorse limitate. - Efficienza nell’uso dell’hardware.
Secondo il New York Times, DeepSeek è riuscito ad addestrare il suo modello utilizzando solo 2.000 chip Nvidia, mentre altri sistemi di IA ne richiedono fino a 16.000. Questa efficienza ha permesso alla startup di creare modelli competitivi, combinando GPU avanzate con strategie di risparmio energetico per ottimizzare le prestazioni.
Per affrontare la carenza di GPU, gli ingegneri di DeepSeek hanno introdotto innovazioni nell’architettura del modello, come schemi di comunicazione personalizzati tra i chip e tecniche per ridurre l’uso della memoria. Queste soluzioni hanno migliorato le prestazioni riducendo il consumo di risorse informatiche.

DeepSeek in Italia: lo stop del Garante della Privacy.
In Italia, il Garante della Privacy ha imposto restrizioni immediate sul trattamento dei dati degli utenti italiani da parte delle aziende cinesi che gestiscono DeepSeek. Questa decisione è stata presa dopo che le risposte fornite dalle società alle richieste di informazioni dell'Autorità sono state giudicate non sufficienti.
Di conseguenza, dal 28 gennaio 2025, l’applicazione mobile di DeepSeek non è più disponibile sugli store di Apple e Google e anche la versione web è stata bloccata nel nostro Paese.
Il futuro di DeepSeek nel panorama dell’IA.
DeepSeek rappresenta un’importante innovazione nel settore dell’intelligenza artificiale, dimostrando come open source ed efficienza tecnologica possano competere con i colossi del settore.
Se l’azienda continuerà a sviluppare nuove soluzioni e a risolvere le problematiche legate alla privacy, potrebbe affermarsi come un concorrente di rilievo, contribuendo a definire il futuro dell’IA con modelli sempre più sostenibili ed efficienti.