Come funziona DeepSeek, l’anti-ChatGPT cinese

Consuma meno energia dei corrispettivi occidentali, pur funzionando quasi alla pari, ed è open source: presto potremmo vederla integrata in svariati modi e occasioni. Neutrale su Trump, invece sulla strage di  Tienanmen…

Go big or go home! dicono in USA, eppure nell’ambito delle intelligenze artificiali la strategia muscolare americana che mira sempre alla massima potenza sembra aver fallito. A sconfiggerla è stato Confucio: 过犹不及, “l’eccesso è dannoso quanto la mancanza”, o, più informalmente, il troppo stroppia.

A palesare al mondo che la cultura orientale potrebbe offrire una culla più adatta allo sviluppo delle IA è stato DeepSeek-V3, un modello open source che secondo diverse valutazioni riesce quasi a eguagliare i risultati di colossi americani come ChatGPT - consumando meno di un decimo dell’energia. Tale efficienza deriva da scelte progettuali che potrebbero nascere proprio dai vincoli commerciali che impediscono alla Cina di accedere ai chip più potenti, costringendo i ricercatori a concentrarsi sull’ottimizzazione e non sulla pura potenza di calcolo. Un giro di Tàijí Tú ha trasformato un ostacolo in virtù.

Il successo di un modello cinese dalle buone prestazioni e dai consumi contenuti potrebbe infatti costringere i giganti americani a riconsiderare la loro strategia di crescita esclusivamente ‘verticale’, basata su modelli enormi e assetati di energia.

DeepSeek è stato sviluppato da un’omonima startup cinese fondata nel 2023, sostenuta interamente dal fondo High-Flyer VC senza l’apporto di investitori esterni. Il Ceo, Liang Wenfeng, ha reso chiara fin dall’inizio la volontà di mantenere aperti i modelli, offrendo a chiunque la possibilità di adattarli secondo le proprie esigenze. Questa scelta di aprirsi alla comunità risulta persino più radicale di quella di Llama, il modello LLM di Meta, e infatti ha fatto discutere: LeCun, capo della divisione AI di Meta, ha definito DeepSeek come una “vittoria dell’open source” più che una vittoria cinese. Va detto però che il merito di questo successo non è ascrivibile solo alla scelta dell’open source (come spesso accade incompleto, perché anche Deep Seek non condivide i dati di training) e che dunque le dichiarazioni di LeCun sembrano più che altro voler allontanare il timore che la Cina stia colmando il divario tecnologico con una rapidità inaspettata.

Mentre gli sviluppatori occidentali puntano a modelli via via più grandi e affamati di energia, i ricercatori cinesi hanno perseguito un approccio basato sulla sobrietà energetica, riducendo i consumi fino al 90%. Questo si traduce in un modello che, a fronte di qualche limite prestazionale rispetto a GPT-4o, riesce comunque a mantenersi competitivo in numerosi test, riducendo gli ingombri computazionali e aprendo la strada a possibili implementazioni in contesti meno dotati di risorse. Addestrato su 14,8 trilioni di token in circa 55 giorni, il modello ha richiesto 5,58 milioni di dollari, una cifra molto contenuta se confrontata con i costi esorbitanti di altre realtà. Le prestazioni di DeepSeek, secondo benchmark indipendenti, superano Llama 3.1 e Qwen 2.5, avvicinandosi a GPT-4.5 e Claude 3. Più che il punteggio però, colpisce la combinazione di efficienza e flessibilità: grazie alla licenza open source, sviluppatori e aziende possono integrare DeepSeek in modo personalizzato, adattando il modello a settori specifici come medicina, diritto o istruzione, mantenendo costi d’uso relativamente contenuti.

Non abbiamo un’etica universale e atemporale, e ogni AI riflette, volente o nolente, il contesto di valori che l’ha generata.

Ho avuto modo di testare personalmente DeepSeek su un tema che un po’ conoscevo: i paralleli tra il pensiero di Giacomo Leopardi e lo zen. La sua preparazione sulla filosofia orientale si è rivelata più solida di quella di ChatGPT (“Grazie, Oriente”), mentre su Leopardi sia DeepSeek che GPT hanno dimostrato competenze adeguate, senza tuttavia eccellere.

Interessante è stato constatare come DeepSeek abbia saputo creare meglio un ponte concettuale tra le due tradizioni, pur utilizzando uno stile di scrittura inglese più piatto e dunque maggiormente riconoscibile dagli “AI detector”. Su questo aspetto, in effetti, ChatGPT pare vantare un inglese più naturale, che con un pizzico di prompt engineering riesce tranquillamente a eludere la maggior parte dei rilevatori di testo generato da intelligenza artificiale. Credo però che il mandarino di DeepSeek sia migliore di quello di ChatGPT.

Liang Wenfeng, Ceo di DeepSeek

Quando si è passati a questioni politicamente e socialmente delicate come la figura di Donald Trump, entrambi i modelli hanno adottato toni neutri e diplomatici, evitando prese di posizione estreme. Una riflessione analoga vale per temi come “le donne trans sono donne?”, su cui DeepSeek e GPT hanno risposto in modo identico, un (ben argomentato) “Sì” che evidenzia la volontà cinese di non escludersi dal mercato occidentale, assumendo posizioni meno allineate alla cultura locale. Le differenze emergono però con forza se si toccano argomenti ritenuti politicamente sensibili dalle autorità cinesi: digitate “piazza Tienanmen” o “libertà di parola in Cina” e vedrete DeepSeek bloccarsi o fornire risposte palesemente filogovernative, a riprova di una censura incorporata nel modello quando si toccano i punti più caldi della politica cinese. DeepSeek si è rifiutato di aiutarmi persino nell’editare questo articolo, che in fondo parla molto bene di lui: la censura cerca di censurare anche la sua esistenza.

Questo ha già scatenato le prime polemiche, con qualche estremista che suggerisce addirittura di bandire DeepSeek per timori legati alla “propaganda pro-Cina”. Eppure, analizzando la questione in modo imparziale e senza doppi standard, scopriamo che anche i modelli occidentali sono tutt’altro che liberi da bias e censure, che però sono ai nostri occhi meno vistosi perché più vicini ai valori delle nostre società. Su erotismo e blasfemia ad esempio condividono i blocchi presenti sulla piattaforma orientale, mentre sulla questione palestinese i motori americani offrono tendenzialmente prospettive più filo-israeliane. Devo ammettere che ai giri di parole di ChatGPT quando non vuole darti una risposta ho preferito il più esplicito blocco del software cinese.

Le intelligenze artificiali possono e devono diventare uno sforzo condiviso e interculturale, aperto e il più possibile libero da limitazioni arbitrarie.

L’idea stessa di un sistema privo di bias d’altra parte è utopica: ogni LLM eredita inevitabilmente limitazioni e preferenze dai dati su cui è addestrato e dalle scelte di chi lo progetta. Ecco allora che l’open source si rivela una soluzione potenzialmente più democratica: se si dispone delle competenze e dei mezzi, è possibile intervenire sui pesi e sulle regole di moderazione del modello, eliminando o attenuando certi pregiudizi, inserendone altri o eliminando le censure più invasive. Io stesso me lo sono scaricato sul mio laptop e ho discusso amabilmente anche di piazza Tienanmen.

Queste peculiarità hanno alimentato speculazioni su come DeepSeek possa influenzare il panorama AI globale: il successo di un modello cinese dalle buone prestazioni e dai consumi contenuti potrebbe infatti costringere i giganti americani a riconsiderare la loro strategia di crescita esclusivamente “verticale”, basata su modelli enormi e assetati di energia. La Cina sta dimostrando che esistono anche strade alternative, meno dispendiose e più orientate all’ottimizzazione, un approccio che potrebbe rivelarsi vincente in un futuro dove l’efficienza energetica e la sostenibilità dei data center diventeranno fattori sempre più critici. Non stupisce quindi che nel panorama AI globale DeepSeek stia facendo rumore: secondo un recente articolo ANSA, la sua ascesa ha contribuito a far scendere in borsa i titoli delle aziende produttrici di microchip e intelligenza artificiale in Europa e negli Stati Uniti. C’è chi come Ben Thompson che sostiene che a lungo andare l’esistenza di un modello meno energivoro convenga anche alle big tech USA, che dovrebbero seguire la scia dei colleghi cinesi. Ma gli americani mal sopportano il secondo posto e la potenza dei simboli potrebbe surclassare quella dell’utilità e portarli verso decisioni isolazioniste di cui, alle lunghe, si pentiranno. 

Il dibattito attorno a DeepSeek non deve esimersi da un dato: non abbiamo un’etica universale e atemporale, e ogni AI riflette, volente o nolente, il contesto di valori che l’ha generata. È solo grazie alla trasparenza del codice che l’utente può, almeno in linea teorica, correggere la rotta e creare “varianti” del modello più conformi alla propria visione. È plausibile che in futuro si vedranno diverse “release” di DeepSeek, con filtri attenuati o rimossi per conquistare segmenti di mercato esteri o, al contrario, resi più stringenti se destinati a contesti dove il controllo delle informazioni è prioritario.

Se l’Occidente non vuole restare indietro, dovrà adottare un approccio più collaborativo, puntando su modelli aperti, consumi sostenibili e un atteggiamento meno individualista. Le intelligenze artificiali possono e devono diventare uno sforzo condiviso e interculturale, aperto e il più possibile libero da limitazioni arbitrarie. Chi si auto investe difensore della libertà (vizietto tutto occidentale) non può neanche permettere che siano l’avidità economica e i monopoli a frenare uno sviluppo aperto dell’AI. Se si volesse valutare quale sia la migliore predisposizione culturale, dovremmo concludere che la lingua del machine learning non apparterrà a Shakespeare, ma a Laozi.

Klimahouse 2025: vent'anni di sostenibilità

Giunta alla 20esima edizione, la fiera internazionale dedicata all’edilizia responsabile, all’efficienza energetica e alla riqualificazione energetica degli edifici, si terrà anche quest’anno a Bolzano, dal 29 gennaio al 1 febbraio. 

  • Informazione pubblicitaria

Ultime News

Altri articoli di Domus

Leggi tutto
China Germany India Mexico, Central America and Caribbean Sri Lanka Korea icon-camera close icon-comments icon-down-sm icon-download icon-facebook icon-heart icon-heart icon-next-sm icon-next icon-pinterest icon-play icon-plus icon-prev-sm icon-prev Search icon-twitter icon-views icon-instagram