Kinijos bendrovė „DeepSeek“ vėl įsilaužta Dirbtinio intelekto lenktynėse oficialiai pristatyti du pažangūs samprotavimo modeliai: „DeepSeek-V3.2“ ir didesnės talpos jo variantas „DeepSeek-V3.2-Speciale“. Abi sistemos pristatomos kaip prieš kelias savaites pristatyto eksperimentinio modelio kita iteracija ir siekia suderinti sudėtingą samprotavimą su autonominiu veiksmų atlikimu.
Kontekste, kurį žymi Puslaidininkių prekybos apribojimai ir arši konkurencija su Jungtinėmis ValstijomisHangdžou įsikūrusi įmonė teigia, kad šie modeliai prilygsta tokiems etalonams kaip „OpenAI“ GPT-5 ir „Google Gemini-3.0-Pro“ keliuose viešuose samprotavimo testuose. Šis žingsnis sustiprina Kinijos puolimą didelių atvirų ir multimodalinių modelių srityje – sektoriuje, kurį Europa stebi vis labiau dėl jo poveikio pramonės ir technologijų reguliavimui.
„DeepSeek-V3.2“ ir „Speciale“: samprotavimai GPT-5 ir Dvynių lygmenyje
Remiantis pačios bendrovės išleista technine dokumentacija, „DeepSeek-V3.2“ yra sumanytas kaip bendrosios paskirties modelis, orientuotas į samprotavimus, galintis prilygti GPT-5 našumui skirtingose gairės standartas. Šie testai apima logikos, abstrakcijos ir sudėtingų problemų sprendimo užduotis, kurioms reikalingi gebėjimai, panašūs į nuoseklų žmogaus samprotavimą.
Variantas „DeepSeek-V3.2-Speciale“ yra orientuotas į sudėtingi matematiniai skaičiavimai ir ilgalaikį samprotavimą. „DeepSeek“ teigia, kad šis modelis ne tik priartėja prie „Gemini-3.0-Pro“ našumo, bet tam tikrais atvejais netgi jį lenkia, keliuose kognityvinių gebėjimų testuose užimdamas aukštesnį nei GPT-5 rezultatą. Kaip patvirtinamąjį įrodymą bendrovė nurodo aukso medalius, gautus Tarptautinėje matematikos olimpiadoje ir Tarptautinėje informatikos olimpiadoje, kurie buvo naudojami kaip etalonas vertinant dirbtinio intelekto gebėjimą spręsti labai struktūrizuotas problemas.
Įvairiose Kinijos ir tarptautinės žiniasklaidos platinamose ataskaitose sutampa, kad „DeepSeek“ siekia šiuos modelius pozicionuoti kaip patikimos alternatyvos į dideles, uždaras Silicio slėnio sistemas. Nors palyginimai pagrįsti pasirinktais rodikliais ir laboratoriniais tyrimais, žinia aiški: Kinijos atviri modeliai Jie gali varžytis su Amerikos lyderiais specializuotose samprotavimo užduotyse.
Techniniu požiūriu bendrovė pabrėžia, kad V3.2 šeima apjungia skaičiavimo efektyvumas pasižymi dideliu našumu atliekant autonomines agentų užduotis. Tai yra, jie sukurti ne tik atsakyti į klausimus, bet ir planuoti, spręsti problemas bei vykdyti sudėtingas veiksmų sekas, sunaudojant santykinai mažai išteklių.

Minčių integravimas naudojant įrankius
Vienas ryškiausių reklamos elementų yra tas, kad „DeepSeek-V3.2“ automatiškai integruoja samprotavimus su įrankių naudojimuTai apima viską – nuo paieškos sistemų iki skaičiuotuvų, kodo vykdytojų ar iškvietimų į išorines API – visa tai įterpta į tą patį mąstymo ciklą.
Bendrovė paaiškina, kad sistema gali veikti tiek... „mąstymo būdas“ kaip standartinis režimasįtraukiant arba neįskaitant aiškių samprotavimo grandinių, jei reikia. Šio proceso metu modelis nusprendžia, kada konsultuotis su įrankiu, kaip interpretuoti jo rezultatą ir kaip jį integruoti į galutinį atsakymą, o tai reiškia išsamesnius ir prie konteksto pritaikytus sprendimus tokiose srityse kaip duomenų analizė, darbo eigos automatizavimas ar užklausos realiuoju laiku.
Šis derinys iš struktūrizuotas samprotavimas ir savarankiški veiksmai Tai atitinka dabartinę dirbtinio intelekto agentų tendenciją: programas, galinčias veikti gana savarankiškai, kad pasiektų tikslų, sąveikauti su savo skaitmenine aplinka, vertinti naują informaciją ir keisti savo sprendimus be nuolatinės priežiūros.
„DeepSeek“ taip pat teigia turintis sukūrė naują mokymo metodą Specialiai šiems agentams sukurtas metodas skirtas išmokyti juos ne tik reaguoti, bet ir nuspręsti, kokių veiksmų imtis norint atlikti užduotį. Šis metodas skirtas paruošti modelius sudėtingiems naudojimo atvejams – nuo pažangių verslo asistentų iki mokslinių tyrimų palaikymo sistemų.
Išsklaidytas dėmesys ir susitelkimas į skaičiavimo efektyvumą
Techninė naujos modelių šeimos širdis priklauso nuo patentuoto mechanizmo, vadinamo „DeepSeek“ retas dėmesysarba išsklaidytas dėmesys. Ši architektūra modifikuoja modelio konteksto apdorojimo būdą, sumažindama vienu metu vertinamos informacijos kiekį neprarandant elementų, kurie yra tikrai svarbūs užduočiai.
Praktiškai ši technika žymiai sumažina skaičiavimo sudėtingumąTai yra labai svarbus aspektas modeliuose su plačiais konteksto langais, kur kiekvienas naujas žetonas smarkiai padidina skaičiavimo sąnaudas. „DeepSeek“ žada pasiūlyti plačius kontekstus ir gilų samprotavimą su mažesnėmis energijos sąnaudomis – šis veiksnys gali būti lemiamas Europos įmonėms ir duomenų centrams, susirūpinusiems dėl sąnaudų ir poveikio aplinkai.
Dizainas atitinka platesnę pramonės tendenciją: teikia pirmenybę efektyvumui tiek pat, kiek ir neapdorotai energijaiStaigiai augant mokymo ir diegimo išlaidoms, modeliai, kurie sugeba išlaikyti gerą našumo lygį, kartu sumažindami GPU ir energijos sąnaudas, gali būti labai patrauklūs organizacijoms, norinčioms integruoti pažangų dirbtinį intelektą į savo procesus nepadaugindamos savo biudžeto.
Tačiau „DeepSeek“ pripažįsta, kad Jų modeliai vis dar neatitinka pagrindinių Amerikos standartų dviejose srityse: simbolinio efektyvumo ir pasaulinio masto žinių.Bendrovė nurodo skaičiavimo pajėgumų apribojimus parengiamųjų mokymų metu kaip vieną iš veiksnių, trukdančių jiems žengti toliau, o ši problema tiesiogiai susijusi su prieigos prie pažangios įrangos apribojimais.
Sintetiniai duomenys, agentai ir atvirojo kodo projektai
Kad išmokytų šiuos modelius mąstyti ir veikti, įmonė naudojo didžiulis sintetinių duomenų rinkinys, skirtas dirbtinio intelekto agentamsRemiantis paskelbtais duomenimis, mokymo rinkinį sudaro daugiau nei 1.800 imituojamų aplinkų ir apie 85 000 sudėtingų instrukcijų, skirtų atkurti sąveikas, artimas realaus pasaulio sąveikai.
Šio tipo duomenys leidžia sistemai Praktikuokite sprendimų sekas, įrankių naudojimą ir grandininių užduočių sprendimą kontroliuojamoje, bet įvairioje aplinkoje, mažinant priklausomybę nuo jautrių ar nuosavybės teise saugomų duomenų. Europoje, kur duomenų ir privatumo reglamentai yra ypač griežti, šie sintetiniai metodai gali būti aktualūs vertinant užsienio modelių diegimą.
Laikydamasi savo strategijos, „DeepSeek“ pasirinko Išleisti V3.2 modelį atvirose platformose, tokiose kaip „Hugging Face“ ir „ModelScope“.Tai palengvina prieigą tyrėjams, nepriklausomiems kūrėjams ir įmonėms, norinčioms eksperimentuoti su sistema arba pritaikyti ją savo naudojimo atvejams. Šis atvirumas prieštarauja griežtesnei kai kurių Vakarų žaidėjų politikai ir gali paskatinti jos pritaikymą Europos techninėse bendruomenėse, orientuotose į nemokamą programinę įrangą.
Kita vertus, specialioji versija... Iš pradžių jis bus siūlomas per komercinę API sąsają.Atsižvelgdama į didesnes skaičiavimo sąnaudas ir žetonų sunaudojimą, įmonė bando suderinti savo įsipareigojimą atvirojo kodo programoms su poreikiu monetizuoti savo aukščiausios klasės modelius, o tai taip pat gali turėti įtakos tam, kaip Europos įmonės gali naudotis pažangiausiomis jos galimybėmis.
Klestinti Kinijos ekosistema ir reguliavimo įtampa
V3.2 šeimos pristatymas vyksta tuo metu, kai Kinijos dirbtinio intelekto pramonė bando įtvirtinti savo lyderystęypač atviruose ir multimodaliniuose modeliuose. „DeepSeek“, įkurta 2023 m., specializuojasi dideliuose lingvistiniuose ir teksto vaizdavimo modeliuose, prisijungdama prie ekosistemos, kurioje jau yra tokie milžinai kaip „Baidu“, „Tencent“ ir „Alibaba“ pokalbių robotas.
Pastarosiomis savaitėmis bendrovė taip pat pristatė „DeepSeek“ OCRMultimodalinė sistema tekstui glaudinti ir apdoroti, pagrįsta regimuoju suvokimu optimizuota veikti su mažiau skaičiavimo išteklių ir išleista kaip atvirojo kodo. Be to, jos V3.1 modelis išgarsėjo po to, kai atliko automatizuotą investavimo eksperimentą su GPT-5 ir „Gemini 2.5 Pro“ – tai pavyzdys, kaip bendrovė naudoja viešas demonstracijas, kad išbandytų savo jėgas prieš Vakarų žaidėjus.
Įvairios Azijos žiniasklaidoje paskelbtos analizės rodo, kad Silicio slėnis pradeda atidžiau stebėti konkurentus pagal kainą ir našumą.Jos abi konkuruoja kainos ir našumo požiūriu, ir yra potencialios partnerės konkrečiose tyrimų srityse. Tačiau geopolitinė įtampa ir prekybos apribojimai apsunkina didelio masto tiesioginio bendradarbiavimo galimybes.
Tuo pačiu metu tarptautiniai ekspertai atkreipia dėmesį, kad griežtos cenzūros ir turinio kontrolės taisyklės Dabartiniai Kinijos reglamentai gali trukdyti šių modelių priėmimui Vakarų rinkose. Poreikis filtruoti tam tikras temas arba laikytis vidaus politinių gairių gali prieštarauti Europos reguliavimo ir kultūriniams lūkesčiams, kur diskusijos daugiausia dėmesio skiria skaidrumui, neutralumui ir pagarbai pagrindinėms teisėms.
Galimas poveikis Europoje ir tolesni žingsniai
Europos įmonėms ir tyrimų centrams, Tokių modelių kaip „DeepSeek-V3.2“ atsiradimas atveria daugybę papildomų galimybių JAV tiekėjų pasiūlymams. Dėmesys efektyvumui ir atvirojo kodo programoms gali tikti organizacijoms, norinčioms eksperimentuoti su didelio našumo sistemomis, nebūdamos prisirišusios prie vienos technologijų ekosistemos.
V3.2 prieinamumas atvirose saugyklose palengvina Europos komandos gali audituoti, pritaikyti ir, jei reikia, integruoti modelį patentuotuose sprendimuose – nuo įmonių asistentų iki pagalbinių įrankių tokiuose sektoriuose kaip švietimas, sveikatos apsauga ir finansai. Tačiau galima priklausomybė nuo išorinių API, siekiant pasiekti „Speciale“ variantą, kelia klausimų dėl technologinio suvereniteto ir duomenų apsaugos.
Tuo pačiu metu Europos Sąjunga tęsia savo 2023 m. dirbtinio intelekto reguliavimo sistemaDėl to didelės rizikos sistemų teikėjai turės laikytis griežtų skaidrumo, saugumo ir valdymo reikalavimų. Bet koks užsienio modelių diegimas, įskaitant „DeepSeek“, turės prisitaikyti prie šių taisyklių, jei norės veikti reguliuojamuose sektoriuose.
Pati bendrovė pripažįsta, kad vis dar Reikia tobulinti bendrąsias žinias ir žetonų efektyvumą.Tai du svarbūs veiksniai didelio masto taikymuose. Jų veiksmų planas apima skaičiavimo pajėgumų plėtrą ir architektūros bei mokymo duomenų tobulinimą, kartu išlaikant įsipareigojimą kurti agentus, gebančius derinti samprotavimus ir autonominius veiksmus.
Su šiais naujais modeliais „DeepSeek“ pozicionuoja save kaip vienas aktyviausių žaidėjų Kinijos atvirojo kodo dirbtinio intelekto srityjeAutomatizuoto mąstymo ir skaičiavimo efektyvumo ribų peržengimas tarptautinės technologinės konkurencijos kontekste. Europai tai dar viena detalė ir taip sudėtingoje šachmatų lentoje, kurioje sprendimai dėl to, kokius modelius priimti, kaip juos reguliuoti ir su kuo bendradarbiauti, turės vis didesnę įtaką žemyno konkurencingumui ir skaitmeninei autonomijai.