O čom to hovorí, že všetci hovoria?

Feb 21, 2025 Zanechajte správu

Deepseek, ktorého celé meno je „Hangzhou Deepseek Artificial Intelligence Basic Technology Research Co., Ltd.“ (ďalej, označované ako Čína Deepseek), založil v júli 2023 kvantitatívny gigant Huanfang Kvantitatívny gigant Huanfang. Jeho zakladateľ Liang Wenfeng má hlboké zázemie a bohaté skúsenosti s kvantitatívnymi investíciami a vysoké - výkonné výpočty.

 

V decembri 2024, DeepSeek - v3, vyrazil v globálnom poli AI obrovskú vlnu. Dosiahol výkon porovnateľný s najlepšími modelmi, ako je GPT-4O za extrémne nízke náklady na školenie a šokuje priemysel.


S spustením nového modelu DeepSeek Deepseek - R1, 27. januára, aplikácia Deepseek na vrchole bezplatného rebríčka sťahovania aplikácií Apple App Store v Číne a Spojených štátoch prekonala Chatgpt v rebríčku sťahovania v USA.

 

Deepseek je veľký jazykový model. Má silné schopnosti spracovania prirodzeného jazyka, rovnako ako inteligentný a porozumenie, ktorý dokáže porozumieť a odpovedať na otázky, ako je priateľ. Na základe algoritmov a podpory údajov za ním vám môže tiež pomôcť písať kód, organizovať údaje a dokonca vyriešiť niektoré zložité matematické problémy.


Pokiaľ ide o podobné veľké modely, prvý dojem každého je chatgpt vyvinutý spoločnosťou OpenAI. Od vydania O1-Preview od OpenAi v septembri 2024 až doteraz uplynulo menej ako štyri mesiace a inferenčné modely, ktoré sú porovnateľné s jeho výkonom alebo dokonca presahujú jeho výkon, rozkvitli na trhu.


Dôvodom, prečo môže DeepSeek vyniknúť z mnohých modelov, je to, že nielenže prevzal vedenie pri dosahovaní výsledkov porovnateľných s modelom OpenAI - O1, ale tiež komprimoval náklady na inferenčný model na extrémne nízku úroveň.

 

V deň otvorenia Svetového hospodárskeho fóra 2025 Výročné stretnutie v tomto mesiaci vydalo Čínsky Deepseek svoj najnovší model Open Source Model R1, ktorý opäť priťahoval globálnu pozornosť v oblasti umelej inteligencie.


DeepSeek - R1 dosiahol dôležitý prielom v technológii - pomocou metód čistého hlbokého učenia, aby sa AI umožnila spontánne objaviť s schopnosťami zdôvodnenia. V úlohách, ako je matematika, kód a odôvodnenie prirodzeného jazyka, je jeho výkon porovnateľný s oficiálnou verziou modelu OpenAI- O1. Model tiež pokračuje vo vysokých nákladoch spoločnosti -.


Rozumie sa, že náklady na školenie modelu DeepSeek - R1 sú iba 5,6 milióna USD, oveľa nižšie ako stovky miliónov alebo dokonca miliardy dolárov investovaných do technológie umelej inteligencie americkými technologickými gigantmi, ako je napríklad výskumné umelecké inteligentné výskumné stredisko USA, spoločnosť Google a „Meta“.


Pokiaľ ide o cenu, zakladateľ Liang Wenfeng raz v rozhovore s médiami povedal, že API aj AI by mali byť univerzálne a cenovo dostupné pre všetkých.

 

Okrem toho sa oplatí poznamenať, že Deepseek prijíma úplne otvorenú stratégiu.


Pôvodným zámerom OpenAi bolo „presadzovať digitálnu inteligenciu spôsobom, ktorý s najväčšou pravdepodobnosťou bude úžitok pre celé ľudstvo, bez obmedzenia potreby generovať finančné výnosy“. Po vydaní GPT-3 však OpenAI obmedzil prístup k modelu a po vydaní GPT-4 dokonca skryl svoje tréningové údaje a hmotnosti modelu, úplne sa posunul smerom k „uzavretému zdroju“.

 

Plne otvorená stratégia spoločnosti Deepseek nielen znižuje hranicu pre používateľov, ale podporuje aj kolaboratívnu ekológiu komunity vývojárov AI. Prostredníctvom Open Source, Deepseek pritiahol pozornosť veľkého počtu vývojárov a výskumných pracovníkov, ktorí môžu slobodne získať a upravovať modelové kódy na platforme, aby spoločne podporovali vývoj technológie AI.


Vedecký vedec spoločnosti NVIDIA Jimfan povedal na svojej osobnej sociálnej platforme: „Sme v takom historickom okamihu: non - USA pokračuje v pôvodnej misii OpenAi - Posilňovanie všetkého ľudstva prostredníctvom skutočne otvoreného rezania - Edge Research."