Kinesiska Deepseek-R1 utmanar Open AI:s o1 på utvecklarplattformen Hugging Face

Den kinesiska AI-modellen Deepseek-R1 har släppts på utvecklarplattformen Hugging Face rapporterar Computer Sweden. Modellen är utvecklad av Deepseek och anses vara en konkurrent till Open AI:s o1-modell, med imponerande prestationer inom matematik, kodning och resonemangstester.

Deepseek-R1 är tränad med förstärkt inlärning (RL) utan övervakad finjustering (SFT) som ett preliminärt steg, vilket ger den förmågan att utforska chain-of-thought (CoT) för att lösa komplexa problem. Detta resulterade i utvecklingen av Deepseek-R1-Zero, en modell som visar bemerkelsedig prestanda inom resonemang.

Deepseek har även släppt Deepseek-R1, som innehåller kylstartsdata före RL. Deepseek-R1 uppnår prestanda jämförbar med OpenAI-o1 i uppgifter relaterade till matematik, kodning och resonemang. För att stödja forskningsgemenskapen har Deepseek öppnat källkoden för Deepseek-R1-Zero, Deepseek-R1 och sex täta modeller distillerade från Deepseek-R1 baserat på Llama och Qwen.

Related Stories

Migrering av webbplats

Nya magnetkonfigurationer överträffar klassiska modeller

Fysiker knyter ihop termodynamikens andra och tredje lagar