
Den kinesiska AI-modellen Deepseek-R1 har släppts på utvecklarplattformen Hugging Face rapporterar Computer Sweden. Modellen är utvecklad av Deepseek och anses vara en konkurrent till Open AI:s o1-modell, med imponerande prestationer inom matematik, kodning och resonemangstester.
Deepseek-R1 är tränad med förstärkt inlärning (RL) utan övervakad finjustering (SFT) som ett preliminärt steg, vilket ger den förmågan att utforska chain-of-thought (CoT) för att lösa komplexa problem. Detta resulterade i utvecklingen av Deepseek-R1-Zero, en modell som visar bemerkelsedig prestanda inom resonemang.
Deepseek har även släppt Deepseek-R1, som innehåller kylstartsdata före RL. Deepseek-R1 uppnår prestanda jämförbar med OpenAI-o1 i uppgifter relaterade till matematik, kodning och resonemang. För att stödja forskningsgemenskapen har Deepseek öppnat källkoden för Deepseek-R1-Zero, Deepseek-R1 och sex täta modeller distillerade från Deepseek-R1 baserat på Llama och Qwen.