DeepSeek, Yeni Akıl Yürütme Odaklı DeepSeek-R1 Yapay Zeka Modeli’nin OpenAI’nin o1 modelinden daha iyi performans gösterebileceğini söylüyor

DeepSeek, Yeni Akıl Yürütme Odaklı DeepSeek-R1 Yapay Zeka Modeli’nin OpenAI’nin o1 modelinden daha iyi performans gösterebileceğini söylüyor
Yayınlama: 23.01.2025
11
A+
A-

Çinli DeepSeek firmasının akıl yürütme odaklı bir yapay zeka (AI) modeli olan DeepSeek-R1, Pazartesi günü piyasaya sürüldü. Bu, ön izleme sürümünün yayınlanmasından iki ay sonra gelen açık kaynak yapay zeka modelinin tam sürümüdür. Açık kaynaklı AI modeli indirilebilir ve aynı zamanda tak ve çalıştır uygulama programlama arayüzü (API) olarak da kullanılabilir. Çinli yapay zeka firması, DeepSeek-R1’in matematik, kodlama ve akıl yürütmeye dayalı görevlerde çeşitli ölçütlerde OpenAI’nin o1 modelinden daha iyi performans gösterdiğini iddia etti.

DeepSeek-R1 Yapay Zeka Modelleri, OpenAI’nin o1 Modellerine Göre Yüzde 95’e Kadar Daha Düşük Maliyete Sahiptir

En yeni seride iki model bulunmaktadır: DeepSeek-R1 ve DeepSeek-R1-Zero. Her ikisi de AI firması tarafından geliştirilen DeepSeek V3 adlı başka bir büyük dil modelinden (LLM) damıtılmıştır. Yeni yapay zeka modelleri, daha büyük modelin verimliliğini ve yeteneklerini artırmak için birkaç küçük modelin bir araya getirildiği uzmanlar karışımı (MoE) mimarisine dayanıyor.

DeepSeek-R1 AI modelleri şu anda Hugging Face listesi aracılığıyla indirilebiliyor. Model, hem akademik hem de ticari kullanıma izin veren bir MIT lisansıyla birlikte geliyor. LLM’yi yerel olarak çalıştırmayı düşünmeyenler bunun yerine model API’yi tercih edebilirler. Şirket, modelin çıkarım fiyatlandırmasını açıklayarak bunların maliyetinin OpenAI’nin o1’inden yüzde 90-95 daha düşük olduğunu vurguladı.

Şu anda DeepSeek-R1 API, milyon token başına 0,14 ABD Doları (kabaca 12,10 Rupi) giriş fiyatıyla geliyor ve çıkış fiyatı milyon token başına 2,19 ABD Doları (kabaca 189,50 Rupi) olarak belirlendi. Karşılaştırıldığında, OpenAI’nin o1 API’sinin maliyeti bir milyon girdi tokenı başına 7,5 ABD Doları (yaklaşık 649 Rupi) ve bir milyon çıktı tokenı başına 60 ABD Doları (yaklaşık 5.190 Rupi) oldu.

DeepSeek-R1’in maliyetinin düşük olmasının yanı sıra şirket, OpenAI muadilinden daha yüksek performans sunduğunu da iddia ediyor. Yapay zeka firması, dahili testlere dayanarak DeepSeek-R1’in American Invitational Mathematics Examination (AIME), Math-500 ve SWE-bench kriterlerinde o1’den daha iyi performans gösterdiğini belirtti. Ancak modeller arasındaki fark çok azdır.

Eğitim sonrasına gelince şirket, herhangi bir denetimli ince ayar (SFT) olmadan temel modelde takviyeli öğrenmeyi (RL) kullandığını söyledi. Saf RL olarak da bilinen bu yöntem, düşünce zinciri (CoT) mekanizmasını kullanarak karmaşık problemleri çözerken modele daha fazla özgürlük sağlar. DeepSeek, bunun muhakeme yeteneklerini geliştirmek için saf RL’yi kullanan ilk açık kaynaklı yapay zeka projesi olduğunu iddia etti.

En son teknoloji haberleri ve incelemeleri için Gadgets 360’ı takip edin XFacebook, WhatsApp, Konular ve Google Haberler. Gadget’lar ve teknolojiyle ilgili en son videolar için YouTube kanalımıza abone olun. En etkili kişiler hakkında her şeyi öğrenmek istiyorsanız şirket içi Who’sThat360’ımızı Instagram ve YouTube’da takip edin.

iPhone 17 Arka Panel Tasarımı Yine Sızdı; Piksel Benzeri Arka Kamera Modülünü Gösterir



Kaynak

Viyanablog Sitesinin Kurucusuyum.