Openai’nin Deepseek’in R1 modelini oluşturmak için yapay zeka (AI) modellerini damıtmış olabileceğini iddia ettiği bildirildi. Rapora göre, San Francisco merkezli AI firması, bazı kullanıcıların AI modellerinin çıktılarını Deepseek olduğundan şüphelenen bir rakip için kullandığına dair kanıtlara sahip olduğunu belirtti. Özellikle, Çinli şirket geçen hafta açık kaynaklı Deepseek-R1 AI modelini yayınladı ve GitHub ve Hugging Face’te ağırladı. Akıl yürütme odaklı model, Chatgpt yapımcısı O1 AI modellerinin yeteneklerini çeşitli kriterlerde aştı.
Bir Financial Times raporuna göre Openai, tescilli AI modellerinin Deepseek’in modellerini eğitmek için kullanıldığını iddia etti. Şirket yayına, Openai Uygulama Programlama Arayüzü’nü (API) kullanan çeşitli hesaplardan damıtma kanıtı gördüğünü söyledi. AI firması ve bulut ortağı Microsoft sorunu araştırdı ve erişimlerini engelledi.
Financial Times’a yaptığı açıklamada Openai, “(Çin) tabanlı şirketlerin-ve diğerlerini-bize liderlik eden AI şirketlerinin modellerini sürekli olarak damıtmaya çalışıyor.” Dedi. Chatgpt yapımcısı ayrıca, sınır modellerini rakiplerden ve rakiplerden korumak için ABD hükümeti ile yakın bir şekilde çalıştığını vurguladı.
Özellikle, AI modeli damıtma, bilgiyi büyük bir modelden daha küçük ve daha verimli bir modele aktarmak için kullanılan bir tekniktir. Buradaki amaç, hesaplama gereksinimlerini azaltırken daha küçük modeli par veya daha büyük modelin önüne getirmektir. Özellikle, Openai’nin GPT-4’ü yaklaşık 1.8 trilyon parametreye sahipken, Deepseek-R1’in açıklamaya uyacak 1.5 milyar parametresi var.
Bilgi aktarımı tipik olarak, bir şirket modelinin kurum içinde daha verimli sürümlerini oluştururken, daha küçük modeli eğitmek için daha büyük modelden ilgili veri kümesini kullanarak gerçekleşir. Örneğin, Meta, kodlama odaklı birkaç lama modelini oluşturmak için Llama 3 AI modelini kullandı.
Bununla birlikte, tescilli bir modelin veri kümelerine erişimi olmayan bir rakip bir modeli damıtmak istediğinde bu mümkün değildir. Openai’nin iddiaları doğruysa, bu, çok sayıda çıktı oluşturmak için API’lerine hızlı enjeksiyon ekleyerek yapılmış olabilir. Bu doğal dil verileri daha sonra koda dönüştürülür ve bir temel modele beslenir.
Özellikle, Openai bununla ilgili bir açıklama yapmamıştır. Son zamanlarda, şirket CEO’su Sam Altman, Deepseek’i böyle gelişmiş bir AI modeli oluşturduğu ve AI alanındaki rekabeti arttırdığı için övdü.
(Tagstotranslate) Openai AI modelleri Deepseek R1 Raporu Openai (T) Deepseek (T) AI (T) Yapay Zeka
Kaynak