Xiaomi Salı günü açık kaynaklı bir akıl yürütme odaklı yapay zeka (AI) modeli yayınladı. Mimo olarak adlandırılan akıl yürütme modelleri, akıl yürütme kabiliyetinin nispeten daha küçük bir parametre boyutunda optimizasyonunu yeniliyor. Bu aynı zamanda teknoloji devinin ilk açık kaynaklı muhakeme modelidir ve Deepseek R1 ve Alibaba’nın QWEN QWQ-32B gibi Çin modelleriyle ve Openai’s O1 ve Google’ın Gemini 2.0 flaş düşüncesi de dahil olmak üzere küresel akıl yürütme modelleriyle rekabet eder. Mimo ailesi, her biri benzersiz kullanım durumlarına sahip dört farklı model içerir.
MIMO serisi AI modelleri ile Xiaomi araştırmacıları, AI modellerini muhasebeleştirmede boyut problemini çözmeyi amaçladılar. Akıl yürütme modelleri (en azından ölçülebilenler) yaklaşık 24 milyar veya daha fazla parametreye sahiptir. Büyük boyut, büyük dil modellerinin hem kodlama hem de matematiksel yeteneklerinde tek tip ve eşzamanlı iyileştirmeler elde etmek için tutulur, bu da daha küçük modellerle elde edilmesi zor kabul edilir.
Buna karşılık, MIMO yedi milyar parametreye sahiptir ve Xiaomi, performansının Openai’nin O1-mini ile eşleştiğini ve 32 milyar parametreyle çeşitli akıl yürütme modellerinden daha iyi performans gösterdiğini iddia ediyor. Araştırmacılar, temel AI modelinin 25 trilyon jeton üzerinde önceden eğitildiğini iddia ettiler.
Araştırmacılar, bu verimliliğin veri ön işleme boru hatlarını optimize ederek, metin çıkarma araç setlerini geliştirerek ve çok boyutlu veri filtreleme uygulanarak elde edildiğini iddia ettiler. Ayrıca, Mimo’nun eğitim öncesi üç aşamalı bir veri karışımı stratejisi içeriyordu.
Dahili testlere dayanarak, Xiaomi araştırmacıları MIMO-7B-bazının, akıl yürütme yetenekleri için Big Bench Hard (BBH) ölçütünde 75.2 puan aldığını iddia ediyor. Sıfır atış takviye öğrenimi (RL) tabanlı MIMO-7B-RL-Zero’nun matematik ve kodlama ile ilgili görevlerde mükemmel olduğu iddia ediliyor ve AIME ölçütünde 55.4 puan veriyor ve O1-mini daha iyi performans gösteriyor.
Mimo açık kaynaklı bir AI modeli olduğundan, Xiaomi’nin GitHub’daki listesinden ve sarılma yüzünden indirilebilir. Teknik makale, modelin mimarisinin yanı sıra eğitim öncesi ve eğitim sonrası işlemleri detaylandırıyor. Metin tabanlı bir modeldir ve multimodal özelliklere sahip değildir. Çoğu açık kaynak sürümüne benzer şekilde, modelin veri kümesi ile ilgili ayrıntılar bilinmemektedir.
(Tagstotranslate) Xiaomi Mimo Akıl Yürütme AI Modeli Başlatma Boyutu Xiaomi (T) MIMO (T) AI (T) Yapay Zeka (T) AI Modeli (T) LLM
Kaynak