Telif Hakkı için Sansür: Deepseek, AI hype’ı teste koyar

Telif Hakkı için Sansür: Deepseek, AI hype’ı teste koyar
Yayınlama: 31.01.2025
3
A+
A-

Deepseek şu anda Silikon Vadisi Şirketlerine AI rekabetinin sadece para ile kazanılmadığını gösteriyor. Bu, bazı önemli oyuncuların, özellikle AI Chipriesen Nvidia’nın borsa kursları tarafından sarsıldı. Casus iddiaları var ve Perşembe günü İtalya Çin yapay zekasına erişimi engelledi.

Ancak Deepseek, bu tür ses modellerinin fiyatlandırılmasında en iyi devrimcidir. Johannes Keppler Üniversitesi (JKU) Linz’de uluslararası alanda tanınan AI araştırmacısı Sepp Hochreiter, Deepseek’te bu şekilde hiçbir şey görmüyor, ancak öncelikle “harika bir mühendislik performansı”. Hochreiter, Çinli şirketin farklı bilgilere çok güvendiğini ve ABD şirketleriyle aynı teknolojileri kullandığını söyledi.

Yeni yapay zeka da eski problemlerle uğraşıyor

Buna karşılık, Deepseek beraberinde piyasadaki büyük isimleri de etkileyen birçok eski sorun getiriyor. Bunlar zaten Chatgpt Hipes’in başlangıcında tartışıldı, şimdiye kadar çözülmedi ve şimdi tekrar konu haline geliyorlar.

Bir akıllı telefonda Deepseek ve Sohbet GPT uygulamaları

ORF

Deepseek ayrıca diğer sohbet botları ile aynı sorunlardan muzdariptir

Muhtemelen bu tür büyük dil modellerinin (LLM’ler) en büyük sorunu Deepseek, aynı zamanda ChatGpt, Google Gemini ve diğerleri de her zaman “halüsinasyon” olmuştur. “Yapay Zeka” teriminin aksine, bu tür AI uygulamaları kabaca istatistiksel ilkelere dayanmaktadır. Kelimeler, tüm cümlelere yönelik olasılıklar nedeniyle birbirine asılır – genellikle iyi çalışan, ancak bazen felaketle kötü.

Dil modelleri “arama motoru yok”

Bununla birlikte, AI’nın cevap verirken “emin olmadığını” asla okumaz, her zaman hemen ikna olmuş geliyor – çünkü dil modellerinin gerçek ve gerçek kavramı yok. Teknik Üniversite (TU) Viyana’dan Sabine Köszegi, Orf.at. Dil modelleri “uzman veritabanı” değildir. Avusturya’nın AI Danışma Kurulunda da temsil edilen uzmana göre, dil modellerinin aslında diğer görevler için tasarlandığına ve örneğin, “belirli yapılara göre” kısa özetler ve içerik yaratma söz konusudur.

Hochreiter, halüsinasyonun “temel bir sorun” olduğuna dikkat çekiyor: dil modelleri, bir sonraki kelimeyi harcamak zorunda kalacak şekilde tasarlandı – karşılık gelen hiçbir bilgi olmasa bile ve “en akla yatkın kelime” seçilmiş. “Bir sonraki kelimeyi tahmin ettiğimde halüsinasyon konuyla ilgili. Ve ne diyeceğimi bilmiyorsam, sadece vahşi bir şey düşünüyorum çünkü bir şey harcamam gerekiyor.

Sansür sadece Çin’de değil

Salı ve Çarşamba günü Deepseek’teki sansür hakkında çok şey bildirildi. Tiananmen katliamı gibi Çin hakkında soru soran herkes AI tarafından reddedilir. Bir sohbet botunun bu tür sorularla bile yanlış cevapları “halüsinasyon” yapabilmesinin yanı sıra, dil modelleri de bazı konuları ele almayacak şekilde ayarlanabilir.

Batı’da, bu böyle büyük bir tarzda olmayabilir, ancak Chatgpt ayrıca pornografik ve şiddet içeren içeriği, örneğin yasadışı faaliyetlerle ilgili soruları da engeller. En azından teoride. Çünkü pratikte bu engellerin etrafında hala bir yol bulundu – biri, AI’nın kısıtlamalarından hapishane salgını olan bir “jailbreak” den bahsediyor. Bu, mevcut Chatt versiyonlarında ve Deepseek’te başarılı oldu.

Hassas bir konu olarak telif hakkı

Eğitim verileri ve telif hakkı hakkındaki tartışmalar hiçbir şekilde yeni değildir, ancak şimdi tekrar kaynatılmıştır. Ses modellerinin çalışması için, büyük miktarlarda metinle “eğitilmeleri” gerekir. ChatGPT’de, bu verilerin nereden geldiği tamamen belirsizdir – ağdan çıkabileceğiniz ve muhtemelen halka açık olduğunuz açıktır, ancak bu yasal olarak tamamen korunmasız olduğunuz anlamına gelmez.

Bir akıllı telefonda Deepseek uygulaması

ORF

Chatbots için eğitim verilerinin geldiği yerler genellikle belirsizdir

Çarşamba günü Deepseek’te, bu arada ChatGPT üreticisi OpenAAI’den verilerin modeli eğitmek için büyük ölçekte çıkabileceği varsayımı yapıldı. Farklı bir ses modelinden fitil öğretimine “damıtma” denir. Muhtemelen bu sürecin halka açık bilgilerin tazminatından yasal olarak az ya da çok tartışmalı olup olmadığı muhtemelen yemekler için bir sorudur – casusluk iddiası vardır.

AI “çeşitliliği azaltır”

Buna ek olarak, pratik olarak tüm modellerin bir önyargı biçimi vardır, yani uzmanların uyardığı gibi önyargı vardır. CHATGPT sorarsanız, “Amerikan Değerleri ve Etik Fikirleri” alırsınız – ve Çin’e göre Deepseek ile, diyor Köszegi. Bu sohbet botlarının masrafları her zaman “çok spesifik gruplar, düşünme yolları, insanlar sadece istatistiksel olarak temsil edilmedikleri için marjinalleşen kültürel bir eserdir”, Köszegi devam ediyor.

“Ve bu çeşitliliğimizi azaltır,” diye devam etti uzman. “Uzun vadede ve bu bilimsel olarak güvende,” dedi Köszegi “yenilikçi yeteneğimizi, yaratıcılığımızı ve onları çözme yeteneğimizi azalttı. Bu bir toplum olarak daha akıllı olmadığımız anlamına gelir. “

İş modeli hakkında soru açık kalıyor

Deepsek ne olursa olsun, acı bir fiyat savaşıdır: kullanımda, Çin yapay zekası ABD’den gelen rekabetten önemli ölçüde daha ucuzdur. Bu öncelikle, abonelikleri ayda 200 dolara kadar satan ve hala para kaybettiği söylenen Openai’nin zaten titrek iş modelinde görülüyor. Çin, ABD veya AB’den hala devam eden sesli modellerin, milyarlarca milyarlarla finanse edilen AI modellerinden nasıl kazanılabileceği konusunda büyük bir soru olmaya devam ediyor.

Her soruyu cevaplayabilen mucizevi bilgi makinesinin büyük hayali – en azından bir sonraki duyuruya kadar – tam olarak bu: bir rüya. Deepseek bu gerçeğe yeni dikkat çekti, mevcut sorunları gösterdi ve ayrıca çok fazla şüphecilik yaptı. Bu eleştiriler Çin ile sınırlı değil.

Kaynak

Viyanablog Sitesinin Kurucusuyum.