Önemli Bilgiler
- Yeni bir makine öğrenimi modeli, çeviriye yardımcı olmak için bir cümlenin bir dildeki görünümünün görüntüsünü halüsinasyonlar.
- VALHALLA adlı yapay zeka sistemi, insanların dili algılama biçimini taklit etmek için tasarlandı.
- Yeni sistem, dili anlamak için yapay zekayı kullanmaya yönelik büyüyen bir hareketin parçası.
Kelimeleri çevirirken resimleri görselleştirmenin insan yöntemi, yapay zekanın (AI) sizi daha iyi anlamasına yardımcı olabilir.
Yeni bir makine öğrenimi modeli, bir dilde bir cümlenin nasıl göründüğüne dair bir görüntü hayal ediyor. Yakın tarihli bir araştırma makalesine göre, teknik daha sonra çeviriye yardımcı olmak için görselleştirme ve diğer ipuçlarını kullanır. Dili anlamak için yapay zekayı kullanmak büyüyen bir hareketin parçası.
Araştırmaya dahil olmayan Maryville Üniversitesi'nde veri analitiği profesörü Beth Cudney, Lifewire'a verdiği bir e-posta röportajında, "İnsanların konuşma ve yazma biçimleri benzersizdir, çünkü hepimizin biraz farklı tonları ve tarzları vardır.". "Bağlamı anlamak zordur çünkü yapılandırılmamış verilerle uğraşmak gibidir. Bu, doğal dil işlemenin (NLP) yararlı olduğu yerdir. NLP, makine okuma anlama kullanarak iletişim kurma şeklimizdeki farklılıkları ele alan bir yapay zeka dalıdır. NLP'deki temel fark, yapay zekanın bir dalı olarak, sadece konuştuğumuz veya yazdığımız kelimelerin gerçek anlamlarına odaklanmaz, anlamına bakar."
Git Alice'e Sor
MIT, IBM ve San Diego'daki California Üniversitesi'nden araştırmacılar tarafından oluşturulan VALHALLA adlı yeni yapay zeka sistemi, insanların dili algılama biçimini taklit etmek için tasarlandı. Bilim adamlarına göre, multimedya gibi duyusal bilgileri yeni ve bilinmeyen kelimelerle birlikte kullanmak, örneğin resimli bilgi kartları gibi, dil edinimini ve akılda tutmayı geliştirir.
Bu sistemler, şu anda yalnızca eğitilmiş ve belirli konuşmalar yapabilen sohbet robotlarının gücünü artırıyor…
Ekip, yöntemlerinin s alt metin çevirisine göre makine çevirisinin doğruluğunu geliştirdiğini iddia ediyor. Bilim adamları, bir cümlenin anahtar kelimelerine ve semantiğine dikkat edebilen, dil gibi sıraya bağlı veriler için uygun bir tür sinir ağı modeli olan iki transformatörlü bir kodlayıcı-kod çözücü mimarisi kullandılar. Bir transformatör görsel bir halüsinasyon oluşturur ve diğeri ilk transformatörün çıktılarını kullanarak çok modlu çeviri gerçekleştirir.
Araştırma ekibi üyelerinden Rameswar Panda bir haber bülteninde, "Gerçek dünya senaryolarında, kaynak cümleye göre bir imajınız olmayabilir" dedi. "Yani, temel olarak motivasyonumuz şuydu: Çıkarım sırasında girdi olarak harici bir görüntü kullanmak yerine, görsel halüsinasyonu - görsel sahneleri hayal etme yeteneğini - makine çeviri sistemlerini geliştirmek için kullanabilir miyiz?"
AI Anlayışı
Önemli miktarda araştırma NLP'yi geliştirmeye odaklanmıştır, diye belirtti Cudney. Örneğin, Elon Musk, bir insanla sohbet edebilen ve Python ve Java'da yazılım kodu oluşturacak kadar bilgili bir model olan GPT-3 üzerinde çalışan Open AI'nın kurucu ortağıdır.
Google ve Meta ayrıca LAMDA adlı sistemleriyle konuşma tabanlı yapay zeka geliştirmek için çalışıyor. Cudney, "Bu sistemler, şu anda yalnızca eğitimli ve belirli konuşmalar yapabilen sohbet robotlarının gücünü artırıyor ve bu da muhtemelen müşteri desteği ve yardım masalarının çehresini değiştirecek." Dedi.
Bir yapay zeka teknolojisi şirketi olan CLIPr'ın kurucu ortağı Aaron Sloman, bir e-postada, GPT-3 gibi büyük dil modellerinin insan geri bildirimine dayalı metin özetlerini geliştirmek için çok az eğitim örneğinden öğrenebileceğini söyledi. Örneğin, büyük bir dil modeline bir matematik problemi verebileceğinizi ve yapay zekadan adım adım düşünmesini isteyebileceğinizi söyledi.
"Yetenekleri ve sınırlamaları hakkında daha fazla şey öğrendikçe, büyük dil modellerinden daha fazla içgörü ve akıl yürütmenin elde edilmesini bekleyebiliriz," diye ekledi Sloman. "Ayrıca bu dil modellerinin daha insan benzeri süreçler oluşturmasını bekliyorum, çünkü modelciler belirli ilgi gerektiren görevler için modellere ince ayar yapmak için daha iyi yollar geliştiriyor."
Georgia Tech bilgi işlem profesörü Diyi Yang, bir e-posta röportajında, günlük hayatımızda NLP tabanlı kişiselleştirilmiş asistanlardan e-posta ve telefon görüşmelerinde yardımcı olmaya kadar doğal dil işleme (NLP) sistemlerinin daha fazla kullanıldığını göreceğimizi öngördü. seyahat veya sağlık hizmetlerinde bilgi aramak için bilgili diyalog sistemlerine. Yang, "Görevleri yerine getirebilen ve insanlara sorumlu ve önyargısız bir şekilde yardımcı olabilen adil AI sistemlerinin yanı sıra" diye ekledi.
GPT-3 ve DeepText gibi trilyonlarca parametreyi kullanan muazzam yapay zeka modelleri, tüm dil uygulamaları için tek bir model için çalışmaya devam edecek, dedi ki, Dialexa'da bir makine öğrenimi mühendisi olan Stephen Hage bir e-posta röportajında. Sesle komut verilen çevrimiçi alışveriş gibi belirli kullanımlar için oluşturulan yeni model türlerinin de olacağını söyledi.
"Örnek olarak, nasıl uygulandığı üzerinde biraz kontrol sahibi olarak kişinin gözlerindeki gölgeyi göstermek için 'Bu göz farını bana daha fazla hale ile gece mavisi ile göster' diyen bir müşteri olabilir," diye ekledi Hage.