Bilgisayarınızla Yaptığınız Konuşmalar Daha Gerçekçi Olabilir

👤 Yazar Abigail Brown 📧 brown@technologyhumans.com.
⏱ Public 2023-12-17 07:04.
🖍 Son düzenleme 2025-01-24 12:27.

Önemli Bilgiler

Meta, konuşmada duyguları ifade edebilen programlar yapmak için yapay zekayı kullanıyor.
Şirketin yapay zeka ekibi, kahkaha, esneme, ağlama ve "spontane sohbet" gibi etkileyici seslendirmeleri gerçek zamanlı olarak modellemede ilerleme kaydettiğini söyledi.
AI, konuşma tanımadaki iyileştirmeleri desteklemek için de kullanılıyor.

Yakında yapay zekanın (AI) gücü sayesinde bilgisayarınızla daha doğal bir sohbet edebileceksiniz.

Meta, daha gerçekçi AI tarafından oluşturulan konuşma sistemleri oluşturma çabalarında önemli ilerleme kaydettiğini söyledi. Şirketin yapay zeka ekibi, gerçek zamanlı olarak "spontane sohbete" ek olarak kahkaha, esneme ve ağlama gibi etkileyici seslendirmeleri modelleme yeteneğinde ilerleme kaydettiğini söyledi.

Ekip, son blog gönderisinde "Herhangi bir konuşmada, insanlar tonlamalar, duygusal ifadeler, duraklamalar, aksanlar, ritimler gibi hepsi insan etkileşimleri için önemli olan sözsüz sinyallerle dolu bir şekilde değiş tokuş yaparlar" dedi.. "Ancak günümüzün yapay zeka sistemleri, bu zengin, anlamlı sinyalleri yakalayamıyor çünkü sadece ne söylediğimizi yakalayan, nasıl söylediğimizi değil, yazılı metinden öğreniyorlar."

Daha Akıllı Konuşma

Blog gönderisinde Meta AI ekibi, tonlamalar, duygusal ifadeler, duraklamalar, aksanlar ve ritimler gibi konuşmadaki sözlü olmayan sinyalleri anlayamayan geleneksel AI sistemlerinin sınırlamalarının üstesinden gelmek için çalıştıklarını söyledi.. Sistemler, yalnızca yazılı metinden öğrenebildikleri için geri tutulur.

Ancak Meta'nın çalışması önceki çalışmalardan farklıdır çünkü yapay zeka modelleri konuşulan dilin tüm doğasını yakalamak için doğal dil işleme modellerini kullanabilir. Meta araştırmacıları, yeni modellerin yapay zeka sistemlerinin can sıkıntısı veya ironi gibi iletmek istedikleri duyguları iletmesine izin verebileceğini söylüyor.

"Yakın gelecekte, kaynak yoğun metin etiketleri veya otomatik konuşma tanıma sistemleri (ASR) gerektirmeden yararlı aşağı akış uygulamaları oluşturmak için metinsiz teknikleri uygulamaya odaklanacağız, örneğin soru yanıtlama (ör. hava durumu?"), "Ekip blog gönderisinde yazdı. "Konuşmadaki prozodinin bir cümleyi daha iyi ayrıştırmaya yardımcı olabileceğine inanıyoruz, bu da amacı anlamayı kolaylaştırıyor ve soru yanıtlama performansını iyileştiriyor."

AI Güçleri Anlama

Bilgisayarlar yalnızca anlamı iletmede daha iyi hale gelmekle kalmıyor, aynı zamanda konuşma tanımadaki iyileştirmeleri desteklemek için yapay zeka da kullanılıyor.

Bilgisayar bilimcileri, üç Bell Labs araştırmacısının tek sayısal basamakları tanıyabilen bir sistem oluşturduğu en az 1952'den beri bilgisayar konuşma tanıma üzerinde çalışıyorlar, AI Dynamics'in baş teknoloji sorumlusu Ryan Monsurate bir e-postada söyledi. can teli. 1990'lara gelindiğinde, konuşma tanıma sistemleri ticari olarak mevcuttu, ancak yine de sağlık gibi çok özel uygulama alanlarının dışında kullanımı caydıracak kadar yüksek bir hata oranına sahipti.

Monsurate, "Artık derin öğrenme modelleri, topluluk modellerinin (Microsoft'takiler gibi) konuşma tanımada insanüstü performans elde etmesini sağladığına göre, bilgisayarlarla konuşmacıdan bağımsız sözlü iletişimi geniş ölçekte mümkün kılacak teknolojiye sahibiz" dedi. "Bir sonraki aşama, Siri'yi veya Google'ın AI yardımcılarını kullanan herkesin bu konuşma tanıma düzeyine erişebilmesi için maliyeti düşürmeyi içerecek."

AI ses şirketi Verbit.ai'nin gelir müdürü ve genel müdürü Ariel Utnik, Lifewire'a bir e-posta röportajında AI, konuşma tanıma için yararlıdır, çünkü öğrenme yoluyla zamanla gelişebilir. Örneğin Verbit, şirket içi AI teknolojisinin arka plan gürültüsünü ve yankıları algıladığını ve filtrelediğini ve canlı ve kaydedilmiş video ve sesten ayrıntılı, profesyonel transkriptler ve altyazılar oluşturmak için aksandan bağımsız olarak hoparlörleri kopyaladığını iddia ediyor.

Ancak Utnik, mevcut konuşma tanıma platformlarının çoğunun yalnızca %75-80 oranında doğru olduğunu söyledi.

"Yapay zeka asla tam anlamıyla insanların yerini almayacak, çünkü transkriptler, düzeltmenler ve editörler tarafından yapılan kişisel inceleme, yüksek kaliteli ve en yüksek doğrulukta bir nihai transkript sağlamak için gerekli" diye ekledi.

Ses tanıma şirketi Mitek Systems'in küresel ürün ve kurumsal geliştirme başkan yardımcısı Sanjay Gupta, bir e-postada, Daha iyi ses tanımanın bilgisayar korsanlarını önlemek için de kullanılabileceğini söyledi. Araştırmalar, iki yıl içinde tüm başarılı hesap ele geçirme saldırılarının yüzde 20'sinin sentetik ses güçlendirme kullanacağını gösteriyor.

"Bu, derin sahte teknoloji daha karmaşık hale geldikçe, aynı anda görüntü ve video derin sahtekarlıklarının yanı sıra bu taktiklerle mücadele edebilecek gelişmiş güvenlik oluşturmamız gerektiği anlamına geliyor," dedi Gupta. "Ses sahtekarlığıyla mücadele, canlı ses ile sesin kaydedilmiş, sentetik veya bilgisayar tarafından oluşturulmuş bir sürümünü ayırt edebilen canlılık algılama teknolojisi gerektirir."

Düzeltme 2022-05-04: Ryan Monsurate'nin 9. paragraftaki adının yazılışı düzeltildi.

Önerilen:

Bilgisayarınızla Yaptığınız Konuşmalar Daha Gerçekçi Olabilir

İçindekiler:

Önemli Bilgiler

Daha Akıllı Konuşma

AI Güçleri Anlama

Önerilen:

Yeni Bilgisayarınızla Yapmanız Gereken İlk 5 Şey

Unity Oyun Motoru Son Derece Gerçekçi İnsanlar Yapabilir

Amazon Alexa Daha İyi Konuşmalar Yapmanıza Nasıl Yardımcı Olabilir?

Metin, Görseller ve Gerçek Zamanlı Konuşmalar için Google Çeviri Nasıl Kullanılır

Microsoft'un Go Dizüstü Bilgisayarı Daha Hafif, Daha Ucuz, Daha Küçük, Daha Yeni

Fix-a-Flat Lastik Basıncı Monitör Sensörlerine Hasar Verebilir mi?

İki Kişi Aynı Anda Spotify Dinleyebilir mi?

Microsoft Windows'un Kısa Tarihi

Fabrika Direksiyon Kontrollerini Satış Sonrası Ana Ünitelerle Kullanabilir misiniz?

Çevrimiçi Arkadaşlarla Film İzlemenin En İyi 10 Yolu

WhatsApp Yedeği Nasıl Oluşturulur

Facebook İzleme Partisi Nasıl Düzenlenir

CD'deki Vinil Kayıtları Nasıl Korunur

Outlook'ta Mesajlardan Ekler Nasıl Kaldırılır

Sanal Gerçeklik Nedir? (VR Tanımı)

IPad veya iPad Mini'nizi Telefon Olarak Kullanma

Paket Sniffers Nedir ve Nasıl Çalışırlar?

GoCycle G4i Beni Katlanır E-Bisiklete İnandırdı

Bugünün Okullarında Bilgisayar Ağlarını İncelemek

Uzmanlar, Wear OS'nin Geleceğinin Parlak Olduğunu Söylüyor