Bilgisayarınızla Yaptığınız Konuşmalar Daha Gerçekçi Olabilir

İçindekiler:

Bilgisayarınızla Yaptığınız Konuşmalar Daha Gerçekçi Olabilir
Bilgisayarınızla Yaptığınız Konuşmalar Daha Gerçekçi Olabilir
Anonim

Önemli Bilgiler

  • Meta, konuşmada duyguları ifade edebilen programlar yapmak için yapay zekayı kullanıyor.
  • Şirketin yapay zeka ekibi, kahkaha, esneme, ağlama ve "spontane sohbet" gibi etkileyici seslendirmeleri gerçek zamanlı olarak modellemede ilerleme kaydettiğini söyledi.
  • AI, konuşma tanımadaki iyileştirmeleri desteklemek için de kullanılıyor.
Image
Image

Yakında yapay zekanın (AI) gücü sayesinde bilgisayarınızla daha doğal bir sohbet edebileceksiniz.

Meta, daha gerçekçi AI tarafından oluşturulan konuşma sistemleri oluşturma çabalarında önemli ilerleme kaydettiğini söyledi. Şirketin yapay zeka ekibi, gerçek zamanlı olarak "spontane sohbete" ek olarak kahkaha, esneme ve ağlama gibi etkileyici seslendirmeleri modelleme yeteneğinde ilerleme kaydettiğini söyledi.

Ekip, son blog gönderisinde "Herhangi bir konuşmada, insanlar tonlamalar, duygusal ifadeler, duraklamalar, aksanlar, ritimler gibi hepsi insan etkileşimleri için önemli olan sözsüz sinyallerle dolu bir şekilde değiş tokuş yaparlar" dedi.. "Ancak günümüzün yapay zeka sistemleri, bu zengin, anlamlı sinyalleri yakalayamıyor çünkü sadece ne söylediğimizi yakalayan, nasıl söylediğimizi değil, yazılı metinden öğreniyorlar."

Daha Akıllı Konuşma

Blog gönderisinde Meta AI ekibi, tonlamalar, duygusal ifadeler, duraklamalar, aksanlar ve ritimler gibi konuşmadaki sözlü olmayan sinyalleri anlayamayan geleneksel AI sistemlerinin sınırlamalarının üstesinden gelmek için çalıştıklarını söyledi.. Sistemler, yalnızca yazılı metinden öğrenebildikleri için geri tutulur.

Ancak Meta'nın çalışması önceki çalışmalardan farklıdır çünkü yapay zeka modelleri konuşulan dilin tüm doğasını yakalamak için doğal dil işleme modellerini kullanabilir. Meta araştırmacıları, yeni modellerin yapay zeka sistemlerinin can sıkıntısı veya ironi gibi iletmek istedikleri duyguları iletmesine izin verebileceğini söylüyor.

"Yakın gelecekte, kaynak yoğun metin etiketleri veya otomatik konuşma tanıma sistemleri (ASR) gerektirmeden yararlı aşağı akış uygulamaları oluşturmak için metinsiz teknikleri uygulamaya odaklanacağız, örneğin soru yanıtlama (ör. hava durumu?"), "Ekip blog gönderisinde yazdı. "Konuşmadaki prozodinin bir cümleyi daha iyi ayrıştırmaya yardımcı olabileceğine inanıyoruz, bu da amacı anlamayı kolaylaştırıyor ve soru yanıtlama performansını iyileştiriyor."

AI Güçleri Anlama

Bilgisayarlar yalnızca anlamı iletmede daha iyi hale gelmekle kalmıyor, aynı zamanda konuşma tanımadaki iyileştirmeleri desteklemek için yapay zeka da kullanılıyor.

Bilgisayar bilimcileri, üç Bell Labs araştırmacısının tek sayısal basamakları tanıyabilen bir sistem oluşturduğu en az 1952'den beri bilgisayar konuşma tanıma üzerinde çalışıyorlar, AI Dynamics'in baş teknoloji sorumlusu Ryan Monsurate bir e-postada söyledi. can teli. 1990'lara gelindiğinde, konuşma tanıma sistemleri ticari olarak mevcuttu, ancak yine de sağlık gibi çok özel uygulama alanlarının dışında kullanımı caydıracak kadar yüksek bir hata oranına sahipti.

Monsurate, "Artık derin öğrenme modelleri, topluluk modellerinin (Microsoft'takiler gibi) konuşma tanımada insanüstü performans elde etmesini sağladığına göre, bilgisayarlarla konuşmacıdan bağımsız sözlü iletişimi geniş ölçekte mümkün kılacak teknolojiye sahibiz" dedi. "Bir sonraki aşama, Siri'yi veya Google'ın AI yardımcılarını kullanan herkesin bu konuşma tanıma düzeyine erişebilmesi için maliyeti düşürmeyi içerecek."

Image
Image

AI ses şirketi Verbit.ai'nin gelir müdürü ve genel müdürü Ariel Utnik, Lifewire'a bir e-posta röportajında AI, konuşma tanıma için yararlıdır, çünkü öğrenme yoluyla zamanla gelişebilir. Örneğin Verbit, şirket içi AI teknolojisinin arka plan gürültüsünü ve yankıları algıladığını ve filtrelediğini ve canlı ve kaydedilmiş video ve sesten ayrıntılı, profesyonel transkriptler ve altyazılar oluşturmak için aksandan bağımsız olarak hoparlörleri kopyaladığını iddia ediyor.

Ancak Utnik, mevcut konuşma tanıma platformlarının çoğunun yalnızca %75-80 oranında doğru olduğunu söyledi.

"Yapay zeka asla tam anlamıyla insanların yerini almayacak, çünkü transkriptler, düzeltmenler ve editörler tarafından yapılan kişisel inceleme, yüksek kaliteli ve en yüksek doğrulukta bir nihai transkript sağlamak için gerekli" diye ekledi.

Ses tanıma şirketi Mitek Systems'in küresel ürün ve kurumsal geliştirme başkan yardımcısı Sanjay Gupta, bir e-postada, Daha iyi ses tanımanın bilgisayar korsanlarını önlemek için de kullanılabileceğini söyledi. Araştırmalar, iki yıl içinde tüm başarılı hesap ele geçirme saldırılarının yüzde 20'sinin sentetik ses güçlendirme kullanacağını gösteriyor.

"Bu, derin sahte teknoloji daha karmaşık hale geldikçe, aynı anda görüntü ve video derin sahtekarlıklarının yanı sıra bu taktiklerle mücadele edebilecek gelişmiş güvenlik oluşturmamız gerektiği anlamına geliyor," dedi Gupta. "Ses sahtekarlığıyla mücadele, canlı ses ile sesin kaydedilmiş, sentetik veya bilgisayar tarafından oluşturulmuş bir sürümünü ayırt edebilen canlılık algılama teknolojisi gerektirir."

Düzeltme 2022-05-04: Ryan Monsurate'nin 9. paragraftaki adının yazılışı düzeltildi.

Önerilen: