Linux Ses Tanıma Durumu

Linux'ta konuşma tanıma, Windows ve Mac platformlarını takip ediyor çünkü hem Microsoft hem de Apple, temel işletim sistemlerine sesli komut veya sesli yardımcı yazılım eklemek için önemli miktarda zaman ve harcama yapmış.

Durum, birçok son teknolojide olduğu gibi Linux için iç karartıcı olmasa da, özgür ve açık kaynaklı evren, özellikle sesli komut araçlarıyla bir adım geride kalıyor.

Yerel Linux Konuşma Tanıma

Hiçbir Linux dağıtımı konuşma tanımaya odaklanmaz. Bununla birlikte, konuşma tanıma özelliğini destekleyen uygulamalar Sphinx, Kaldi, Julius ve Mozilla Deepspeech dahil olmak üzere bir avuç açık kaynaklı kitaplığa dayanır.

Negatif alan / Mockup.Fotoğraflar

Bu kütüphaneler, AI'yı eğitmek ve bu nedenle konuşmayı metne doğru bir şekilde çevirmek için çeşitli sesler sunmak için bir konuşma topluluğuna güvenir. Bununla birlikte, açık kaynaklı projeler daha az karmaşıktır (çünkü AI'yi eğitmek için daha küçük katkılardan hoşlanırlar), bu da Linux için çoğu metinden konuşmaya uygulamalarının dönüşümü sık sık başarısız olduğu anlamına gelir. Genellikle, o kadar kapsamlı bir şekilde becerirler ki, orijinal konuşmanın ne olabileceği net değildir.

Linux Konuşmadan Metne Seçenekleri

Beş çözüm yolundan birini kullanın.

  • Varsa, dağıtımınızın havuzlarında bulunan yerel Linux uygulamalarına güvenin.
  • Amazon, Alexa'yı Raspberry Pi dahil olmak üzere Linux için kullanılabilir hale getirdi. Bu düzenlemenin işe yaraması için çok sayıda özel ince ayar yapmanız gerekecek, ancak işe yarayacak.
  • DictationIO aracılığıyla tarayıcınızdan Google Speech API'ye erişin. Bu hizmet yalnızca dikte için çalışır; sesli komut için kullanamazsınız. Google'ın yapay zekası tarafından desteklendiği için kalite iyidir.

  • Triggercmd hizmeti aracılığıyla Linux için sesli komut yardımcı programı olarak Alexa veya Google Assistant gibi bir hizmeti kullanın. Triggercmd bilgisayarınızda çalışır; bunu Alexa veya Google Assistant'ı çağırmak için kullanın ve bu araçların komutunuza göre belirli Bash komut dosyalarını çalıştırmasını sağlayın. "Ok Google, hesap makinesini açması için tetik komutunu iste" gibi bir şey söyleyin. Google Asistan, "hesap makinesini aç" ifadesiyle belirtilen Bash komut dosyasını çalıştırmak için Triggercmd ile bir aracı görevi görür.
  • Wine veya Dragon NaturallySpeaking gibi Windows için bir yazılımla sanal bir makine kullanın. Doğru ince ayar ile, bu çözüm sesli komut uygulamaları için çalışmasa da, Dragon motorunu yazıya dönüştürme için kullanabilirsiniz.