gTTS (Google Text-to-Speech) vs Pyttsx3
Merhaba arkadaşlar bu içerikte pyttsx kütüphanesi ve gTTS (Google Text-to-Speech) kütüphanesini kısaca tanıttım, özelliklerinden bahsettim, ikisini karşılaştırdım ve basit uygulama örnekleri verdim. İyi okumalar!
İçindekiler Tablosu
GTTS
gTTS (Google Text-to-Speech) bir python kütüphanesidir ve Google Translate’in konuşma sentezleyici (text-to-speech) komut satır arayüzüdür (CLI – Comand Line Interface) uygulama programlama arayüzüdür (API- Application Programming Interface). Metin girdilerden ses dosyası çıktıları .mp3 formatıyla çıktılar elde edilebilir. gTTS ile çalışmak diğer API’lere göre oldukça kolaydır. gTTS, İngilizce, Hintçe, Türkçe, Fransızca, Almanca, Çince gibi birçok dili desteklemektedir. Ses dosyasındaki konuşma hızı özelleştirilebilir, sonsuz uzunluktaki metinler seslendirilebilir; ancak, konuşmacının cinsiyeti (ya da türlerini) değiştirememize izin vermez.
Pyttsx3
Pyttsx3, konuşma sentezlemek için kullanılan Python kütüphanesidir. Diğer kütüphanelerden farklı olarak çevrimdışı (offline) olarak çalışır ve Python 2 ve 3 ile uyumludur. Metin girdilerden ses dosyası çıktılar elde edilebilir. Pyttsx kütüphanesi kadın ve erkek seslerini desteklemektedir. Üç adet konuşma sentezleyici motorunu içermektedir. Paylaştığım örnekteki gibi bu motorların örnek objeleri (instance) .init fonksiyonu ile üretilir (pyttsx3.init() ) ve kullanılır. Bu motorlar aşağıda verilmiştir:
- sapi5 – Windows işletim sistemi için
- nsss – NSSpeechSynthesizer Mac OS işletim sistemi için
- espeak – Tüm diğer platoformlar
Not: Aşağıdaki kodda 77. satırda Türkçe voice’ı veren Türkçe (Tolga) sesini kullandım. 0. index default İngilizceydi. Verdiğim linkten siz de dışarıdan seslendirici ekleyebilirsiniz. Videodakileri yaptıktan sonra derleyicinizi tekrar çalıştırın index’e eklenecektir.
Karşılaştırma
gTTS | Pyttsx3 |
+ Kolay kullanım | – Kullanımı gTTS’ye göre biraz daha karışık |
+ Google Translate API’si Türkçe bağlam bilgisini uygulamada başarılı | – Türkçe konuşma başarısı gTTS’ye göre biraz daha düşük |
– Özelleştirme seçenekleri yetersiz. | + Geniş kapsamlı özelleştirme şeçenekleri mevcut(ör: konuşmacılar ve özellikleri) |
– Sadece online çalışıyor | + Offline çalışabiliyor |
+ Düşük ses dosyası boyutu | – Yüksek ses dosyası boyutu |
Kaynaklar ve İleri Okumalar
- https://pypi.org/project/pyttsx3/
- https://gtts.readthedocs.io/en/latest/
- https://pyttsx3.readthedocs.io/en/latest/
Yorum gönder