Ses dosyalarını metne dönüştürebilen bir uygulama bilen var mı? 12.04 LTS ubuntu koşuyorum.
Ses dosyalarını metne dönüştürebilen bir uygulama bilen var mı? 12.04 LTS ubuntu koşuyorum.
Kullanabileceğiniz yazılım CMUSphinx. Başka bir cevapta önerilenden farklı olarak Julius, model gerektirdiği için uygun değildir. Büyük kelime konuşma tanıma için modeller Julius için mevcut değildir.
Ses dosyasını dönüştürmek için pocketsphinx'i kullanabilirsiniz. Bu iki komutun işi yapması gerekiyor. Öncelikle dosyayı istenen formata çevirirsiniz ve sonra bunu tanırsınız:
ffmpeg -i file.mp3 -ar 16000 -ac 1 file.wav
Çalışma pocketsphinx
pocketsphinx_continuous -infile file.wav 2> pocketsphinx.log > result.txt
Sonuç, sonuç.txt dosyasında saklanır.
Ubuntu Yazılım Merkezinizi açmayı deneyebileceğiniz ve Julius
için arama yapabileceğiniz metni metne çevirmeye çalışıyorsunuzAçıklama
"Julius", konuşma ile ilgili araştırmacılar ve geliştiriciler için yüksek performanslı, iki geçişli büyük bir kelime sürekli konuşma tanıma (LVCSR) kod çözücü yazılımıdır.
Yazılım Merkezinde olmayan başka bir seçenek Simon
... açık kaynaklı bir konuşma tanıma programıdır ve fare ile klavyenin yerini alır.
Referans Bağlantıları
Bunun eski olduğunu biliyorum, ancak Nikolay'ın cevabını genişletmek ve gelecekte birilerini kurtarabilmek için, ceplerinizin güncel bir sürümünü almak için github veya sourceforge deposundan derlemeniz gerekiyor. (hangisinin daha güncel tutulduğundan emin değil). Not -j8, mümkünse 8 ayrı işi paralel olarak çalıştırır; Daha fazla işlemci çekirdeği varsa, sayıyı artırabilirsiniz.
git clone https://github.com/cmusphinx/sphinxbase.git
cd sphinxbase
./autogen.sh
./configure
make -j8
make -j8 check
sudo make install
cd ..
git clone https://github.com/cmusphinx/pocketsphinx.git
cd pocketsphinx
./autogen.sh
./configure
make -j8
make -j8 check
sudo make install
cd ..
Ardından: İşte
cmusphinx-en-us-....tar.gz
ve en-70k-....lm.gz
'nin en yeni sürümlerini indirin
tar -xzf cmusphinx-en-us-....tar.gz
gunzip en-70k-....lm.gz
O zaman nihayet Nikolay'ın cevabının adımlarını takip edebilirsiniz:
ffmpeg -i book.mp3 -ar 16000 -ac 1 book.wav
pocketsphinx_continuous -infile book.wav \
-hmm cmusphinx-en-us-8khz-5.2 -lm en-70k-0.2.lm \
2>pocketsphinx.log >book.txt
Sfenks iyi çalışır. Metnin okunabilir bir versiyonunu yapmak için buna güvenmeme gerek yok, ancak belirli bir teklif arıyorsanız, onu arayabileceğiniz kadar iyi. Joker karakterleri kabul eden ve tam arama ifadeleri gerektirmeyen Xapian ( İşte ) gibi bir arama algoritması kullanıyorsanız, bu özellikle işe yarıyor.
Bunun yardımcı olacağını umuyorum.
kullanabilirsiniz speechpad.pw transkripsiyon paneli
transkripsiyon kullanmanın videoyu izleyin
Etiketlerdeki diğer soruları oku software-recommendation speech-recognition