Konuşma tanıma uygulaması metin MP3 dönüştürmek için?

21

Ses dosyalarını metne dönüştürebilen bir uygulama bilen var mı? 12.04 LTS ubuntu koşuyorum.

    
sordu Kopano 09.07.2012 13:33

4 cevap

16

Kullanabileceğiniz yazılım CMUSphinx. Başka bir cevapta önerilenden farklı olarak Julius, model gerektirdiği için uygun değildir. Büyük kelime konuşma tanıma için modeller Julius için mevcut değildir.

Ses dosyasını dönüştürmek için pocketsphinx'i kullanabilirsiniz. Bu iki komutun işi yapması gerekiyor. Öncelikle dosyayı istenen formata çevirirsiniz ve sonra bunu tanırsınız:

ffmpeg -i file.mp3 -ar 16000 -ac 1 file.wav

Çalışma pocketsphinx

pocketsphinx_continuous -infile file.wav 2> pocketsphinx.log > result.txt

Sonuç, sonuç.txt dosyasında saklanır.

    
verilen cevap Nikolay Shmyrev 20.02.2014 21:24
9

Ubuntu Yazılım Merkezinizi açmayı deneyebileceğiniz ve Julius

için arama yapabileceğiniz metni metne çevirmeye çalışıyorsunuz

Açıklama

  

"Julius", konuşma ile ilgili araştırmacılar ve geliştiriciler için yüksek performanslı, iki geçişli büyük bir kelime sürekli konuşma tanıma (LVCSR) kod çözücü yazılımıdır.

Yazılım Merkezinde olmayan başka bir seçenek Simon

  

... açık kaynaklı bir konuşma tanıma programıdır ve fare ile klavyenin yerini alır.

Referans Bağlantıları

İşte

İşte

İşte

    
verilen cevap CoalaWeb 09.07.2012 13:54
9

Bunun eski olduğunu biliyorum, ancak Nikolay'ın cevabını genişletmek ve gelecekte birilerini kurtarabilmek için, ceplerinizin güncel bir sürümünü almak için github veya sourceforge deposundan derlemeniz gerekiyor. (hangisinin daha güncel tutulduğundan emin değil). Not -j8, mümkünse 8 ayrı işi paralel olarak çalıştırır; Daha fazla işlemci çekirdeği varsa, sayıyı artırabilirsiniz.

git clone https://github.com/cmusphinx/sphinxbase.git
cd sphinxbase
./autogen.sh
./configure
make -j8
make -j8 check
sudo make install
cd ..
git clone https://github.com/cmusphinx/pocketsphinx.git
cd pocketsphinx
./autogen.sh
./configure
make -j8
make -j8 check
sudo make install
cd ..

Ardından: İşte cmusphinx-en-us-....tar.gz ve en-70k-....lm.gz 'nin en yeni sürümlerini indirin

tar -xzf cmusphinx-en-us-....tar.gz
gunzip en-70k-....lm.gz

O zaman nihayet Nikolay'ın cevabının adımlarını takip edebilirsiniz:

ffmpeg -i book.mp3 -ar 16000 -ac 1 book.wav
pocketsphinx_continuous -infile book.wav \
    -hmm cmusphinx-en-us-8khz-5.2 -lm en-70k-0.2.lm \
    2>pocketsphinx.log >book.txt

Sfenks iyi çalışır. Metnin okunabilir bir versiyonunu yapmak için buna güvenmeme gerek yok, ancak belirli bir teklif arıyorsanız, onu arayabileceğiniz kadar iyi. Joker karakterleri kabul eden ve tam arama ifadeleri gerektirmeyen Xapian ( İşte ) gibi bir arama algoritması kullanıyorsanız, bu özellikle işe yarıyor.

Bunun yardımcı olacağını umuyorum.

    
verilen cevap Jonathan Perry-Houts 25.04.2017 07:01
1

kullanabilirsiniz speechpad.pw transkripsiyon paneli

transkripsiyon kullanmanın videoyu izleyin

    
verilen cevap alexei 10.07.2016 22:37

Etiketlerdeki diğer soruları oku