Web - Amazon

We provide Linux to the World


We support WINRAR [What is this] - [Download .exe file(s) for Windows]

CLASSICISTRANIERI HOME PAGE - YOUTUBE CHANNEL
SITEMAP
Audiobooks by Valerio Di Stefano: Single Download - Complete Download [TAR] [WIM] [ZIP] [RAR] - Alphabetical Download  [TAR] [WIM] [ZIP] [RAR] - Download Instructions

Make a donation: IBAN: IT36M0708677020000000008016 - BIC/SWIFT:  ICRAITRRU60 - VALERIO DI STEFANO or
Privacy Policy Cookie Policy Terms and Conditions
Rozpoznawanie mowy - Wikipedia, wolna encyklopedia

Rozpoznawanie mowy

Z Wikipedii

Zalążek artykułu To jest tylko zalążek artykułu związanego z informatyką. Jeśli potrafisz, rozbuduj go.

Rozpoznawanie mowy to technologia pozwalająca komputerowi wyposażonemu w urządzenie do próbkowania dźwieku (np. karta dźwiękowa z mikrofonem) interpretować mowę ludzką, na przykład, do celów transkrypcji lub jako alternatywna metoda interakcji z komputerem. Wyróżniamy kilka rodzajów rozpoznawania mowy: rozpoznawanie pojedynczych fonemów, rozpoznawanie izolowanych słów, rozpoznawanie łączonych słów oraz rozpoznawanie mowy ciągłej.

Spis treści

[edytuj] Koszty obliczeniowo-pamięciowe

Algorytmy rozpoznawania mowy ciągłej na poziomie zbliżonym do „zdolności ludzkich” wymagają pamięci komputerowej o dużej pojemności[1]. Dlatego też wytwarza się systemy jedno-dziedzinowe, bądź użytkownik ma możliwość dostrojenia parametrów poprzez moduły uczenia maszynowego, w telefonach komórkowych nierzadko stosuje się również wysyłanie wstępnie przetworzonych danych do pomocniczej obróbki na serwerze zewnętrznym[2], niedogodność jest niezauważalna dla użytkownika.

[edytuj] Zastosowania

  • Sterowanie - dedykowane silniki nie wymagają zaawansowanych cech jak przełączanie kontekstu, a z powodu ubogich kilku/kilkunastowyrazowych słowników nie występuje tu problem ujednoznaczniania w środowiskach, w których sygnał mowy jest zakłócony, dlatego też wymagają one znacznie mniej zasobów niż algorytmy rozpoznawania mowy ciągłej.
    • w przypadku komputera PC - posiadającego różnorodne kanały komunikacji z użytkownikiem - sterowanie głosem wykorzystywane jest najczęściej przez osoby niepełnosprawne, dla których inne interfejsy interakcji z urządzeniem są niedostępne,
    • w urządzeniach - o znacznej miniaturyzacji, przez co ubogich w interfejsy interakcji - proste polecenia głosowe znacznie uefektywniają ich obsługę.
  • Transkrypcja mowa ciągła-tekst - algorytmy:
    • dziedzinowe - o ograniczonym słowniku,
    • całościowe - bardziej zaawansowane.

[edytuj] Standaryzacje międzynarodowe

Trwają prace standaryzacyjne jednolitych interfejsów programistycznych (API) oraz języków opisu danych wejściowych dla silników rozpoznawania mowy. Następujące instytucje opracowują własne rozwiązania w tym zakresie, w nawiasach podano numer aktualnej wersji oraz rok wydania.

Microsoft:

Sun Microsystems:

  • JSAPI - interfejs programistyczny (1.0 z r. 1998, wersja 2.0-beta wciąż oczekuje na zatwierdzenie)
  • JSGF - język specyfikacji gramatyki

W3C:

  • PLS - język specyfikacji wymowy (1.0 oczekuje na zatwierdzenie),
  • VoiceXML - język specyfikacji dialogu głosowego człowiek-komputer (2.1 z r. 2007),
  • SISR - język semantycznego znakowania gramatyki (1.0 z r. 2007),
  • SRGS - język specyfikacji gramatyki (oparty na XML lub BNF) (1.0 z r. 2004),
  • SLM(N-gram)S -język specyfikacji stochastyczengo modelu języka (roboczy szkic z r. 2001),
  • NLSML - język specyfikacji interpretacji semantycznej mowy (1.0-beta z r. 2000).

[edytuj] Rozpoznawanie mowy w Polsce

Prace badawcze i wdrożenia:

  • Ogólnopolski projekt[3] prowadzony jest przez, podległe MSWiA, służby bezpieczeństwa publicznego we współpracy z uczelniemi wyższymi[4] w ramach Polskiej Platformy Bezpieczeństwa Wewnętrznego. Przetwarzanie mowy występuje docelowo w dwóch (S3, S8)[5] z ośmiu funkcjonalnych modułów zintegrowanego systemu wsparcia zarządzania bezpieczeństwem i przeciwdziałania przestępczości w Unii Europejskiej,
  • Instytut Monitorowania Mediów[6] [7] wdrożył system umożliwiający wyszukiwanie felietonów na podstawie słów kluczowych.

[edytuj] Produkty dla komputerów PC

[edytuj] Zobacz też

Przypisy

Our "Network":

Project Gutenberg
https://gutenberg.classicistranieri.com

Encyclopaedia Britannica 1911
https://encyclopaediabritannica.classicistranieri.com

Librivox Audiobooks
https://librivox.classicistranieri.com

Linux Distributions
https://old.classicistranieri.com

Magnatune (MP3 Music)
https://magnatune.classicistranieri.com

Static Wikipedia (June 2008)
https://wikipedia.classicistranieri.com

Static Wikipedia (March 2008)
https://wikipedia2007.classicistranieri.com/mar2008/

Static Wikipedia (2007)
https://wikipedia2007.classicistranieri.com

Static Wikipedia (2006)
https://wikipedia2006.classicistranieri.com

Liber Liber
https://liberliber.classicistranieri.com

ZIM Files for Kiwix
https://zim.classicistranieri.com


Other Websites:

Bach - Goldberg Variations
https://www.goldbergvariations.org

Lazarillo de Tormes
https://www.lazarillodetormes.org

Madame Bovary
https://www.madamebovary.org

Il Fu Mattia Pascal
https://www.mattiapascal.it

The Voice in the Desert
https://www.thevoiceinthedesert.org

Confessione d'un amore fascista
https://www.amorefascista.it

Malinverno
https://www.malinverno.org

Debito formativo
https://www.debitoformativo.it

Adina Spire
https://www.adinaspire.com