Nov 5, 2020

Reconeixement de la parla; eficient, segur i privat: Una introducció a Kaldi i Vosk



Hi ha diverses maneres d’interactuar amb els nostres dispositius, una d’aquestes és mitjançat la parla. Amb aquesta sessió de les «jornades de tecnologies lingüístiques lliures en català», ens enfocarem en un altre ingredient molt important d’aquesta funcionalitat, el reconeixement de la parla (RAP).

La dependència als serveis de RAP de les empreses grans (Google Speech API, WIT de Facebook, Watson Text to Speech d’IBM), no només impacta negativament la privacitat de l’usuari final, sinó també implica un cost per a les innovadores i emprenedores. En aquesta sessió, donarem el coneixement necessari per desplegar sistemes d’estat d’art de RAP als nostres servidors o directament als dispositius personals. Específicament, parlarem de les tecnologies de DeepSpeech i Kaldi, que actualment són sistemes de RAP més avançats del sector, i entrarem als detalls de com fer servir Kaldi per diversos casos d’ús.


3 de Desembre 18:00-20:00

La sessió serà en-linia i es connectarà mitjançant l’enllaç enviat amb la confirmació de la inscripció.


Dirigit a:

Aquesta activitat està dissenyada per les persones amb un perfil tecnològic, i les persones que volen formar part de la comunitat per donar suport als projectes de programari lliure. Els exemples concrets d’implementació que explicarem seran en Python.

Objectius:

Durant aquesta sessió especialitzada es tractarà:

  • els fonaments dels sistemes de reconeixement de la parla (RAP)
  • les tecnologies lliures concretes de DeepSpeech i Kaldi i com integrar-les als productes tecnològics
  • els components necessaris per modificar i construir els models personalitzats d’aquestes tecnologies
  • els exemples de desplegament de Kaldi mitjançant el «framework» Vosk, i la seva versió de web assembly enfocant en els casos d’ús privats
  • com millorar aquestes tecnologies i donar suport sobretot per respondre a les necessitats del territori

Durada:

2 hores (18:00 – 20:00)

Idioma:

Català

Preu:

Gratuït. Aquests tallers tenen el suport del Departament de la Cultura.

Programa:

Presentació (60 minuts) Debat i preguntes (20 minuts) Co-creació i intercooperació (40 minuts)

Després de la introducció dels conceptes rellevants, la sessió seguirà amb els detalls profunds i els exemples reals del contingut presentat. La sessió acabarà amb un debat obert sobre les necessitats del territori i projectes de programari lliure.

Imparteix:

  • Baybars Kulebi: Enginyer de dades amb experiència especialitzada en l’àmbit lingüístic, desenvolupador de Catotron.
  • Ciaran O’Reilly (ccoreilly): Desenvolupador de la comunitat de programari lliure, contribuïdor als projectes de reconeixement de la parla.

Com apuntar-se:

Us agraïm si podeu confirmar l’assistència omplint aquest formulari. Abans de l’activitat us passarem tota la informació i les dades pertinents.