Por Galicia Confidencial | Santiago de Compostela | 19/04/2025 | Actualizada ás 10:00
O Validatón 2025 pechou a súa segunda edición cun balance de 10.000 fragmentos de audio revisados e gravados durante a fase en liña que supoñen 13 horas de contribución aos datos de voz en galego en Common Voice: 6 de gravación e 7 de validación. Ademais, na fase presencial celebrada este xoves 10 de abril, os participantes crearon un total de 1920 frases que se engadirán á plataforma para a súa lectura.
A actividade, organizada polo Instituto da Lingua Galega (ILG) e mais o Proxecto Nós, estaba dirixida a estudantes da Facultade de Filoloxía da Universidade de Santiago de Compostela (USC) e premiou a participación en tres categorías: Víctor Pose en gravación de fragmentos de voz, Álex Rodríguez Guisantes en validación de audios e Lucía López Lires en xeración de frases. Tamén foi recoñecida como campioa global Noa Sobrino Lamas por ser a persoa con máis contribucións totais. Todos eles recibiron premios en metálico grazas ao apoio de Atlantic Ponte e Imaxin Software. En total, unha trintena de persoas participaron nesta segunda edición do Validatón
Para adestrar modelos de recoñecemento da fala cómpre utilizar grandes corpus de datos orais, pero a maioría, en especial os que usan as grandes compañías, son datos pechados e non están dispoñibles. Neste sentido, Common Voice, ao ser unha plataforma pública de datos de voz alimentada por persoas voluntarias de todo o mundo, axuda a que as tecnoloxías sexan accesibles para quen as queira desenvolver. As persoas contribúen a Common Voice doando a súa voz e tamén xulgando como válidas ou non as doazóns feitas por outras persoas. Xérase así ese corpus público que permitirá que no futuro distintas aplicacións informáticas poidan comprender as persoas que falen en galego.
OUTRAS POSIBILIDADES DE COLABORAR
Alén do Validatón, os coordinadores do Proxecto Nós lembran que o público xeral tamén pode contribuír a mellorar a presenza do galego no mundo dixital doando a súa voz a través de AgasallaNós. Esta campaña pretende rexistrar diferentes variedades fonéticas do galego para que as aplicacións baseadas no recoñecemento da fala dean identificado toda a riqueza da nosa lingua. O obxectivo é recompilar gravacións que representen diferentes idades, xéneros e variedades dialectais. Toda a información pódese atopar na web doagalego.nos.gal.
Outra iniciativa, reservada ao alumnado de grao da Universidade de Santiago de Compostela, consiste na participación nunha actividade formativa de recollida e validación de datos de voz en galego certificada pola USC como formación a través do recoñecemento dun crédito ECTS.
Se tes problemas ou suxestións escribe a webmaster@galiciaconfidencial.com indicando: sistema operativo, navegador (e versións).
Agradecemos a túa colaboración.