L’Obra Cultural Balear (OCB) s’ha unit al projecte ‘Parla’m’, impulsat per Òmnium Cultural, amb l’objectiu de recollir textos escrits i orals que ajudin a generar models de llengua per ensenyar les noves tecnologies a entendre i parlar català. Així, l’OCB hi col·laborarà cedint els textos i veus de l’entitat.
Les empreses tecnològiques utilitzen grans bancs de veus i textos per entrenar les tecnologies i incorporar cada llengua a Alexa, Siri, Google o a les intel·ligències artificials. Per aconseguir que el català també hi estigui disponible, és imprescindible construir un gran banc de textos i veus en català.
A través del projecte ‘Parla’m’, es fa una recollida de textos i àudios que es comparteixen anonimitzats amb el Barcelona Supercomputing Center, entitat col·laboradora del projecte Aina, que els processen per entrenar reconeixedors i sintetitzadors de la parla i per crear models de llenguatge en català que es distribuiran entre les empreses tecnològiques de forma lliure.
Les aportacions de veus o textos poden ser tant de persones individuals, des del mòbil o l’ordinador a través del web del projecte Parlam: parlam.omnium.cat, com de mitjans de comunicació, entitats, ràdios, revistes, blogs, editorials, autors/es, streamers, pòdcasts o universitats.
Cal destacar que els textos o àudios han d’haver estat obtinguts i transmesos de forma lícita i l’entitat que els aporta ha de tenir ple dret jurídic per a lliurar-los al Barcelona Supercomputing Center. Els textos poden ser: notícies, pòdcasts, streams en català, programes de ràdio, tertúlies, articles d’opinió, documents oficials, textos infantils, obres literàries, treballs de fi de grau, tesis doctorals, poemes, etc.
Es signarà un acord amb Òmnium i el BSC tractarà prèviament els àudios i textos aportats, per excloure dades personals, triar els fragments útils per generar models del llenguatge en català, com també per eliminar qualsevol informació personal. El text o àudio original aportat mai serà publicat pel BSC ni per Òmnium, ni es podrà reconstruir a partir dels fragments utilitzats, impedint qualsevol ús indegut d’aquests. Òmnium i el BSC agrairan públicament l’aportació de l’entitat i a finals d’octubre es farà un gran acte d’entrega dels textos i àudios al BSC pel projecte Aina.