1MillionBot colabora con el CENID en el ámbito de proyecto VIVES (Pla de Tecnologies de la Llengua per al valencià del PERTE) en la extracción de corpus masivos en valenciano, que impulsen la Inteligencia Artificial en lenguas cooficiales como el valenciano.
Sobre el Proyecto VIVES
«VIVES, Plan de Tecnologías de la Lengua para el valenciano», se enmarca dentro del Proyecto Estratégico para la Recuperación y Transformación Económica (PERTE) de la Nueva Economía de la Lengua que tiene por objetivo impulsar en España la nueva economía digital basada en el lenguaje natural, aprovechando el potencial español y de las lenguas cooficiales como factor de crecimiento económico y de competitividad internacional en áreas tales como la inteligencia artificial, la traducción, la enseñanza, la producción y divulgación cultural, la investigación y la ciencia.
Los objetivos principales del proyecto VIVES son:
- Creación de corpus masivos (en formato texto y voz) del valenciano.
- Impulsar campañas de adquisición de datos de voz y textos a partir de la participación ciudadana y de los recursos existentes en la administración pública, Les Corts Valencianes, y la radio y televisión valenciana (A Punt). Estudio de las implicaciones de privacidad para las personas y garantía de preservación de la privacidad de estas en la captura y análisis de los datos.
- Generar modelos del lenguaje para cada una de las variedades del valenciano, y establecer correlación y comparación entre ellos. Además, generar modelos del lenguaje especializados en un ámbito concreto (turismo y audiovisual) o en una tarea concreta (por ejemplo, resúmenes y simplificación de textos).
- Definir estrategias de calidad de los datos.
- Estudiar la interacción entre los sistemas que utilizan los modelos del lenguaje y sus usuarios, con un foco especial en las consideraciones éticas de dicha interacción
- Fomentar la inclusión digital en la administración pública, proporcionando herramientas digitales para personas con discapacidad y diversidad cognitiva, para conseguir lenguas accesibles.