Saltar al contenido
Hardmaniacos

Alia, el ChatGPT español, desarrollado por el gobierno de España

08/05/2025
Supercomputador MareNostrum, Alia portada

El presidente del Gobierno español, Pedro Sánchez, ha anunciado la puesta a disposición de todos los usuarios de los primeros modelos de Alia, una inteligencia artificial pública en castellano y lenguas cooficiales diseñada con código abierto.

Fue durante el Mobile World Congress de Barcelona de 2024 que el Gobierno anunció la creación de Alia, y ahora Sánchez ha avanzado la activación de esa IA y también la movilización de 150 millones de euros para potenciar el uso de la inteligencia artificial en las empresas españolas, 20 de ellos dirigidos a pymes.

Alia es una iniciativa pionera en la Unión Europea que busca proporcionar una infraestructura pública de recursos de IA, con modelos de lenguaje abiertos y transparentes, para fomentar el impulso del castellano y lenguas cooficiales -catalán y valenciano, euskera y gallego- en el desarrollo y despliegue de la IA en el mundo. Se trata del primer modelo de inteligencia artificial de lenguaje natural que trabajará directamente en español y en las lenguas cooficiales del Estado, sin traducirlas desde otra lengua base.

Su objetivo es que este programa “se constituya como infraestructura abierta, pública y transparente, de forma que pueda ser la base de futuros servicios y aplicaciones avanzadas en tecnologías del lenguaje”, detallan desde el Ministerio de Transición Digital.

Este ChatGPT español fue concebido en los circuitos del MareNostrum V, el supercomputador inaugurado a finales de 2023 en el Centro Nacional de Supercomputación de Barcelona. Para llevarlo a cabo, el Gobierno ha llegado a un acuerdo con IBM para que esta proporcione el software y la metodología de entrenamiento. La multinacional estadounidense es conocida por su apuesta por la inteligencia artificial de código abierto y de modelos sectoriales, especializados en campos específicos, dos características que Moncloa quiere que marquen el desarrollo de Alia.

El entrenamiento y despliegue de la IA generativa requiere de una enorme capacidad de procesamiento computacional. En el caso del entrenamiento de la familia de modelos Alia, el procesamiento de varios miles de millones de palabras necesita del uso de miles de horas de MareNostrum V, la quinta generación de la saga MareNostrum, capaz de acelerar la ciencia y la tecnología a una velocidad de 314.000 billones de cálculos por segundo.

Así pues, el proyecto de Alia está coordinado por el Barcelona Supercomputing Center-Centro Nacional de Supercomputación (BSC-CNS), con el impulso y liderazgo de la Secretaría de Estado de Digitalización e Inteligencia Artificial; y financiado por el consorcio de supercomputación de la Unión Europea, la EuroHPC Joint Undertaking (EuroHPC JU), España -a través del Ministerio de Ciencia, Innovación y Universidades y la Generalitat de Cataluña-, Turquía y Portugal. Asimismo, cuenta con financiación 100% pública para dar servicio de interés público a la ciudadanía, la administración pública, las universidades y las empresas, garantizando el acceso universal en beneficio de toda la sociedad

Alia forma parte de la Estrategia de Inteligencia Artificial 2024, puesta en marcha por el Gobierno de España. Cuenta con la verificación de la Agencia Española de Supervisión de la Inteligencia Artificial (AESIA) y está alineada con los estándares de transparencia que establece el Reglamento de IA, así como con el programa de la Década Digital de la Unión Europea, que guía la transformación digital de Europa y su soberanía tecnológica.

Alia también constituye uno de los ocho ejes en los que se articula la estrategia nacional de inteligencia artificial (IA), aprobada en Consejo de Ministros. Este es el resumen de sus puntos clave:

  • Supercomputación

Los modelos de lenguaje, en los que se basan las aplicaciones de inteligencia artificial generativa, requieren un considerable esfuerzo de supercomputación”, expuso el ministro para la Transformación Digital y de la Función Pública, José Luis Escrivá.

España está bien preparada en este sentido, porque dispone de uno de los supercomputadores más potentes del mundo, el del Centro Nacional de Supercomputación de Barcelona, que el Gobierno reforzará con una inversión de 90 millones de euros. El objetivo es mejorar la capacidad del MareNostrum V para poder extender su uso y que sean más las empresas que recurran a él para realizar ensayos experimentales relacionados con la IA.

Además, el Ejecutivo se ha comprometido a fortalecer la red española de supercomputación que se extiende por todo el territorio.

  • Sostenibilidad

Al Gobierno español le preocupa la enorme cantidad de energía y agua que van a consumir todos los centros de procesamiento de datos que se crearán en los próximos años.

“Estamos trabajando con el Ministerio de Transición Ecológica en un marco regulatorio que, de acuerdo con la directiva europea de eficiencia energética, establezca estándares de sostenibilidad y que, además, ayude a ordenar la implantación de estos centros a lo largo del territorio”, avanzó Escrivá.

  • Modelo propio

España ha decidido tener un modelo propio en esta primera etapa de desarrollo de la IA fundamentalmente por dos razones: porque es importante que esté lo suficientemente entrenado en castellano y en las lenguas cooficiales, y porque debe hacerse con elevados estándares de transparencia y apertura; y ninguna de estas dos condiciones se dan a día de hoy en los modelos disponibles.

  • Becas para el talento español

El Gobierno de España destinará 160 millones a becas y formación especializada en inteligencia artificial.

“Ya se han creado cátedras y centros de investigación. Ahora el esfuerzo se dirigirá a que esa semilla trabaje en red, se oriente hacia aplicaciones específicas que sean de interés y focalice el esfuerzo en la dirección correcta —manifestó el ministro—. Queremos atraer talento y desarrollar posgrados en ámbitos relacionados con la IA, porque va a ser escaso en los próximos años y hay que posicionar al país, disponiendo de especialistas en este sentido”.

  • La IA en el sector público

El Gobierno cree que en la Administración se dan las condiciones óptimas para implementar casos de uso y ejecutar programas pilotos, para comprobar el potencial de la IA controlando al mismo tiempo sus riesgos. Así, priorizará el uso de Alia en el sector público y desarrollará una norma que regule el uso de los datos, para que haya garantías de seguridad e interoperabilidad.

  • Ampliación del Kit Digital en las empresas privadas

El Ejecutivo reforzará las nuevas convocatorias del Kit Digital con más de 600 millones de euros, que se destinarán a mejorar los paquetes con soluciones digitales relacionadas con la IA y a ampliar su alcance, extendiéndolo a empresas más pequeñas y autónomos.

  • Ciberseguridad

La inteligencia artificial puede usarse bien o puede usarse mal, por lo que requiere reforzar la seguridad.

“Hace falta una ley integral que no solo responda a los ciberataques, sino que ponga además el énfasis en la anticipación de posibles problemas, en el desarrollo de profesionales y talentos para ello”, advirtió José Luis Escrivá.

  • Ética

De acuerdo con el reglamento europeo, el Gobierno de España desplegará la Agencia Española de Supervisión de la IA (Aesia), que tendrá una labor fundamental de difusión y pedagogía.

“Entre todos, como sociedad, tenemos que decidir dónde ponemos los límites a partir de los cuales determinadas decisiones las debemos tomar los humanos y no las máquinas”, dijo el ministro.

el Presidente del Gobierno Español Pedro Sáncehz presentando la IA Alia

Por otro lado, cabe señalar que, como explicó en su momento el presidente del Gobierno, detrás de todas las respuestas que dan los chatbots a pesar de que están en español, el porcentaje de recursos en inglés alcanza hasta el 90% en muchos de los sistemas actuales, es decir, son entrenados mayoritariamente con documentos e información escrita en inglés, y tan solo un 10% en otros idiomas, entre los que está el español. Esto significa que la IA traduce tu pregunta al inglés, busca la información en inglés, te resume lo que buscas en el mismo idioma, y luego te traduce la respuesta al español. Por tanto, las contestaciones están sesgadas al inglés y, en muchas ocasiones, las respuestas contienen errores o no son del todo exactas debido a sus limitaciones de conocimiento de nuestra cultura e idioma.

En este sentido la IA Alia será todavía más precisa en sus contestaciones y, por lo tanto, sus usos serán muchos más beneficiosos para aquellos usuarios que hablen español, al aportar el enfoque exacto que un hispanohablante le ha dado.

Su impacto ya se va a poder ver y con la reciente activación de Alia se ponen en marcha también los trabajos para aplicarla en dos proyectos piloto: uno para agilizar el trabajo de la Agencia Tributaria y otro para mejorar el diagnóstico de las insuficiencias cardiacas en la Atención Primaria.

Por otra parte, Eric Delgado, director de Ingeniería de Clientes de IBM en España, Portugal, Grecia e Israel, indicó que “hay algunas diferencias fundamentales entre ChatGPT y el modelo que está el Gobierno español planeando”. La primera es la ya citada, mientras la creación de OpenAI fue entrenada en muchos idiomas, el proyecto Alia se especializará en el español, lo que optimizará su rendimiento en este idioma.

La segunda diferencia, serán los datos con los que será entrenado el proyecto Alia, uno de los problemas de los modelos de IA más populares de las multinacionales estadounidenses que usaron un método de entrenamiento “a lo bruto”: chupar todos los textos que encontraron en Internet. “ChatGPT está entrenado con todo lo que hay en Internet, todo lo bueno, todo lo malo y todo lo de en medio”, sigue Delgado.

“La intención del Gobierno español es crear un modelo que esté entrenado solamente con datos de muchísima calidad, por lo tanto, va a acudir a fuentes a las que tiene acceso, como bibliotecas nacionales, etcétera. Eso va a hacer que sea un modelo ya no solamente entrenado solo en español, sino con unos datos de muy alta calidad que harán que el comportamiento de este modelo sea mucho mejor que el de cualquier otro”, asegura.

Los comentarios en redes sociales y foros quedarán, por tanto, fuera. “Se proporcionarán al modelo diversas fuentes documentales, por ejemplo, bases de datos de dominio público, como por ejemplo el Boletín Oficial del Estado o el Diario de Sesiones del Congreso”, confirman desde el Ministerio que dirige Escrivá. “Para desarrollar un modelo de lenguaje en español y lenguas cooficiales que cumpla estándares de calidad, debe estar basado en corpus de entidad suficiente, fiable y relevante”, argumentan las mismas fuentes.

Asimismo, también evitará otro tipo de problemas que están enfrentando empresas como OpenAI por usar sus textos sin permiso. Así pues, Alia tomará un enfoque diferente, puesto que su base de datos de entrenamiento sí será abierta y transparente. No solo por cuestiones legales, sino para permitir que otras instituciones como universidades o colegios de profesionales puedan ofrecer sus propias bases de datos.

Además, “otros actores interesados en colaborar, con los que se están firmando acuerdos de colaboración, tanto organismos públicos como empresas privadas, participarán en fases concretas en las que sus aportaciones puedan ser útiles. Es el caso de la instalación en servidores para proporcionar servicios desde la nube, por ejemplo, o la aportación de corpus de dominio concreto”, afirman en Transición Digital.

“La idea del Gobierno español es que este sea un modelo en el cual todo el mundo pueda participar a la hora de contribuir con conocimientos de cada ámbito”, añade Delgado. “La idea original es que haya un modelo base bastante grande como primera versión, que se pueda ir especializando en distintos dominios. Que aprenda por ejemplo el lenguaje jurídico, que es muy especial, leyendo sentencias”.

Fuentes: Alia, elEconomista.es y La Voz de Galicia

Alia, el ChatGPT español, desarrollado por el gobierno de España
Nombre del artículo
Alia, el ChatGPT español, desarrollado por el gobierno de España
Descripción
El presidente del Gobierno español, Pedro Sánchez, ha anunciado la puesta a disposición de todos los usuarios de los primeros modelos de Alia, una inteligencia artificial pública en castellano y lenguas cooficiales diseñada con código abierto.
Autor
Web
Hardmaniacos
Logo
OSZAR »