Un gran estreno de la IA polaca. Se lanzaron 11 modelos PLLuM

Inteligencia artificial con mejores conocimientos de polaco

Compartido 11 nuevos modelos de la familia PLLuM. Estos son modelos abiertos en idioma polaco, diseñados con… soporte para la administración pública, empresas y usuarios individuales. Este software maneja eficientemente más de 20 tipos de textos administrativos, con un buen conocimiento del idioma oficial. Operan bajo licencias abiertas, totalmente compatibles con los estrictos requisitos de la regulación de la UE. Ley de IA. Se trata del mayor estreno hasta la fecha de modelos PLLuM en condiciones totalmente abiertas.

Más texto debajo del vídeo.

El PLLuM se adapta mejor al contexto jurídico y cultural polaco que los modelos extranjeros. Está abierto y disponible para todos. Actualmente ya se utiliza en asuntos oficiales, conversaciones en mObywatel, así como en muchas empresas y unidades de investigación. Hoy estamos desarrollando una familia de modelos, por lo que me gustaría agradecer a todo el consorcio HIVE.

dijo Dariusz Standerski, Viceministro de Digitalización

La administración pública obtendrá nuevas herramientas

Destacan las nuevas variantes de PLLuM muy buen conocimiento del polaco. Los algoritmos se ocupan del estilo coloquial y oficial. Los modelos interpretan correctamente el contexto cultural, histórico y jurídico polaco. El software puede generar textos oficiales y simplificar este lenguaje formalizado. Estas herramientas respaldan una variedad de tareas operativas de oficina. También pueden trabajar con éxito en plantillas de documentos legales ya preparadas. También comprenden el amplio contexto de los procedimientos administrativos.

Ellos proporcionan respuestas más seguras. Este es el resultado de un análisis exhaustivo de las interacciones reales de los usuarios en la aplicación. Chat de PLLUM. Los algoritmos funcionan de manera eficiente en sistemas basados en la arquitectura RAG.

Queremos que PLLUM sea cada vez mejor y se utilice en más lugares. No solo hemos creado modelos lingüísticos, sino también competencias únicas en el ecosistema polaco de IA.

añadió Szymon Łukasik, director del Centro de Investigación de Seguridad de Inteligencia Artificial de NASK

Cuatro tamaños de software

La familia PLLuM ahora incluye cuatro categorías de peso. El modelo más pequeño 4B Funciona rápidamente y funciona bien incluso con una potencia informática muy limitada. Sin embargo, requiere una adaptación adecuada a la tarea. Versiones 8B y 12B son un compromiso entre rendimiento y calidad. Los creadores los recomiendan para implementaciones de producción. Estos modelos funcionan muy bien como motores en sistemas RAG. El modelo más grande 70B Diseñado para las tareas más complejas. Los hace frente sin necesidad de modificaciones adicionales.

Las variantes 4B, 8B y 12B se prepararon en tres versiones. Los usuarios pueden descargar modelo básico para experimentos. También está disponible modelo de instrucción para tareas seleccionadas y variante de diálogo. Esta última versión tiene incorporado protección contra contenido dañino. El modelo 70B fue desarrollado en una variación. manual y diálogo.

Todo se publicó junto con la extensa documentación requerida por la Ley de IA. Incluye una descripción detallada de los modelos en sí, una lista de fuentes de datos y una discusión sobre los métodos de capacitación y evaluación de la calidad.

Enorme base de datos de formación

El software fue creado como parte de un amplio proyecto. Colmena IAfinalizado en 2025. Dirigió este proceso NASKEn el trabajo también participaron otras instituciones polacas. Este grupo incluía: ACK Cyfronet AGH, Instituto de Fundamentos de Informática de la Academia Polaca de Ciencias y PIB OPI. ellos también ayudaron Instituto de Estudios Eslavos de la Academia Polaca de Ciencias, Universidad de Lodz y Universidad de Ciencia y Tecnología de Wrocław.

El conjunto de datos de entrenamiento era enorme y abarcaba aproximadamente 7 millones de textos en polaco. La información fue seleccionada por su legalidad, calidad y transparencia. Los datos provienen de acuerdos de licencia, recursos Creative Commons y dominio público gratuito. Se les proporcionó documentos de fuentes como: Monitor polaco, Revista de Leyes y transcripciones parlamentarias oficiales.

El entrenamiento previo se basó en un método aprendizaje gradual. Los algoritmos aprendieron primero información simple y luego pasaron a conjuntos de datos más difíciles. Preparados para la fase final de tuning 17,5 mil nuevas instrucciones orgánicas. Este paquete contenía más de 6.000 diálogos de múltiples turnos, que se combinaron con una base de datos del proyecto PLLuM del año pasado de 2024. Gracias a esto, los creadores utilizaron el total para capacitación. aproximadamente 80 mil instrucciones creadas a mano.

Puedes encontrar más información sobre PLLUM en esta dirección.