Administración pública y defensa; seguridad social obligatoria
Asistente virtual para la explotación de datos de auditorías públicas
Administración pública y defensa; seguridad social obligatoria
Asistente virtual para la explotación de datos de auditorías públicas
Business Case
Los documentos de auditoría de cuentas grandes empresas son publicados por las mismas en sus páginas web. También son revisadas por las Administraciones Públicas, Se trata de extensos documentos, con mucha información tabulada pero en formato heterogéneo. Al ser extensos y en formatos diversos, el localizar la información relevante a revisar por el empleado público de la administración supervisora consume mucho tiempo. Se busca reducir este tiempo de supervisión.
Objetivos
Reducir el tiempo que consume a un empleado público la revisión de los documentos de auditoría de cuentas de empresas.
Use case
Dado que el usuario puede formular distintas preguntas sobre el documento revisado, se usa una arquitectura RAG. Esta arquitectura se construye sobre modelos LLM open source tanto no generativos (cálculos de embeddings de los documento) como generativos (respuesta final al usuario).
Infraestructura
On Premise
Tecnologías utilizadas
Tecnologías de IA que generan lenguaje escrito o hablado, imágenes o videos (IA generativa)
Datos utilizados
Dataset constituido por unos 3.000 documentos de auditoría de cuentas de resultados de empresas (documentos públicos).
Recursos utilizados
GPUs para despliegue en inferencia, promt engineering y técnicas de chunking. Científicos de datos, prompt engineer, especialistas en paralelización de modelos sobre nodos de GPU
Dificultades y aprendizaje
Mayor dificultad en controlar las respuestas de los modelos LLMs open source respecto de experiencias similares con LLMs comerciales.
KPIs (impacto en el negocio y métricas del modelo)
Tiempo de revisión de las auditorías
Financiación
No
Colaboradores
No