Administración pública y defensa; seguridad social obligatoria

Asistente virtual para la explotación de datos de auditorías públicas

Administración pública y defensa; seguridad social obligatoria

Asistente virtual para la explotación de datos de auditorías públicas

Business Case

Los documentos de auditoría de cuentas grandes empresas son publicados por las mismas en sus páginas web. También son revisadas por las Administraciones Públicas, Se trata de extensos documentos, con mucha información tabulada pero en formato heterogéneo. Al ser extensos y en formatos diversos, el localizar la información relevante a revisar por el empleado público de la administración supervisora consume mucho tiempo. Se busca reducir este tiempo de supervisión.

Objetivos

Reducir el tiempo que consume a un empleado público la revisión de los documentos de auditoría de cuentas de empresas.

Use case

Dado que el usuario puede formular distintas preguntas sobre el documento revisado, se usa una arquitectura RAG. Esta arquitectura se construye sobre modelos LLM open source tanto no generativos (cálculos de embeddings de los documento) como generativos (respuesta final al usuario).

Infraestructura

On Premise

Tecnologías utilizadas

Tecnologías de IA que generan lenguaje escrito o hablado, imágenes o videos (IA generativa)

Datos utilizados

Dataset constituido por unos 3.000 documentos de auditoría de cuentas de resultados de empresas (documentos públicos).

Recursos utilizados

GPUs para despliegue en inferencia, promt engineering y técnicas de chunking. Científicos de datos, prompt engineer, especialistas en paralelización de modelos sobre nodos de GPU

Dificultades y aprendizaje

Mayor dificultad en controlar las respuestas de los modelos LLMs open source respecto de experiencias similares con LLMs comerciales.

KPIs (impacto en el negocio y métricas del modelo)

Tiempo de revisión de las auditorías

Financiación

No

Colaboradores

No
Scroll al inicio