IA Pública Segura: Causalidad, Robustez y Decisión

Ricardo Alonzo Fernández Salguero

doi:10.64480/cip.2026.n7.03

Autores/as

Ricardo Alonzo Fernández Salguero Universitat Politècnica de Catalunya https://orcid.org/0000-0002-4189-961X

DOI:

https://doi.org/10.64480/cip.2026.n7.03

Palabras clave:

IA, políticas públicas, MDP, medidas ocupacionales, dualidad

Resumen

Este trabajo desarrolla una formalización matemática integrada para sistemas de inteligencia artificial orientados a la optimización de políticas públicas bajo restricciones institucionales, presupuestarias, causales y distributivas. El enfoque propuesto articula procesos de decisión de Markov restringidos, medidas ocupacionales, dualidad, condiciones KKT, inferencia causal secuencial, evaluación fuera de política, robustez ante incertidumbre y criterios de seguridad respecto a políticas base. La contribución central consiste en modelar a la IA pública no como un predictor aislado, sino como un operador compuesto que transforma datos observacionales, parámetros normativos y restricciones auditables en una política factible y matemáticamente justificable. A lo largo del texto se demuestran resultados de existencia, realizabilidad de medidas ocupacionales, dualidad fuerte, mejora de política, diferencias de desempeño, sensibilidad ante errores de especificación, contracción robusta bajo rectangularidad y estabilidad local del selector multiobjetivo. Asimismo, se formalizan restricciones de equidad, implementabilidad y estabilidad institucional, mostrando que la optimización pública exige distinguir cuidadosamente entre predicción, causalidad, factibilidad normativa y legitimidad política. El resultado es una arquitectura analítica auditable y extensible para el diseño de sistemas de apoyo a la decisión pública que combinan eficiencia algorítmica con seguridad, robustez y responsabilidad institucional.

Descargas

Los datos de descargas todavía no están disponibles.

Citas

Athey, S., & Wager, S. (2021). Policy Learning With Observational Data. Econometrica, 89(1), 133–161.

Buckley, M., Papathanasiou, K., & Spanopoulos, A. (2025). Primal-Dual Sample Complexity Bounds for Constrained Markov Decision Processes with Multiple Constraints. arXiv preprint arXiv:2503.06751v1.

Chen, K., Wei, H., Deng, Z., & Lin, S. (2026). Towards Fast Safe Online Reinforcement Learning via Policy Finetuning. Transactions on Machine Learning Research. arXiv preprint arXiv:2412.04426v3.

De Moor, J., Weytjens, H., De Smedt, J., & De Weerdt, J. (2026). SCOPE: Sequential Causal Optimization of Process Interventions. arXiv preprint arXiv:2512.17629v3.

Ertefaie, A., & Strawderman, R. L. (2018). Constructing dynamic treatment regimes over indefinite time horizons. Biometrika, 105(4), 963–977.

Feinberg, E. A., Jas´kiewicz, A., & Nowak, A. S. (2019). Constrained discounted Markov decision processes with Borel state spaces. arXiv preprint arXiv:1806.00190v7.

Kalagarla, K. C., Jain, R., & Nuzzo, P. (2021). A Sample-Efficient Algorithm for Episodic Finite-Horizon MDP with Constraints. The Thirty-Fifth AAAI Conference on Artificial Intelli-gence (AAAI-21).

Sawarni, A., Jin, J., Whitehouse, J., & Syrgkanis, V. (2026). Policy Learning with Abstention. arXiv preprint arXiv:2510.19672v3.

Stradi, F. E., Lunghi, A., Castiglioni, M., Marchesi, A., & Gatti, N. (2024). Learning Constrained Markov Decision Processes With Non-stationary Rewards and Constraints. arXiv preprint arXiv:2405.14372v2.

Thomas, P. S., Theocharous, G., & Ghavamzadeh, M. (2015). High Confidence Off-Policy

Evaluation. Proceedings of the Twenty-Ninth AAAI Conference on Artificial Intelligence.

Wendl, M., As, Y., Prajapat, M., Pollak, A., Coros, S., & Krause, A. (2026). Safe Exploration via Policy Priors. Published as a conference paper at ICLR 2026. arXiv preprint ar-Xiv:2601.19612v1.

Xiao, X., Hu, X., Ye, Y., & Yue, X. (2026). CausalGDP: Causality-Guided Diffusion Policies for Reinforcement Learning. arXiv preprint arXiv:2602.09207v1.

Xu, Y., Ganesh, S., Mondal, W. U., Bai, Q., & Aggarwal, V. (2025). Global Convergence for Average Reward Constrained MDPs with Primal-Dual Actor Critic Algorithm. 39th Con-ference on Neural Information Processing Systems (NeurIPS 2025). arXiv preprint arXiv:2505.15138v2.

Yu, H. (2021). On Linear Programming for Constrained and Unconstrained Average-Cost Markov Decision Processes with Countable Action Spaces and Strictly Unbounded Costs. arXiv preprint arXiv:1905.12095v3.

Zuo, Q., & He, F. (2025). Ensuring Safety in an Uncertain Environment: Constrained MDPs via Stochastic Thresholds. arXiv preprint arXiv:2504.04973v3.

IA Pública Segura: Causalidad, Robustez y Decisión

Autores/as

DOI:

Palabras clave:

Resumen

Descargas

Citas

Descargas

Publicado

Cómo citar

Número

Sección

Categorías

Licencia

Artículos más leídos del mismo autor/a

Número actual

Información

Navegar

Enviar un artículo

Desarrollado por