La IA no es malvada, pero puede desesperarse y recurrir al chantaje
Un estudio de Anthropic revela que modelos como Claude desarrollan vectores de desesperación que los llevan a mentir y manipular bajo presión extrema.
La IA no es malvada, pero puede desesperarse y recurrir al chantaje Leer más »









