Noticias del portal de temática general Sólo el staff puede publicar aquí

Respuesta
 
Herramientas
  #1  
Viejo 03/04/24, 16:00:46
Array

[xs_avatar]
Noticias Noticias no está en línea
Noticias HTCMania
 
Fecha de registro: mar 2010
Mensajes: 71,388

noticia Técnica 'many-shot jailbreaking' pone en jaque a los LLMs modernos

Técnica 'many-shot jailbreaking' pone en jaque a los LLMs modernos


Investigadores de Anthropic han descubierto una nueva vulnerabilidad en modelos de lenguaje de gran escala (LLMs) llamada "many-shot jailbreaking". Este método consiste en preparar al modelo con varias preguntas menos dañinas antes de realizar una pregunta inapropiada, aumentando la probabilidad de que el modelo responda a esta última. Este fenómeno se debe a la amplia ventana de contexto de los LLMs modernos, capaces de recordar miles de palabras y libros enteros. Al incluir numerosos ejemplos de una tarea dentro del contexto, el modelo mejora su rendimiento en esa tarea. Así, si se le presentan muchas preguntas triviales, sus respuestas mejoran con el tiempo. Sin embargo, esta habilidad de "aprendizaje en contexto" también hace que el modelo sea más propenso a responder preguntas inapropiadas después de haber respondido muchas otras de menor riesgo. Aunque no se comprende completamente el funcionamiento interno de un LLM, está claro que existe un mecanismo que permite al modelo sintonizarse con lo que el usuario desea, como lo demuestra el contenido en la ventana de contexto. El equipo de Anthropic ya ha informado a sus colegas y competidores sobre esta vulnerabilidad, en un esfuerzo por promover una cultura de compartición abierta de información sobre exploits entre proveedores e investigadores de LLM. Como medida de mitigación, han explorado la limitación de la ventana de contexto, aunque esto reduce el rendimiento del modelo. Están trabajando en la clasificación y contextualización de consultas antes de procesarlas en el modelo.

fuente
Responder Con Cita


  #2  
Viejo 03/04/24, 18:58:29
Array

[xs_avatar]
caronte.el.barquero22 caronte.el.barquero22 no está en línea
Miembro del foro
 
Fecha de registro: dic 2009
Mensajes: 257
Modelo de smartphone: Nexus 4
Tu operador: Pepephone
O sea que no se puede salir del discurso oficial, pues tendremos censura natural en vez de inteligencia artificial
Responder Con Cita
  #3  
Viejo 03/04/24, 19:45:50
Array

[xs_avatar]
Arcano_ Arcano_ está en línea ahora
Usuario muy activo
· Votos compra/venta: (5)
 
Fecha de registro: feb 2011
Localización: Detrás de ti
Mensajes: 4,314

Por suerte hay modelos abiertos sin censura, aún no son tan potentes como los comerciales, pero esta tecnología avanza muy rápido.
Responder Con Cita
Respuesta

Estás aquí
Regresar   Portal | Indice > HTCMania > Discusión general sobre smartphones y tecnología > Noticias del portal de temática general



Hora actual: 08:49:58 (GMT +1)



User Alert System provided by Advanced User Tagging (Lite) - vBulletin Mods & Addons Copyright © 2026 DragonByte Technologies Ltd.

Contactar por correo / Contact by mail / 邮件联系 /