![]() |
|
Noticias del portal de temática general Sólo el staff puede publicar aquí |
«
Tema Anterior
|
Siguiente tema
»
|
Herramientas |
#1
|
||||
|
||||
![]() La IA Grok permite a los usuarios de X crear imágenes sin apenas censura ![]() El 15 de agosto de 2024, la empresa de inteligencia artificial de Elon Musk, xAI, lanzó la versión beta de dos nuevos modelos de lenguaje: Grok-2 y Grok-2 mini. Estos modelos están disponibles para los suscriptores de su plataforma social X y están vinculados con el modelo de síntesis de imágenes Flux. Este modelo permite a los usuarios de X generar imágenes fotorealistas con pocas restricciones, lo que ha generado preocupación por el contenido que se está creando y compartiendo. El modelo Flux, accesible a través de Grok, ha demostrado ser un potente generador de imágenes a partir de texto, pero también ha sido criticado por permitir la creación de imágenes comprometedoras de figuras políticas y contenido potencialmente polémico, sin aplicar marcas de agua identificativas. Pese a que Grok asegura evitar contenido pornográfico o excesivamente violento, las pruebas han mostrado que las salvaguardas son inconsistentes. Además de las capacidades de generación de imágenes, Grok-2 y Grok-2 mini se posicionan como competidores dentro del rango de modelos "clase GPT-4", aunque aún no han superado a GPT-4 en términos de rendimiento. xAI ha presentado a Grok-2 en la Chatbot Arena, donde ha logrado puntuaciones altas en diversas pruebas, aunque persisten controversias sobre la exactitud y relevancia de los resultados. Un punto controvertido es que Grok-2 tiene una fuerte conexión con la plataforma X, lo que lo lleva a extraer información de tweets, a veces irrelevante, para responder preguntas. Esta integración con X podría limitar su precisión y utilidad, generando respuestas incoherentes cuando se basa demasiado en el contenido de la red social. fuente |
|
#2
|
||||
|
||||
![]() |
#4
|
||||
|
||||
Lo suyo es probar Flux, que es la IA que usa para generar imágenes y que es gratuíta, opensource y se puede instaar localmente en tu propio ordenador. Salió hace apenas una semana y ha revolucionado a la comunidad de IAs opensource... Eso sí, para usar el modelo completo (ya sea la versión Dev o la versión Schnell) hacen falta 24 GB de VRAM (es decir, tener una RTX 3090 o una 4090), pero la comunidad ya se las ha arreglado para optimizarla y que se pueda usar incluso en equipos con gráficas con 6/8 GB de VRAM. Esta IA está a un nivel por encima de Midjourney V6 y Dall-e 3 ojo...
|
#5
|
||||
|
||||
Cita:
|
#6
|
||||
|
||||
También se puede probar en varios sitios online, como Tensor.art (este te permite con la suscripción gratuíta hacer 100 imágenes diarias)
|
Gracias de parte de: | ||
#8
|
||||
|
||||
Cita:
![]() ![]() ![]() ![]() Básicamente puede hacer fotos 'cotidianas' muy realistas, imitar todo tipo de medios como una cámara de vigilancia con los correspondientes defectos de imagen, efecto ojo de pez de la lente, etc... hacer imágenes de comida con exáctamente los ingredientes que les indiques, capturas ficticias de videojuegos reales (conoce bastantes) o ficticios, hace las manos perfectas en un 90% de los casos, también reflejos, y otrro punto débil de este tipo de IAs que eran los vehículos que van sobre railes, como trenes, tranvías, etc... Se le pueden escribir prompts muy muy largos y detallados (hay gente haciendo carteles ficticios de películas o anuncios de refrescos, con todos los logos y el texto correcto en un mayor grado que como lo hace Bing), no te censura, y al tener el modelo de la IA a tu alcance, puede ser reentrenado por los usuarios, crear tus propios modelos para introducir un personaje, un concepto nuevo, etc... Son todo ventajas y sin tener que pagar nada. A ver si Bing es capaz de hacer correctamente imágenes como estas: ![]() ![]() ![]() Última edición por sirdrak Día 17/08/24 a las 00:24:00 |
Gracias de parte de: | ||
#9
|
||||
|
||||
Cita:
La de Bing a veces saca muy buenos resultados fotorrealistas, es todo un poco de suerte. Aquí unos ejemplos que hice hace tiempo para trollear los foros (tengo algunas muy fuertes que no voy a poner aquí porque me echarían del foro ![]() - Esta a pesar de la censura de armas, logré sortearla con "air-soft" ![]() ![]() - Esta es de nuestro compi @caraconejo (desde aquí le mando un fuerte abrazo y espero que se recupere pronto): ![]() - Y en algunos casos es menos fotorrealista (en esta soy yo leyendo el foro frente al Capitolio ![]() ![]() |
Gracias de parte de: | ||
#10
|
||||
|
||||
Antes puse varias fotos más pero no las muestra, no sé si será porque están en imgur a lo mejor... Voy a hacer una prueba... Estuve haciendo imágenes como si fueran fotogramas de una peli ficticia de Muerte en el Nilo de Aghata Christie (voy a poner unas cuantas ver si salen y sino probaré otra cosa):
![]() ![]() ![]() ![]() ![]() Edit: Pues parece que el problema es que no muestra imágenes alojadas en imgur por lo que parece... En ese caso podéis verlas en otro foro donde las he puesto también: https://www.darkstone.es/inteligenci...526/#msg568526 Última edición por sirdrak Día 17/08/24 a las 00:41:16 |
Gracias de parte de: | ||
#11
|
||||
|
||||
Cita:
![]() |
Gracias de parte de: | ||
#12
|
||||
|
||||
Por cierto... No he comentado la configuración recomendada para conseguir imágenes de buena calidad con Flux, sobre todo si se usan sitios como Tensor.art que tienen muchas de las opciones que se usan en las instalaciones en local... Es interesante conocerla porque la calidad de las imágenes gana mucho:
- Usar preferentemente el lenguaje natural y prompts cuanto más largos y detallados mejor... Da muy buen resultado pedirle a un LLM (por ejemplo a ChatGPT) que haga el prompt. Además entiende perfectamente el Español. - Las resoluciones recomendadas de imagen son las mismas que con SD XL, preferentemente 1024x1024, 832x1216, 896x1152, 768x1152 que son las más usadas. - Usar prefententemente de Sampler/metodo de sampleado Euser (a secas, no confundir con Euler A) y schreduler/Planificador Simple, normal o Beta (preferentemente el primero). Para ver todas estas opciones en Tensor.art hay que darle a la pestaña Avanzado. - Número de pasos entre 20 y 35. - Clip Encoder el mejor es T5xxl_FP16.safetensors... Flux usa ya un LLM propiamente dicho para interpretar los prompts que le escribimos y por eso es tan bueno siguiendo lo que le pedimos, por lo que es importante usar este siempre que sea posible. - Si se usa Upscale (muy recomendado pues tendremos imágenes de más resolución y además con mas detalles), hacerlo a x2, usando de Upscaler 4x-Ultrasharp, 4x-NMKD-Siax-200k o 4x_NMKD-Superscale-SP-178000-G, etapas de upscaling ente 10 y 20 y Fuerza de Denoising 0.3 |
Respuesta |
![]() |
||||||
|
«
Tema Anterior
|
Siguiente tema
»
|
|
Hora actual: 09:59:58 (GMT +2)
HTCMania: líderes desde el 2007