Análisis de GPT-4V | ¡La VISIÓN ya ha llegado a ChatGPT!
Vložit
- čas přidán 24. 07. 2024
- GPT-4 ha evolucionado y se convierte en el modelo de visión más potente jamás creado. Hoy vamos a explorar algunas de sus capacidades de este nuevo modelo tan potente de OpenAI. ¿Es lo mismo GPT-4V que ChatGPT?
📰 LINKS INTERESANTES
► Microsoft- The Dawn of LMMs (Paper)
arxiv.org/pdf/2309.17421.pdf
► LLAVA - Multimodal open source (Web)
llava-vl.github.io/
📹 EDICIÓN: Carlos Santana y Diego Gonzalez (Diocho)
-- ¡MÁS DOTCSV! ---
📣 DotCSV Lab: / notcsv
💸 Patreon : / dotcsv
👓 Facebook : / ai.dotcsv
👾 Twitch!!! : / dotcsv
🐥 Twitter : / dotcsv
📸 Instagram : / dotcsv
- ¡MÁS CIENCIA! --
🔬 Este canal forma parte de la red de divulgación de SCENIO. Si quieres conocer otros fantásticos proyectos de divulgación entra aquí:
scenio.es/colaboradores - Věda a technologie
🚨¿Has visto lo último de Adobe? 🚨 Su último modelo genera imágenes MUY REALES! Y lo he probado 👉 czcams.com/video/th-zzywKKfY/video.html 👈
claro esta de lujo, compartir conocimiento es increible, gracias, yo tanbien lo hago, muchos lo hacemos, asi ayudamos al mundo a actualizarse y no quedar estancado con el nuevo futuro
-cabe resaltar que chatgpt 4 vision, falla en temas de acertijos, laberintos un poco simples, y falla en patrones formando una figura, pero en lo tros, es una tecnologia alucinante y la vision mas avanzada sin esos errores
@@lista_devideos_cursoscompl1338no
czcams.com/video/U8Oj0psMaCs/video.html
Dot: No confundan LMM con LLM
Also Dot: 3:31 LLM = Large Multimodal Model
me acabo de dar cuenta bro jajajajjaa
JAJAJAJAJAJJAJA
le mostré la imagen a chatGPT y no se dio cuenta. Tuve que señalárselo
Hasta el editor se revolvió 😅😅
El editor estaba dormido, al igual que la imagen del panda que puso dos veces la misma y no pude encontrar las diferencias 😂
Eres un divulgador cojonudo. Acercar conocimiento complejo al gran público es una gran labor. Sigue asi
18:16 lo de llamarle "experto" para q cuente bien me ha recordado a un relato corto de Asimov. En el tenían un problema grave con una IA que no hacía una cosa q les pedían los humanos y ponía en riesgo a la población. Buscaban el fallo por todos lados (incluso si había algún problema de hardware) pero no daban con él. Uno de los programadores decide acabar la secuencia de órdenes con un "por favor" y realiza la acción del tirón. La IA empezaba a tener emociones humanas.
Si que raro, es como adular para obtener algo a cambio. Veo en eso que se comporta de acuerdo a la intención superflua de una pregunta.
Pues es porque la gente le habla así y va aprendiendo jajaja
Muchas gracias Carlos, estoy más que seguro que tu canal llegué a muchos mas que el millón.
como digo , en esta epoca ya nadie , ocasi no existe excusa de poder estudiar, o realizar un projecto, no importa chiquito, pero todos podemos, no quiero engoblar a todos, ya que algunos pasan problemas extremos, igual los pase de pequeño, solo sin nadie, encima estuve literalmente sordo durante 7 años, gracias a dios y a mi esfuerzo , espero algunos que esten tristes, sepan que ahora nosotros podemos lograr todo, dot csv es un ejemplo.
en el 4:21, yo use claude y bing 4 apra resumir los 10 puntos claves mas lava uqe dice el grafico, ya que no tengo gpt 4 ,en mi pais es super caro, casi 6 veces mas en españa, pero igualmente se obtiene los mismos resultados,
se que el pais es un conflicto enorme en donde vives, pero se puede, 1 mega de internet es suficiente para cambiar tu vida.
Muy interesante. Estaría bueno un vídeo sobre los ResNet e incluso cosas mas exóticas como las redes neuronales líquidas y/o GLOM.
Para mi campo puede ser tremendo. Soy fotoperiodista y le veo muchísimas posibilidades. Algo tan sencillo como pedirle un listado de los diputados que salen en una foto del Congreso puede ser una tarea que consume mucho tiempo si son diputados poco conocidos. También esta genial para hacer descripciones precisas de una foto para el pie, ya que cuando estás todo el día metiendo pies de foto tu cabeza no da más de si y al final acabas escribiendo: guerra de Gaza a secas, e ignoras los mil matices de la foto. Y muy interesante ver si es capaz de identificar personas y lugares en fotos antiguas. Tengo compañeros que están digitalizando fotos muy viejas y algunas se están quedando en el tintero porque no tenemos ni idea de quien sale (que puede ser un alcalde de un pueblo de Burgos en 1948) o donde es o que estamos viendo. Me da un poco de miedo que los editores del día a día se queden sin curro pero para mejorar la eficiencia va a ser una herramienta poderosa.
No te preocupes, OpenAI se encargó de que no puedas hacer eso, xd
No hacia falta ser tan cruel :D @@Crasterius
@@CrasteriusEs por privacidad, lo mismo cuando buscas información de alguien. Tampoco te la va a decir, aunque la conozca.
Hacen mucho ruido con Open AI pero el Bard de Google es superior y gratis. Lo usé para un tema de fisiopatología de Lyssavirus y respondió muy bien, mientras el otro no pudo hacer nada.
@@bleachholowbankai Ese se equivoca más, por eso pone tres resultados jajaja
Impresionante, me encantó que hayas puesto todas las contras, mejoras que faltan, etc. Muy buen informe!
Saludos desde Argentina
Hay un error en el minuto 3:32, deberia de ser LMM (large multimodal model) y sale LLM (Large lenguage model)
Irónico 😅
No hay canal que de mejor info de AI que este.. Gracias brother!
que investigacion tan buena y extensa!! gracias! una sugerencia que te iba a dar , es que puedes tomar este video y hacer micro clips tipo shorts o reels para compartirlo a amigos mostrando esos mini demos de lo que se puede hacer, lo digo porque a mi me gusta ver estos videos largos pero se que muchos amigos no ven todo el contenido a menos que sea super corto! SALUDOS!
tus videos siempre son increíbles, buena información, datos fiables, todo muy de alta calidad.. .. gracias.. mil gracias..
Hola! Amo tu canal! Soy arquitecta y me encantaría que hablaras de cómo está mega industrial se va a ver afectada, hay millones de arquitectos que ahora hacen dibujos y detalles técnico que se que fácilmente se pueden hacer con una ai. Yo tengo un Máster en programación aplicando al BIM pero ahora estoy interesada en crear inteligencias artificiales que hagan los planos constructivos, es una tarea fácil para una AI, hay un gran negocio en eso y e aun nicho no muy explorado.
Estudia matemáticas o actuaría para poder trabajar en el desarrollo de modelos avanzados, luego un máster y doctorado
Es un camino muy largo para poder llegar a ello
Imagina el Autocad con IA, que le des un prompt y ya te genere la casa jaja, creo que no estamos muy lejos de que eso pase
@@wz_alex9798Nah todo eso lo va a hacer la IA lol
@@EolosMusic no des ideas a los open source, que se puede, imaginate yo, pude crear un juego procedural a base de prompts, edificios pero ya prefabricados, imagintate ellos.
Yo recién soy egresado de Ing civil y aunque aun no tengo mucho conocimiento pero estoy muy pendiente de todo lo que sale sobre IA y buscó la manera de implementarlo en mi carrera
Muchas gracias de verdad por el video, contenido de calidad como siempre!!!, no puedo guardar el video en alguna playlist de mi biblioteca privada, vale la pena verlo y leer todo el trabajo :(
Me parece un contenido excelente, muy útil e inspirador. suscrito desde hace tiempo, la mejor decisión tomada.
Muchas gracias Dot CSV, es impresionante y lo explicas super bien!
flipante y más, la brillante exposición
gracias y a seguir DotcSV.
Te felicito porque realmente nos abres caminos todo el tiempo hacia un futuro que suena impredecible. Gracias !
Lo he usado para diagnosticar una planta que tengo enviandole fotos de diferentes angulos y funciono genial!
Buena idea
y que diagnosticó?
@@XaviIntheHouse que te alejes de esa Yerba 😂
me encato el reseumen!, estare atento a mas contenido.
aprecio mucho tu tiempo dedicado para leerte todas las paginas de microsoft, me encanto tu video, un abrazo desde argentina! :)
Creo que si hicieras un video de mas o menos como openAI toma tantos tantísimos datos para estos modelos, lo digo por mi pero se me hace impresionante no solo el modelo pero el trabajo detrás de este al momento de recolectar información
Muchas gracias. Excelente información.
😮 un avance tremendo, no hay límites parece. Gracias por darnos a conocer esta tecnología
Lo usaré para predicciones de costos en estimaciones de renovación y también interpretaciones de fotografías de cámara térmica para problemas relacionados con siniestros de agua y fuego más o menos ya lo he estado usando y me está dando buenos resultados. Espero la API. Gracias por tu contenido. 1000 gracias
Excelente video Carlos. Un abrazo.
Excelente video, muchas gracias !!
Que soy experto? Ahhhh vale, así sí sé contar😂qué divertido
Qué maravilla de explicación. Suscrito
Excelente y breve! Gracias.
Excelente video muy completo entretenido y un guion exquisito...
la edicion de este canal es hermosa
y eso que ahora no es ni la mitad de buena que era hace 2 años.
Gracias por tu trabajo, tu canal es referencial. ¿Podrías hacer un video sobre la "consistencia" para poder hacer video generado por IA manteniendo los personajes?.
Suscrita!!
Me tiene loca este canal. 🤓🤓
Estaría muy interesante que también dedicases una parte de tus videos a los avances de la comunidad Open Source
Muy buen contenido, como siempre.
Pq sera que la gente pide y pide contenido y pide y pide mas videos. Grande CCsv
Gran contenido!!! Gracias🔥🔥
Me hubiera encantado conocerte en México ahora que viniste! he aprendido mucho contigo y tus videos, eres un excelente maestro! gracias por compartir tus conocimientos
sos un animal 💪, excelente video
3:32 Nos pides que no nos equivoquemos con LLM y LMM y eres el primero que te equivocas en la edicion de este vide! 😅
Excelente video. Saludos
Eres un crack, Carlos. Mis dieses.
Yo pensaba en subirle imágenes de mis últimos tickets de compra en mi súper habitual y que me diga la evolución de precios de los diferentes productos con el tiempo. A ver si funciona :)
Carlos muy bueno el artículo. Consulta: ya se liberó el API (o la funcionalidad) para probarlo?? Gracias super bueno
Excelente trabajo Excelente análisis. Eres el mejor del mundo IA. Saludos desde Houston, Texas.USA
Gracias por la info
11:02 el futbolista "laionel" Messi xD
Esto con las nuevas gafas de Meta y Rayban ha de ser alucinante. Menudo futuro nos espera.
Por cierto, entiendo que la limitacion de no nombrar a personas es limitación propia de OpenAI ya que el modelo según lo que dices en el 10:54 sí que es capaz. Verdad?
Gran vídeo, como siempre!
Una pregunta, ¿también acepta vídeos y los interpreta?
Dot Soy el chaval con el pelo largo recogido, (que iba con unas pintas lamentables xd) que fue a hablar contigo el primero nada más acabaste la charla en Ciudad Real en la ESI. Espero que se te hiciera ameno el día con los profesores 😂. Se me pasó preguntarte al final cosas para la empresa y me medio echaron la bronca xd
Gracias. El mejor canal de CZcams
Impresionante cómo avanza todo en tan poco tiempo!!
Wow dejas de ver los avances un par de semanas y 💥 el ChatGPT q ya puede “ver” es compartido!
En los ejemplos de ajustar el pront para contar o decir la velocidad…. Mmm parece más que es aleatoria la respuesta … como sea es impresionante, muchas gracias por el video 🎉
yo subo imagenes y le pido que me de un prompt para reproducirla en dall-e, los prompts son bastante descriptivos y la version que sale suele tener los conceptos de la imagen original pero reinterpretados de formas totalmente distintas
supongo que en algun momento me activaran el generador de imagenes para poder hacerlo directamente todo en gpt4 sin tener que pasar el prompt de una IA a otra
Es como parafrasear para escribir un artículo 😂
Stable diffusion tiene un plugin para sacar prompts de imágenes de una página de dibujos, osea es dall e pero local y sin censura
Pues yo soy ingeniero DevOps y veo mucha utilidad para emplearlo como un tutor dedicado para entrenarme en la solución de problemas
Hay que saber diferenciar ente LLM y LLM😝. Grande Carlos eres un autentico maquina, gracias por todos tus videos!
Saludos y gracias.
Está realmente alucinante esta nueva versión del ChatGPT. En realidad le veo tantas aplicaciones. Por ejemplo en control de inventarios, en gestión de tráfico en recintos, en detección TEMPRANA de enfermedades en animales de granja, detección de pestes en campo abierto en combinación con drones, etc etc. Me causa curiosidad si también es capaz de analizar videos o imágenes en tiempo real.
Hola Carlos, yo no se si sin querer te estropeo en el algoritmo de CZcams, pero es que entro con tanta a ilusión a ver tus videos sabiendo ya de antemano que me van a gustar que les doy like antes incluso de verlos ☺
OMG 😱que emoción haber nacido en la época de toda esta revolución 🎉
tremenda informacion gracias!
Buen canal.e encantan tus vídeos.
Chat GPT comienza a tener "sentidos", seguro que en un tiempo también es capaz de utilizar sonidos como input, IMPRESIONANTE.
LAIONEL messi? Qué le pasó al Carlos del pueblo? 😂
Estimado, deseándote el mejor de los días. Quisiera tu recomendación y sugerencias para aprender de manera profunda acerca de prompt engineering. Mil gracias de antemano.
Buena explicación.
Amigo tu si hiciste la tarea, te felicito desde chile
Soy perito de vehículos y sin duda lo probaré para analizar siniestros o accidentes de tráfico.
Aunque ya existen herramientas de valoración de daños vehiculares con inteligencia artificial integrada.
Estás tienen la capacidad de analizar e interpretar el daño para posteriormente aportar un informe de valoración de daños.
Saludos.
Con esta información se me ocurrió Un espectáculo de Impro. Pedir a la inteligencia artificial que a través de una imagen de alguien del público nos de una descripción, un desglose de personajes, 5 escenas posibles y play. Familia prestada se llamaría. Carlos Esteban es quien habla con la IA
Espera a que salgan los lentes inteligentes con chat Gpt 4. Seremos una especie de Cyborgs con eso.
IMPRESIONANTE, Podrías hacer uno de Dallee-3?
Creo que está lejos de eso, pero en el futuro estaría bueno para analizar gráficas de trading.
18:30, me recuerda al invento de Doraemon que le decía a los objetos como quería que se comportaran para que lo fueran, decirle a una pared que era una tele para que emitiera canales, por ejemplo...
17:42 Pensé que me mandaron mensaje, pero no, es el video JAJAJAJ
Lo de las manzanas ha estado genial!!! 🤣
Hay nuevo video de DotCSV, hay like
Ahora lo que necesitamos es una traducción en tiempo real de diferentes idiomas
Hola! Excelente contenido. Tines un errorcito tienes en el minuto 3:32 del video con LLM describiendo LMM . ;)
¡Gracias!
Me dio gracia lo de eres un experto y lo hace bien: Es el efecto Pigmalion para IAs, se universalizo el efecto encomio!!!!
Hola, muchas gracias por tus videos, nos enseñan muchísimo, podríamos mediante la api de gpt-4, pasarle cientos de imágenes y que nos las clasifique por temática?
Dot muchas gracias por la información, muy valiosa. Preciso estaba buscando como crear un avatar partiendo desde una foto mia
Gracias, crack. ¿Usaste GPT4 para tu resumen? Maravilloso.
DotCsv te recomendaría realizar alguna reseña de Claude 2. Me impresiona la ventana de contexto
Es el año 2030 estas trabajando en una construcción ya que es de los pocos trabajos estables que hay hoy en dia ya que con tus títulos de programador y tu experiencia en 3 idiomas no consigues nada el mundo esta en su 4 recesión económica del año pero tienes una ciber novia ia con la voz de megan fox tu vida es buena a tus 30 años
Literalmente bladerunner 2049 jajajaj
Tiririri tutiririrí tun tin tiririrì tutiririri
@@errek31415he visto cosas que jamás creerías. Colas del paro más allá de la puerta de tannhauser😅
Y hacemos una revuelta armada y colapsamos el país atacando todos los puntos clave de logística y comunicaciones.
al menos una IA habría escrito eso *con comas,* de manera que se entienda 🙄
Muy bueno
Me parece muy interesante para inventores. 😮
buen nuevo vídeo
14:23 De hecho, la equivocación no sería equivocar la fecha del ISS con el año 1977, cuando en realidad debería ser 2009 como indica en la esquina inferior derecha.
De verdad me impresionó lo del maya y lo de entender texto dentro de jna imagen. Está reloco 😮
Mi hype había bajado pero con esto me ha vuelto a subir hasta la cima
Esque alucionooooo tioooooo 😮
10:31
En la descripción dice ''un círculo verde con una sirena blanca en el centro''. Es el logo oficial de la empresa, pero no es lo que se muestra en la imagen.
Extraña descripción, ya que no veo el ''círculo verde'' del vaso izquierdo.
En el vaso derecho la sirena no es blanca, es color cartón y sin el círculo.
Hola. Que fuentes has usado en tu miniatura? Me gusta mucho. Un saludo y buen trabajo.
En la película La Máquina del Tempo, el viajero llega a un futuro cercado y al entrar a un museo, encuentra a un guia uqe es totalmente virtual pero que puede interactuar con él de manera natural. Cada vez mas cerca
3:30 momento dislexia
Excelente contenido! me gustaría aprender más, podrás recomendarme donde instruirme?
Sería un honor tenerte en nuestro país. Me gustaria contactarte y hacer unas pequeñas preguntas... no se por que medio podria lanzartelas? Genial todos los videos que subes, muchas gracias.
consulta, la api actual de chat gpt es posible la recepción y emisión de audio? como puedo obtener aquello , tanto el audio - texto y de texto a audio?
Este tipo de tecnologías podría ayudar a historiadores a procesar mucho más rápido documentos paleográficos.
Hola... Qué sucedió con la lista de espera de la API para GPT 4?