SAM: La IA de Meta que LO SEGMENTA TODO!
Vložit
- čas přidán 8. 07. 2024
- ►Entra en hostinger.com/dotcsv y con mi código DOTCSV obtén un descuento exclusivo!
SAM o Segment Anything Model es el nuevo trabajo de Meta que promete acelerar los avances en visión por computador con Inteligencia Artificial. Un modelo capaz de segmentar los elementos característicos de una imagen, sin importar no haberlo visto nunca antes. Un modelo que será muy útil tanto para la generación de futuros datasets como para su uso en tecnologías de AR.
📹 EDICIÓN: Carlos Santana y Diego Gonzalez (Diocho)
-- ¡LINKS INTERESANTES! --
► Demo SAM (Web Meta)
segment-anything.com/
► Proyecto SAM (Github)
github.com/facebookresearch/s...
► Proyecto SAM (HuggingFace)
huggingface.co/docs/transform...
-- ¡MÁS DOTCSV! ---
📣 NotCSV - ¡Canal Secundario!
/ notcsv
💸 Patreon : / dotcsv
👓 Facebook : / ai.dotcsv
👾 Twitch!!! : / dotcsv
🐥 Twitter : / dotcsv
📸 Instagram : / dotcsv
- ¡MÁS CIENCIA! --
🔬 Este canal forma parte de la red de divulgación de SCENIO. Si quieres conocer otros fantásticos proyectos de divulgación entra aquí:
scenio.es/colaboradores - Věda a technologie
Y ahora decidme ¿qué vais a construir con SAM? 👀🔥
Un buea IA multimodal 😉 checa tu correo, amigo.
Literalmente tengo una empresa que se enfoca en object detection para retai, esto me haber muchas puertas. La función de bounding box combinada con Yolo me vuelve loco.
@@storianostorianov3955 Ya tienes la mitad del camino recorrido! que cool que estés en eso, como puedo empezar a aprender sobre IA?
😮😮😮😮😼😼😼😼
Si pudiera experimentar con SAM, probablemente lo que haría es un bot para un juego, así podría identificar el mapa, los ríos, a los enemigos y crear un lógica basado en eso para hacer un bot para farmear automáticamente
En el ordenador de fondo se ve que este video son casi 3 horas de grabación :_)
Más toda la edición después.. un aplauso para este señor y la calidad que entrega con cada video
Lentes de realidad aumentada + SAM + Chatgpt4 (que explique lo que ves) = Cyberpunk
Cyberpunk sin bug lol.
Que fuerte pensar que ya tenemos toda la tecnología, solo falta aplicarla
Una cosa es lo que anuncian/publican y otra lo que ocultan en proyectos avanzados o prototipos. Estoy seguro que hay más avance aún no mostrado, quizás el DARPA en combinación con estas empresas tiene "algo" que puede dar miedo
Qué es cyberpunk? Un juego? 🤔
Te faltó añadir un modelo de reconocimiento de voz
Un robot con Sam integrado en sus visores puede ser útil para ayudar a cargar o clasificar objetos y pasarlo a la persona.
Un ejemplo útil puede ser que un robot pueda pasar una jeringa a un doctor, una caja a un vendedor, pasar objetos de máquina a máquina.
Las posibilidades son ENORMES
🍷🗿
Ya ya… se sincero, tu quieres un scouter como el que llevaban los saiyans en dragon ball xddd
(Yo tambien, no te lo voy a negar xd)
@@SectorZeroGP No lo pensé...
Pero sí.
Claramente puede diseñarse algo para calcular la temperatura aproximada de una segmentación de una imagen y en base a eso y a otras variables como la distancia, viento, clima, etc. Calcular la energía que puede tener el objeto, persona. Muy útil en industrias, podría servir como un multímetro pero en lentes y de lejos xd
@@Alxnatr_ o simplemente por puro postureo xd
Por fin los automóviles autónomos podrán diferenciar a los humanos antes de atropellarlos
querras decir : Las posibilidades son infinitas! xD me explota la cabeza jaja
Excelente video, no tienes idea cuanto me ha ayudado todos tus videos, como motivación, como síntesis de información y desde luego para estar siempre actualizado con las novedades en el campo. Excelente trabajo
Que interesante esta IA, gracias por explicarlo!!
quiero ser YOUTBER pero nadie me apoya...😭😭
@@oracleofsatoshi por hacer spam nadie te apoya
1. Localiza a Al Pacino de esta película
2. Vincula a Al Pacino con este personaje de viñetas de cómic
3. Termina de montar el cómic como si fuera una película
Yo a eso lo llamo la "singularidad".
Siempre se les deja para el final pero espero que alguien que sepa y pueda, aplique esto de detectar objetos (sumado a poder saber qué son) para personas ciegas o con discapacidad visual o de cualquier tipo.
Si ya les guía para decir "el objeto está más a la derecha que donde tienes ahora la mano" les sería un cambio tremendo en sus vidas
Es interesantísimo lo que propones . Me encantaría trabajar en algo así , pero de momento estoy bastante comprometido . Pero si juntas un equipo mas adelante me apunto
@@gabrielalejandromarturano8761 Hola! Yo no sé de esto. Pero muchas gracias por el comentario! Espero que entre la gente q lea la idea sí haya alguien que tenga a la vez el tiempo los conocimientos y la voluntad. :)
Yo lo decía como idea que me vino a la cabeza al verlo y leer mo de "para qué más puede servir?"
Es una buena idea de negocio, como unos Google lenses
Un potente asistente para personas con dificultades visuales. Sinceramente hay mucho de lo avanzado en IA en los últimos meses que tendría un gran impacto en personas con movilidad reducida, dificultades visuales y/o auditivas, etc... y hay muchas ideas para videojuegos y asistentes de venta... hay un dicho en mi país "por la plata baila el mono".
Admiro a la gente como vos que tiene la capacidad de explicar de manera tan eficaz estos temas, se que son horas de trabajo y paciencia para tocar punto por punto. ¡Crack!
Una herramienta asi perfeccionada y enfocada a los que nos dedicamos hacer composicion de video seria increible. Por ejemplo hacer rotoscopia demanda mucho tiempo.
Muchas gracias por el vídeo. Se agradece el guiño a ese “chaval de una aceleradora de start ups” y que aparezcan viejos amigos como Crespo
Grande en On Industry. La mesa redonda memorable. Siempre aprendiendo contigo
me gustaria ver unos lentes inteligentes con SAM integrado, black mirror cada vez más cerca ❤
Hace rato empezó esa programación predictiva del 2011 con Black mirror...
El Mundo feliz de Huxley
@@jairfernandohenaoespinosa2915 Entendí la referencia, solo hace falta una pizca de Soma y ya estamos cerca!
@@___Retro___ que gusto saludarte mi hermano.
Así es.
Un abrazo fuerte!
@@jairfernandohenaoespinosa2915 espero que ya hayáis asumido que aquí somos todos gamma...
quiero ser YOUTBER pero nadie me apoya...😭😭
Poco se habla que para la edición de videos puede ir genial para los recortes frame por frame que tarda mucho tiempo
Recuerdo le conté a un amigo sobre inventar algo así, dónde pudieran seleccionar objetos del mundo real con el móvil y te dé el nombre y descripción de ese objeto, pero me dijo que era imposible. xD
Las mejores ideas son las más locas. Solo recordemos a algunos de los genios más importantes de la historia :D
cada vez mas canon la frase de "si lo puedes imaginar, lo puedes programar"
Creo que tu amigo nunca a usado Google lens
llevan años existiendo este tipo de software, típicamente para personas con dificultades visuales, pero al decir verdad no era muy bueno antes
es que hace poco lo era, completamente imposible(al menos con tanta precisión) y ahora pues ... ahora ya no se que es o no posible
Excelente haberme suscrito,que videos tan bien explicados y siempre al dia lo mejor...Saludos de Colombia.
Esta semana me vi todas las Terminator, y no puedo dejar pasar que desde la primera pelicula ya se mostraba un sistema MUY SIMILAR a SAM en la vista de Terminator :P
Que fantástico contenido que haces, me encanta, muy buen trabajo!!
Rara vez me pierdo tus vídeos con un cafelito ^^.
Esperando más vídeos relacionados, muchos ánimos y que vaya fantástico todo!! Deseando ver qué nos depara los próximos años 😃 un abrazo!!
Wow que locuraa, aun no imaginamos como sera todo dentro de 5 años
Gracias, por preparar el vídeo!!!
Saludos desde Mendoza. Argentina!
Como siempre muy útil.
Abrazos
Lo acabo de probar sobre imágenes satelitales de clorofila-a y derivaciones de nivel del mar, y sectoriza regiones de manera maravillas!
que pedazo de video Doc, muchisimas gracias por crear e informar de la increible manera en la que lo haces, saludos.
¡Qué buen video! gracias por compartir este tipo de contenido de buena calidad.
Muy agradecido Carlos. Tus vídeos son muy valiosos para mi.
muchas gracias por la enseñanza..me he suscrito y tienes mi like..saludos!!
increíble, estamos viviendo una revolución continua, gracias por informarnos tan bien!
Es por este tipo de vídeos que estoy suscrito a este canal. ¡Muchas gracias!
Muchas gracias por compartir tu conocimiento de forma comprensible para quienes no nos manejamos tanto en el área!! :)
Lo estuve probando pero no puedo descargar las imágenes para trabajarlas en Photoshop. ¿Eso no se puede hacer?
Que bien explicado! Buen vídeo! ❤
Me alegra estar vivo para ver esta revolución
Podrias hablar en un video o directo sobre IA como alpaca, dolly, vicuna, gpt4all etc? Estaría interesante.
De aquí al infinito.
Gracias Carlos!
Muy interesante! Buen guiño al doctor Alan con el espectrograma! 😊
fabuloso tutorial , totalmente satisfactorio...muchas gracias !!.....like !!
Incluso stable diffusion trabaja con un segmentador de imagenes en el mecanismo de atención cruzada, todo podría mejorar con esto, incluso el mismo Unet que usa stable diffusion.
cada vez mas canon la frase de "si lo puedes imaginar, lo puedes programar"
para hacer mi tesis en ing electronica utilize Matlab para segmentar imágenes, y para reconocer notas musicales en una partitura, fue un trabajo duro, pero esta herramienta de IA es realmente increíble!
Imaginate SAM integrada en La Suite De Adobe y también integrada en Music Maker Guitar Pro Sibelius y Finale para segmentar nota musicales partes musicales ritmos y demás signos y figuras musicales en el tiempo 🤩🤔💨🙏✍️
Hey que tremenda información y la forma de explicarlo es magistral. Saludos!!
Excelente información. Es importante comprender las dos filosfías sobre inteligencia artificial para comprender mejor en qué punto estamos actualmente, una es la Inteligencia Artificial Fuerte y la otra, la IA Débil. Gracias por este contenido!!!! Súper. Saludos
La I.A Fuerte es la I.A General osea la más Robusta esa I.A debe desarrollarse pero con unas leyes que respeten el trabajo humano que sea ética alineada a los seres humanos y sin sesgos culturales racista o religiosos o políticos solo la I.A Fuerte como herramienta para el beneficio de la humanidad
Un genio, siempre te seguimos
Mil gracias por la información!!🤩
Muy bueno! Gracias
Ya veo a la NASA etiquetando de forma automática esas grandes imágenes llenas de planetas, estrellas, galaxias etc. Estos modelos fortalecidos con las enormes bases de datos de esta agencia y con telescopios observando y autoetiquetando de forma automática, el futuro del descubrimiento espacial estará más automatizado que nunca.
Me gustaría que nos mostraras un video de cómo bajar estas herramientas de GitHub y ponerlos a trabajar, aunque sea de la forma básica.
lo secundo de manera tremenda, ojala lo haga, videos de enseñanza sobre como cargar estos modelos en linea de codigo y ver resultados
Sobre todo de forma básica! Sería más útil que los haga para los que no tenemos ni idea de programación, para los que ya saben es muy sencillo, por lo que parece :-b
@@ArturoMerelo exacto, por ejemplo yo tengo conocimientos basicos de algunos lenguajes de programacion, pero como no me dedico a eso y estudie ya hace un buen tiempo, se me difuculta un poco como bajar estos repositorios y compilarlos adecuadamente para hacerlos trabajar.
Entiendo que los que ya tienen experiencia trabajando en esto pues les parece super sencillo, pero viendo como va evolucionando las AI seria bueno que otros pudieramos entrar a esto tambien sin tener que esperar que alguien mas cree una app de pago para que podamos disfrutar de los avances.
Cada cierto tanto hace directos en el que usa en tiempo real las herramientas. En estos videos comparte en enlace de un notebook de Colab, en el que ya está todo construido y lo puedes correr fácilmente así sepas poco de programación
Si, por favor, un vídeo de cómo se utilizan este tipo de herramientas para combinarlas con otras
Tus videos de calidad! Gracias.
video de calidad como siempre, saludos Dot CSV.
Vaya, esta IA debe tener como slogan "Vamos por partes". 😂
entonces tendría que llamarse jack y no Sam 😂
Como dijo el descuartizador.
🎶
🥁
jajajajaja muy bueno
Carlos, vos sos el nuevo noticiero. Nada de telenoche ni ningun nada que ande con mentiras. Acá está la verdadera noticia. Felicitaciones. un placer como siempre tus viedos. Saludos desde Uruguay
Woo nuevo video!
Muy buen video! toda la info es super interesante! me gustaria que hagas uno sobre Auto-GPT! Saludos!
Muy buena explicación, gracias
¡Qué maravilla! .. ¡Muchas graciaas!
5:16 ¿cómo que nunca he visto ése objeto? Si todos tenemos un Plumbus en casa.
Xdddd
El final con los videos en primera persona usando esta tecnología me hacen recordar muchísimo a Black Mirror.
Gracias por informar sobre estas herramientas.
Creo que está cerca un asistente digital estilo Jarvis... Excelente, Carlos 💪🏻
Hay un proyecto que se llama Planet 9 que quiere encontrar pruebas de la existencia de otro planeta en el sistema solar (con una órbita muy elíptica). Hasta ahora, se buscaba con la colaboración de la comunidad, que inspeccionaba imágenes de partes del cielo nocturno en busca de ‘objetos raros’. Imagino que esto ayudará a hacerlo en un momento.
Si la poesía fuera perfecta la inspiración y la visión vibrarian en la frecuencia de este amigo...un abrazo desde México
muchas gracias por tu trabajo
Gracias por compartir información tan eficientemente
que genial, terminaré unos pendientes y me pondré a jugar un poco con esto...
muchas gracias!!
Hola Carlos! realmente estoy sorprendido con todo el avance tecnológico al que estamos asistiendo como humanidad! es un momento increíble para estar vivo y ser contemporáneo a estas modificaciones que, pienso yo, serán determinantes para el futuro próximo.
Sigo tu canal desde fines del 2022 con los primeros avances de chat GPT y ya en ese momento interprete que esto se venia a lo grande!!
Éxitos y por mucha mas divulgación sobre estos temas. Que obviamente el control y el desarrollo están en manos de grandes empresas pero es información muy importante de DEMOCRATIZAR y hace publico al alcance de todos! Felicitaciones y enhorabuena por esa tarea!
En google colab gratuito no se le puede hacer fine tunning creo. Igual no encuentro el script de entrenamiento. Ayuda
Para la animación por rotoscopía sería muy útil.. (también para la tradicional digitalizada) ..y lógicamente para todo el ámbito de edición de imágenes y videos.
Ya lo quiero integrado al photoshop, al afterEffect y al Corel. ^_^
Gracias viejo! 👍
Ya segment anything esta integrado en stable diffusion automatic1111 (en la beta de controlnet) y es bastante brutal, no es perfecto pero va ayudar mucho a la hora de modificar imágenes o animaciones
Excelente mi apoyo total a el desarrollo de las I.A y de la Robótica y nuevas tecnologías y las tecnologías emergentes
Permite fijar la atención de la visión computacional en objetos, cómo lo hace la visión general, miramos todo pero vamos mirando objetos dentro de lo general queremos y tomamos desiciones en base a ello, la atención es importante en la visión.
Es increíble como poco a poco se van construyendo de forma sintética todas las habilidades de la mente humana.
Update: lo acabo de probar, es un poco lento pero es una locura!!!
Update 2: me gusta ver el espectro de la grabación de tu voz en pantalla 🎶
Depende de tu ordenador, en el mio fue casi instantaneo
@@alexisvillegas1953 y del internet
@@zutamy Y posiblemente de la hora, si se usa la versión de meta, posiblemente haya horas pico donde se saturan los servidores, así como pasaba o pasaba más con ChatGPT.
Ayer pensaba en aplicaciones de la IA a la salud... Yo no se nada del tema, y quizás lo que pensaba no tiene sentido... pero imaginaba por ejemplo en algún sistema que pudiera ver a nivel microscópico en tiempo real para eliminar por ejemplo patógenos como células cancerosas, virus o bacterias sin afectar nada mas. Por ejemplo, un sistema similar a una diálisis que fuera analizando cada gota de sangre que pase por el, y poder ver y atacar a los virus que están afectando a alguien, disminuyendo el conteo de ellos y así ayudando al sistema inmunológico. O haciendo lo mismo con células cancerosas que viajan por la sangre impidiendo, o minimizando al menos las posibilidades de metástasis. Supongo que existen indicadores químicos que pueden ayudar, pero en mi imaginación, y tal vez por mi ignorancia, pienso que "ver" e identificar puede ser una estrategia increíble. Luego queda cómo atacar: quizás un laser super preciso... no se, esa es otra parte del problema...
En todo el mundo (especialmente en India) hay muchos estudios de vfx con miles de trabajadores especializados en rotoscopia. Meta se los acaba de cargar de un plumazo. No me quejo, esto es imparable, pero muchos vamos a tener que reinventarnos. Por cierto, Carlos, excelente video, como siempre.
Pues eso hasta que realmente se adapten y puedan usarlo tan bien a como se haría manualmente, lo cual posiblemente si reduzca algunos puestos de trabajo o si la empresa es inteligente pues recicle a los trabajadores moviéndolos a otras areas donde sean útiles.
Porque señalar es una cosa, ya modelar por encima y pulir eso es de hecho de las cosas que más tiempo consumen, no por nada las películas de marvel han salido con una calidad tan lamentable, porque darle un aspecto realmente estético es complicado cuando no hay tiempo suficiente para la carga de trabajo que les estaba dando Disney.
Por el amor a la I.A todos debemos reinventarnos y utilizar muy bien estás herramientas emergentes de la I.A para mejorar y aplicarlas en nuestras labores diarias una sinergia Humano - I.A trabajando en Equipo...✍️🙏💨🏁😎
Nuevo seguidor desde Barranquilla.
Gracias por tu video.
esto para los que tengan discapacidad visual debe ser brutal
Ellos no verán nada da igual
@@cono4949 LA IA sí.
@@cono4949 con una ia como chatgpt y un tts podria mejorar su calidad de vida y talvez hacer cosas difíciles con facilidad o hacer cosas que no podia.
Un crack. Gracias por compartir estas cosas, máquina.
gracias excelente video
muy buen trabajo 👍
Excelente explicacióon
Gracias!
No pares nunca Doty, porfi, :-)
Vaya, que cualquier cámara que grave un evento podría identificar en milisegundos a todos sus asistentes. Incluso guardar un registro de cuantas veces ha estado esa persona en tal sitio. Gracias programadores! :)
eres increible!
keep the content coming
Espectacular
sorry por preguntar, para qué funcionalidas práctica podría usarse?
Sería bueno un tutorial en Google colab. Muchas gracias
¡Gracias!
Esta segmentación iría muy bien para la futura conducción autónoma
en vez de imagenes se puede usar en pointclouds?
Era obvio que semejante Corp no se iba a quedar "dormido" y sin desarrollar su propio modelo generativo; y pues vaya que segmento bien...pues sí sus planes son el metaverso fue demasiado consecuente al diferenciarse!
Me parece un acierto lo que lograron🎉😮
Hay muchas acciones cotidianas que son pequeñas pero requieren, por ejemplo, cerrar una app o libro para buscar un dato en otro lado. En ese sentido sería interesante contar un dispositivo que le pueda ir mostrando la información que va necesitando (cuando miro un plano, leo un documento, hago cálculos, veo un concepto que no conozco, etc). Aquello agregaría mucho valor en trabajo y tiempo.
ChatGPT
asistencia en aprendizaje en entornos reales (cirugias, etc), usos militares para identificación de objetivos, mejoria de asistencia en los sistemas de seguridad activos de los coches, las posibilidades son infinitas, y peligrosas.
Estos son tiempos muy interesantes
Eres el mejor. Te queremos!
En los cortes, con un poco de maña, se puede escuchar el audio en tu pantalla (por los gráficos)
No es el primer vídeo con ese enfoque.
La velocidad de esto es impresionante. Espero que el desarrollo de capacidades de procesamiento no se quede atrás.
Desde hace tiempo me he preguntado como y cuando se llegaría al punto del reconocimiento de objetos mediante una visión digital. Con esto la autonomía de los robots va a tener un salto significativo.
Fue genial. Y mostrar a la civilización Mandaloriana renaciendo es espectacular
Gracias por el nuevo video, me encanta tu canal ❤️, me saludas?