Cómo LangChain y la IA Open Source Pueden Interactuar con tus Documentos ¡RAG GRATIS!

Carlos Alarcón - AI

zhlédnutí 3 821

Přidat do
- Můj playlist
- Přehrát později
Sdílet

Sdílet

Vložit

Velikost videa:

Zobrazit ovladače přehrávání

Automatické přehrávání

Přehrát

čas přidán 25. 07. 2024
🚀 Descubre en este video cómo LangChain y la tecnología de IA open source como llama 3, ollama, hugginface embeddings y chroma pueden transformar la forma en la que los chatbots interactúan con tus documentos, todo de manera gratuita con el método RAG (Retriever-Augmented Generation). Aprenderás paso a paso cómo implementar estas herramientas para mejorar tus proyectos y facilitar la comunicación automatizada. ¡No te pierdas esta oportunidad de innovar completamente sin costo!
¡Suscríbete y forma parte de nuestra comunidad AI! 🔔
MARCAS DE TIEMPO:
0:00 Intro
1:15 Explorando arquitectura
4:00 Probando Ollama
5:232 RAG con Langchain
20:02 Llevando el proyecto a tu terminal
23:34 Conclusión
► No te Quedes Atrás: Guía Completa para Implementar Llama 3 y Phi 3 en Tu PC ¡GRATIS!
• No te Quedes Atrás: Gu...
► Notebook
github.com/alarcon7a/Langchai...
► Repo en Github
github.com/alarcon7a/Langchai...
Tutorial de Embedding v3 - OpenAI
• Tutorial de Embedding ...
Twitter: / / alarcon7a
LinkedIn / / alarcon7a
Instagram / / alarcon7a
Věda a technologie

Komentáře • 68

@Hector.Pulido Před 16 dny
Me sirvió perfecto, solo le hice un par de cambios y ya lo tuve en prod en 2 dias 💪
@alarcon7a Před 16 dny
Esoooo 🔥🔥🔥
@gustavoadolfolirasalazar580 Před 21 dnem ⁺¹
mucha gracias por el tutorial buenísimo.
@alarcon7a Před 20 dny
Que bueno que te sea útil
@martinLBDT Před 2 měsíci
Muy bueno Carlos. Muchas gracias.
@nahuelzubiarrain7530 Před 2 měsíci
Muchas gracias! Muy buen video y muy útil. Sos un grande Carlos 🙌🏼
@peladocontrenzas1061 Před 4 dny ⁺¹
*Excelente el trabajo que estás haciendo Carlos.*
Se nota el alto conocimiento que tenés.
Aprovecho para hacerte algunas preguntas.
Estuve mirando tu playlist pero no encontré una guía para comenzar desde cero con esto, porque me interesa el tema.
- Podrías decirme los videos de tu canal aconsejables para comenzar?
- Para este proyectos es necesario tener GPU o con CPU también se podría hacer (no importa que demore)?
- Y esto tiene que ver con la pregunta anterior, instalar este proyecto en un VPS normal, sin GPU, sería factible.
*Felicitaciones nuevamente por el gran trabajo de docencia que estás haciendo.*
Nuevo suscriptor.
Saludos.
@alarcon7a Před 3 dny
Muchas gracias !!!
Espero poder sacar un curso completo pronto, con CPU este proyecto es posible🚀
@juandavidfrancofranco641 Před 2 měsíci ⁺¹
Fascinante, hace meses había pensado que en algun momento iba aparecer algo así. Gracias totales.
@alarcon7a Před 2 měsíci ⁺¹
El futuro es ahora hehe .. no olvides compartir
@guus7893 Před 2 měsíci ⁺¹
Excelente Carlos! Además de especializarte en estas habilidades explicas muy bien!
@alarcon7a Před 2 měsíci ⁺¹
Muchas gracias !!!
@gerardoesquivia Před 2 měsíci
Muchas gracias
@roberth.mendoza Před 2 měsíci
Excelente video y gracias por compartir con la comunidad. Muchos exitos!!!
@alarcon7a Před 2 měsíci
Siempre un gusto, muchas gracias
@javaboy6581 Před 2 měsíci
Qué bueno Carlos, cumpliste y sacaste el vídeo! Estoy deseando probarlo. Bendiciones y existos asegurados para tu canal
@alarcon7a Před 2 měsíci
Muchas gracias, 🚀
@gustavomarquez2269 Před 2 měsíci ⁺¹
Mucha gracias, muy valiosa informacion !
@alarcon7a Před 2 měsíci
Gracias por el apoyo
@EnzoFrancisco-gf5zg Před 2 měsíci
Pucha eres genial.
@alarcon7a Před 2 měsíci
Muchísimas gracias por el apoyo
@danielmora3003 Před 2 měsíci
Que genial este tipo de Videos ! 🤗
@alarcon7a Před 2 měsíci
Espero les puedan sacar provecho
@giocrisrai42 Před 2 měsíci
Excelente muchas gracias por compartir este tipo de contenido
@alarcon7a Před 2 měsíci
Siempre un gusto
@gonzaloosuna Před 2 měsíci ⁺⁴
Carlos sugiero hacer un video sobre las caracteristicas recomendadas de una computadora para desarrollar este tipo de aplicaciones. Gracias por tus aportaciones.
@alarcon7a Před 2 měsíci ⁺⁴
Tienes razon, hay que resolver muchas dudas con ese tema
@EveFelizzola Před 2 měsíci
De acuerdo!
@felp070 Před 2 měsíci
Muchas gracias, buen video nuevo sub me sirve esto para mi proyecto
@alarcon7a Před 2 měsíci
Genial !!! 🚀
@ggmtddbo Před měsícem
Gracias!
@alarcon7a Před měsícem
Un gusto
@thinayushiko9049 Před 2 měsíci ⁺¹
Gran video! gracias. Ahora en mi trabajo esta empezando a sonar mucho este tema de LLM, estoy aprendiendo para poder entrar a ese proyecto, pero en este caso hablan de bases de datos de grafos, especificamente neo4J, todos los videos y cursos q he visto han sido con bases de datos vectoriales, archivos txt y pdf, asi que estoy algo perdida de como esto seria hablando de bases de datos de grafos.
Por favor si puedes hacer videos sobre esto seria lo maximo! Gracias.
@alarcon7a Před 2 měsíci
Si los hay, buena idea, haré un tutorial de ello 👌
@Pekarnick Před měsícem
Excelente explicación detallada, 24 minutos que bien valen la pena. Muchísimas gracias!!! Sería muy complicado agregar grado para que sea utilizado desde un servidor central, en digamos una empresa, a fin de ser utilizado por varias terminales?
@alarcon7a Před měsícem ⁺¹
Muchas gracias … El servidor debe tener habilitado el puerto de salida y solo con eso ya es el mismo proceso 🔥
@vitinett Před 2 měsíci ⁺¹
Muy buen video, lo hubieras podido hacer con llamaindex?? Que diferencias tiene usar llamaindex o langchain
@alarcon7a Před 2 měsíci ⁺²
Llama index está más dirigido a rag, y si pide hacerlo con llama index también
@eduardogamarra9070 Před 2 měsíci ⁺¹
muy bueno, y eso lo podrias conectar a un chatbot para que lo puedan usar otras personas?
@alarcon7a Před 2 měsíci
Podrías dejarlo en algún servicio cloud y acceder como una API rest
@felp070 Před 2 měsíci
Puedes hacer un tutorial sobre schema Json y function calling
@alarcon7a Před 2 měsíci
Seguro 🚀
@JuankM1050 Před 2 měsíci
Perdon mi ignorancia pero esto esta corriendo totalmente de forma local ? Recuerdo ver video sobre como crear los embeddings y almacenarlos por ejemplo pinecone y todo eso tenia un costo en plata y computacional. o hay que tener un pc de la nasa para hacer tales cosas. ?
@alarcon7a Před 2 měsíci ⁺¹
En este punto los embedddings quedan almacenados en local en el ditectirio de Chroma, no hay que tener tan buena maquina para ello
@Pablo-Ramirez Před 2 měsíci
Hola muchas gracias por tu video. Intente replicar tu Código en Colab pero me da un error, que permisos tengo que tener para poder ejecutar desde mi local: ConnectionRefusedError: [Errno 111] Connection refused
The above exception was the direct cause of the following exception:
NewConnectionError Traceback (most recent call last)
NewConnectionError: : Failed to establish a new connection: [Errno 111] Connection refused
@alarcon7a Před 2 měsíci ⁺¹
Antes tienes que descargar y subir el servicio de Ollama, acá te enseño cómo
czcams.com/video/cthSyDFOIag/video.htmlsi=13a6J4cLw4b8kT7b
@Pablo-Ramirez Před 2 měsíci
@@alarcon7a Hola gracias por tu respuesta, si ya tengo corriendo Ollama locamente y al llamar al puerto indica que esta activa . El problema es con Google Colab que no ve el sitio local. Seguí las instrucciones de Colaboración y no hay caso
@alarcon7a Před 2 měsíci
@@Pablo-Ramirez ohhh si, para esto hay que correrlo en local y no desde un servicio cloud cómo Google colab
@Pablo-Ramirez Před 2 měsíci
@@alarcon7a sabes te agradezco mucho tus respuestas. En ese caso puedo puedo ejecutar el local_rag.ipynb desde un Visual Studio Code? Que requisitos requiero. Me interesa mucho este tema. Por eso te molesto tanto. Gracias.
@alarcon7a Před 2 měsíci ⁺¹
@@Pablo-Ramirez si, con una gráfica de 4 GB funciona
@pabloartero1155 Před 2 měsíci ⁺¹
Qué hardware necesito para hacer esto?
@alarcon7a Před 2 měsíci ⁺¹
Con una tarjeta de 6GB de video corre bien … con otro hardware menor corre bien pero tarda un poco
@guus7893 Před 2 měsíci
@@alarcon7a sería interesante conocer el hardware para el modelo de llama3 70b de parametros, lo soportará una placa de 8GB? o tal vez se necesitan 2 o 3? Por lo que he investigado llama3 8b seria el equivalente a gpt-3.5-turbo y llama3 70b el equivalente a gpt-4-turbo y ahí está la "papa", poder tener un modelo con la capacidad de gpt-4-turbo de forma gratuita (asumiendo el costo de mantenimiento de hardware) ya que lo he probado con un contrato de 8 paginas y 20 preguntas y ha consumido 3 dolares, mientras que el mismo experimento pero con gpt-3.5-turbo consumio 8 centavos de dolar (todo utilizando la API de OpenAI). La diferencia en las respuestas es notable entre un modelo y otro, vale la pena pero es muy costoso, por eso seria interesante conocer el hardware requerido para llama3 70b de parametros.
@cristiancamilogomezgalvis2070 Před měsícem
Recomendación, el volumen de la voz esta un poco baja.
@alarcon7a Před měsícem
Muchas gracias, busco corregirlo 👍
@creed4788 Před 2 měsíci
¿Esto sirve para windows?
@alarcon7a Před 2 měsíci
Si, en verdad solo hace falta Python y Ollama en Windows que lo explique en un video anterior
@cosmicfissure924 Před 2 měsíci
Hable de Chat whit RTX
@alarcon7a Před 2 měsíci
Interesante!!
@jjen9595 Před 2 měsíci
Una pregunta, esto funciona con imagenes? Por ejemplo subes un pdf de perros, y le pregunto, que tipo de perro son pequeños, entonces el llm me responde con un texto y una imagen indicando el perro, claro, la informacion esta en el pdf. Lo pregunto antes que te vallas jaja
@alarcon7a Před 2 měsíci ⁺¹
El ejemplo que hice solo analiza el texto, pero es posible hacer una extracción de la descripción de la imagen con IA
@jjen9595 Před 2 měsíci
@@alarcon7ammmm sí, es para un trabajo, pero lo veo un poco complicado, mejor empiezo por tu vídeo y de ahí veo jaja, encontré un vídeo de lo que quiero, pero está en inglés y es como es indio no funciona bien la tradición y peor aún yo que no se mucho, mejor empiezo por abajo xd
@juanhervas8055 Před měsícem
Uff demasiado complicado
@alarcon7a Před měsícem ⁺¹
Se vienen unos tutoriales desde cero

Další v pořadí

Automatické přehrávání