Aprende sobre Embeddings de OpenAI

Sdílet
Vložit
  • čas přidán 23. 07. 2024
  • En este video veremos como usar los embeddings de OpenAI para hacer un chatbot y un sistema que lee tus PDFs y responde a tus preguntas.
    ___________________________________________________________________________________________________
    ___________________________________________________________________________________________________
    ___________________________________________________________________________________________________
    🖥️ El código este en este repositorio dentro de la carpeta de "embeddings" 🖥️
    github.com/puigalex/GPT3
    - 🔊 Si quieres apoyar al canal 🫶 para que haya mas y mejor contenido (ganar-ganar-ganar jaja) puedes hacerlo por Patreon! 🔊
    / amptech_cc
    0:00 - Intro
    0:24 - Explicacion de embeddings
    1:29 - Codigo
    1:58 - Embedding basico
    3:32 - Comparar dos vectores
    5:38 - Sumar vectores
    7:00 - Chatbot
    11:35 - PDF
    19:55 - Preguntando algo que no sabe
  • Věda a technologie

Komentáře • 193

  • @miguelangelmurillo1297
    @miguelangelmurillo1297 Před rokem +56

    Un consejo qué les doy a todos para almacenar los archivos con los embediings es que nos los guarden en csv, sino en un archivo pickle, de esta manera al leer el archivo nos aseguramos de que los embediings se lean como arreglos de numpy y no como un str.
    Para hacer eso con el mismo pandas: pd.to_pickle('nameFile.pkl')
    Para leerlo se usa: pd.read_pickle('nameFile.pkl')

    • @miguelangelmurillo1297
      @miguelangelmurillo1297 Před rokem +2

      Podría hacerle una pull request al repositorio

    • @AMPTech
      @AMPTech  Před rokem +1

      Claro que si!

    • @cristopherjaque3965
      @cristopherjaque3965 Před rokem

      No he podido conectarlo ni a Whatsapp ni a IG, como puedo solucionarlo?

    • @andresbuitront2564
      @andresbuitront2564 Před rokem

      @@cristopherjaque3965 cual es el procedimiento que estas siguiendo o en que repo esta para revisar

    • @ivnaqn8521
      @ivnaqn8521 Před 9 měsíci

      Que opinas de guardarlo en base de datos con json_array_pack, es mas costoso en base de datos o en archivos?

  • @inforob8549
    @inforob8549 Před 7 měsíci +4

    Cada sílabas que has compartido la he saboreado. 100% .

  • @roman_ramos
    @roman_ramos Před rokem +33

    Excelente Alex,.como siempre.....Me interesa aprender más sobre Lang Chain, Llama y gradio. Espero puedas dedicar algún próximo video a estos temas. Saludos

  • @apoc2004
    @apoc2004 Před rokem +9

    La clase de video que hace falta en internet. Muchas gracias .

    • @fedex602
      @fedex602 Před rokem

      El profesor Alex es el más chingón y el más actualizado 😎👌🏽

  • @johndeleon8741
    @johndeleon8741 Před rokem +2

    Muchas gracias, con este vídeo se puede ver un poco de cómo funciona ChatGPT por dentro, muy bien explicado!

  • @fernandopuig178
    @fernandopuig178 Před rokem +1

    Excelente video, muy ilustrador , gracias x compartir y difundir conocimiento ‼️

  • @luksquian
    @luksquian Před rokem +1

    La explicación mas clara que vi hasta ahora sobre embeddings! gracias!

  • @davferod
    @davferod Před rokem +3

    Genial ver más videos así, lo de gradio también parece interesante

  • @joseradowvisky6292
    @joseradowvisky6292 Před rokem

    Excelente como siempre. Muy bien explicado. Felicitaciones!!!

  • @dloperab
    @dloperab Před rokem

    Excelente Alex...se aclaran muchos conceptos. Excelente video!

  • @ziroks51
    @ziroks51 Před rokem

    Excelente como siempre Alex! Muy agradecido con tu contenido!

  • @Christianlvm22
    @Christianlvm22 Před rokem

    muchas gracias, lo explicaste muy claro ahora entiendo como funciona mejor todo esto

  • @geopablus
    @geopablus Před rokem +3

    Muchas gracias por el vídeo, como siempre claro y con ejemplos prácticos. Me uno a la petición de LangChain y de gradio, saludos.

    • @AMPTech
      @AMPTech  Před rokem +1

      Se me esta juntando la chamba! jaja Muchas gracias por el comentario y listo ya tengo contemplado esos dos videos para el futuro no muy lejano.
      Saludos!

  • @gonzalofdc3151
    @gonzalofdc3151 Před 5 měsíci +1

    Extraordinario tutorial. Enhorabuena

  • @marckio_1667
    @marckio_1667 Před rokem

    Gracias por este video. Lo has explicado muy claro 🙂👍

  • @juancazares-du4vs
    @juancazares-du4vs Před rokem

    Gran aporte tuyo... gracias por esta importante divulgación de tu conocimiento... 👍

    • @AMPTech
      @AMPTech  Před rokem +1

      Muchas gracias por el comentario Juan, que bueno que te sirvió!

  • @andresbarilin9524
    @andresbarilin9524 Před rokem +2

    Exelente video, muy claro y consiso, me gustaria aprender mas sobre langChain de tu mano!

    • @AMPTech
      @AMPTech  Před rokem

      No se diga mas! Ya esta anotado para alguno de los siguientes videos. Gracias por tu comentario

  • @demianclarke
    @demianclarke Před rokem

    Excelente contenido! Gracias por explicar Vector embedding de una manera tan fácil de comprender. Grande Abrazo desde Barcelona!

  • @victorreyesalvarado8329

    Excelente vídeo! gracias por compartir

  • @rammss
    @rammss Před rokem

    Gracias compi, muy bien explicado todo.

  • @neuralmimosa
    @neuralmimosa Před rokem

    Magnífica explicación, muy buen contenido , saludos

  • @_owl
    @_owl Před rokem

    Muy buen tutorial!!! Gracias por compartir!

  • @gabrielparra5562
    @gabrielparra5562 Před rokem

    Alex muchísimas gracias por tu tiempo para este agregado a las herramientas de IA. Ojalá puedas hacer un video con modelos open source que tengan un alto porcentaje de comparación con el de openAI, y si no es mucho pedir otro video con tu expertice sobre AutoChatGPT. Saludos.

  • @bryanotavalo1203
    @bryanotavalo1203 Před rokem +1

    Muchas gracias, me ha servido muchísimo!

    • @AMPTech
      @AMPTech  Před rokem

      Me da mucho gusto! Saludos!

  • @santiagomoebio
    @santiagomoebio Před rokem +2

    ¡Excelente! El ejemplo es perfecto para mí por que mis hijos juegan Magic y me han intentado explicar las reglas, sin éxito. Voy a montar este ejemplo y testarlo con mis hijos. Un par de comentarios: cuando se hace el troceo de los textos conviene dejar un poco de solapamiento, porque a veces gran parte del significado está en la relación entre dos textos contiguos. Lo segundo es que aunque obtener la lista de párrafos (o trozos) más parecidos a la pregunta, y por lo tanto más cerca de proveer una respuesta, está genial, lo que tal vez es mejor es aprovechar chatgpt para que busque en ese contenido la respuesta a tu pregunta. Aprovechando que no hay que pasarle el pdf completo sino sólo un grupo pequeños de textos, se puede hacer un prompt que los incluya junto con la pregunta. Las ventajas son que la respuesta puede venir de forma muy concisa, en forma de respuesta, y que además usó información de múltiples trozos, incluso que vienen de partes diferentes del texto.

    • @AMPTech
      @AMPTech  Před rokem +1

      Hola Santiago,
      Tienes razón. De hecho si tenia pensado explicar el tema de solapamiento con embeddings, pero por alguna razón al momento de hacer el código final lo olvide por completo. Es algo que tal vez actualizare en el repositorio para los que lo usen puedan ver ahi el parámetro y sepan un poco sobre lo que hace.
      Saludos!

    • @jomaku1514
      @jomaku1514 Před rokem

      Wow, la idea de pasar los párrafos como promts es algo que no había pensado. Tengo curiosidad, ¿ya lo has probado? De ser así, ¿cuál fue tu resultado?

  • @Anubis3003
    @Anubis3003 Před rokem +2

    Saludos, si, que bueno un curso sobre Lang Chain!!!

  • @aspirezr
    @aspirezr Před rokem

    Muchas gracias, excelente video.

  • @SonGoku-pc7jl
    @SonGoku-pc7jl Před rokem +2

    Queremos aprender más sobre LangChain y ya de paso gradio, pero sobre todo langchain :) muhcas gracias

    • @AMPTech
      @AMPTech  Před rokem

      Ya esta en mi lista para siguientes videos. Creo que es una herramienta suuper valiosa para acelerar y escalar soluciones con LLMs. Saludos!

  • @AdrianFernandezFazio
    @AdrianFernandezFazio Před rokem

    Excelente video, muy clara la explicación!

    • @AMPTech
      @AMPTech  Před rokem +1

      Muchas gracias Adrian!

  • @TiranoEstudios
    @TiranoEstudios Před 11 dny

    Eres un crack, muy buenas explicaciones

  • @hoat23
    @hoat23 Před rokem

    Excelente video doc!!! te has ganado un nuevo seguidor.

  • @javi_v7.0
    @javi_v7.0 Před rokem

    Muchas gracias, ¡saludos!

  • @PZMaTTy
    @PZMaTTy Před 11 měsíci

    Buenísima la explicación, puntos extra por MTG!

  • @DeviIlustration
    @DeviIlustration Před rokem

    genial bro, me ayudaste a entender esto de los embeddins, pensé que solo se usaba para diagramas de datos y así

    • @AMPTech
      @AMPTech  Před rokem +1

      Que bueno que te ayudó para aclararlos. Si, al principio es un concepto muy ambiguo, pero ya que lo entiendes empiezas a ver todo como embeddings jajaja

  • @jorgefernandez4812
    @jorgefernandez4812 Před rokem

    esto de es mucha utilidad, gracias por compartir

    • @AMPTech
      @AMPTech  Před rokem

      Me da mucho gusto escuchar eso!

  • @kevinherrera196
    @kevinherrera196 Před rokem

    Excelente contenido, me gustaría ver la explicación y el uso de la herramienta Gradio. 👍

  • @jorgemun
    @jorgemun Před rokem

    Gracias BRO, muy bueno!!!

    • @AMPTech
      @AMPTech  Před rokem +1

      Muchas gracias Jorge!

  • @nicolasfernandez5256
    @nicolasfernandez5256 Před rokem

    Super poderosa esta herramienta la verdad, gracias

    • @AMPTech
      @AMPTech  Před rokem

      Totalmente, aparte esta divertido, porque como son números pues puedes ponerte creativo a ver que puedes hacer (como el ejemplo de las sumas)

    • @nicolasfernandez5256
      @nicolasfernandez5256 Před rokem +1

      @@AMPTech Bro dame un route map para poder programar eso como tu por fa

  • @victoraguilardiaz1168

    Muchas gracias👍

  • @mauriciogomez1111
    @mauriciogomez1111 Před rokem

    Excelente contenido

  • @camilotorres5352
    @camilotorres5352 Před rokem

    Excelente ! Mas que una explicación es un taller para aprender como funciona prácticamente!

    • @AMPTech
      @AMPTech  Před rokem +1

      Jaja si! siempre empiezo con un video de 5-10 minutos en mente y termino entrando a detalle en mas cosas y termina uno como este video. Pero pues es mejor entenderlo todo a quedarse con algunas dudas.
      Muchas gracias por tu comentario!

  • @rafaelquintero2874
    @rafaelquintero2874 Před rokem

    Muy interesante el contenido... 🤘

  • @SD-sq5mc
    @SD-sq5mc Před rokem

    Me interesa mucho lo que mocionas de hacer un video sobre cómo generar la interfaz gráfica 😊

  • @raulerazovera
    @raulerazovera Před rokem

    Gracias amigo estaba esperando algo asi ya que los tutoriales y otros no estan tan claros

    • @AMPTech
      @AMPTech  Před rokem

      Con gusto! Intente ser muy claro en la explicación, por eso los 20 minutos jaja

  • @dimitri2k
    @dimitri2k Před rokem

    Genial todo el contenido Yo si quisiera conocer acerca d LangChain

    • @AMPTech
      @AMPTech  Před rokem +1

      Trabajando en ese video ahorita mismo!

  • @konycatstudio9762
    @konycatstudio9762 Před rokem +1

    Excelente video, y solamente usaste lo mas simple y basico ya que hay ejemplo que usan Pinecone como base de datos de Vectores, aunque me surgio la duda que beneficios tiene si lo puedes tener un un archivo.

  • @iteligentrosario8847
    @iteligentrosario8847 Před rokem

    Hola, muy buenos tus videos, puedes hacer uno con un archivo pickle, como comento Miguel Murillo? y probarlo, Gracias por ofrecernos tu tiempo y conocimientos.

  • @ronaldrojasrodriguez375
    @ronaldrojasrodriguez375 Před rokem +1

    Excelente, gracias. LangChain por favor!

  • @metacortex1
    @metacortex1 Před 11 měsíci +1

    Mano, muchas gracias por compartir tus conocimientos tan generosamente. Disculpa mi ignorancia hermanito: veo que con el split y langchain indexas el texto en un array y de ahí el langchain interpreta a vectores cada una de esas líneas. Mi pregunta es si es posible aplicar el corte de forma dinámica en el split, es decir, si en lugar de cortar a 300, le dices al sistema que corte el texto cada vez que se encuentre con un punto y aparte, eso es posible? Gracias.

  • @CanalIFES
    @CanalIFES Před rokem

    Hola alex. Genial tu video como siempre. En cuanto al problema q citás en el final de tu video respecto de la posibilidad de que ante una pregunta que nada tenga q ver con el tema que trata tu pdf pueda responder cualquier cosa, no hay una forma de ver el nivel de confianza de la respuesta de modo de que si ése nivel es bajo pueda responder algo como NO TENGO RTA P ESA PREGUNTA?

  • @user-kx8li1dk6d
    @user-kx8li1dk6d Před 7 měsíci

    Gracias por tus buenos vídeos, te pregunto, podría realizar esto conectándolo a una base de datos que tiene varios registros?

  • @alumnoprimero1
    @alumnoprimero1 Před rokem

    Impecable! Excelente explicación!.... Se puede descargar el archivo de embeddings para trabajarlo en forma local?

  • @valcreen2
    @valcreen2 Před 11 měsíci

    Hola, gracias por compartir tu conocimiento. Una pregunta pará realizar análisis de información estadista, qué me sugieres. La idea qué traigo es realizar análisis del censo de población y sus diferentes segmentos qué tiene, haciendo predicciones

  • @mespinoza1388
    @mespinoza1388 Před rokem +4

    Excelente, existen muchos tutoriales en ingles y sería bueno tenerlo en español, me interesa aprender sobre Lang Chain, Llama Index.

    • @AMPTech
      @AMPTech  Před rokem +2

      Hola Miguel!
      Gracias por el comentario, agregado entonces estos temas a mi lista de ideas para siguientes videos!

    • @rafaelquintero2874
      @rafaelquintero2874 Před rokem +2

      X2...

    • @ansea1234
      @ansea1234 Před rokem

      X3

  • @diegocratz
    @diegocratz Před rokem

    Muito bom 🎉

  • @jeffmagallanes7385
    @jeffmagallanes7385 Před rokem +3

    Excelente video!, he visto algunos tik toks de gente usando IA para usar la voz de algun cantante famoso y hacer que cante lo que ellos quieran, conoces de que IA se trata?

  • @lamsiglo2170
    @lamsiglo2170 Před rokem

    perfecto

  • @joserodriguezgarcia513

    Teniendo en cuenta la velocidad de procesamiento y optimización ¿que es mejor guardar el embedding en un fichero o en una base de datos?

  • @edgareduardomendozamorelos7195

    Buen vídeo hermano, me gustaría que hicieras un vídeo dedicado a lang chain, siento que puede ser una herramienta muy fuerte a explotar en este caso
    Gracias

    • @AMPTech
      @AMPTech  Před rokem

      Totalmente! Acabo de publicar un intro y estaré subiendo unos ejemplos prácticos estas semanas.

  • @patriciodiaz2377
    @patriciodiaz2377 Před 10 měsíci

    Muchas gracias bro! Todo muy bien explicado, solamente tengo una duda. Si tengo varios PDFs como fuente de datos cómo le podría hacer para que el chatbot logre identificar si le están preguntando sobre algún pdf en específico o si el usuario quiere la respuesta más completa utilizando toda la información de los pdfs?

  • @saulroa851
    @saulroa851 Před rokem

    Excelente video! Si, haz más contenido así, y de LangChain! :D
    Pregunta Alex, se puede hacer PCA sobre los embeddings? y así quizas ahorrarse feria $?
    Gracias, saludos!

    • @AMPTech
      @AMPTech  Před rokem +2

      Justo estoy trabajando LangChain. Para ahorrarte el dinero, también estoy viendo hacer un video con unos embeddings de huggingface que no requieren $$$

  • @Gustavosalazar20
    @Gustavosalazar20 Před rokem

    esta interesante para un chat bot sobre un tema en especifico, pero solo se ajusta a la base de datos que se le asigne

  • @iam.p3p0
    @iam.p3p0 Před rokem +1

    Muy interesante, muchas gracias!... Podrías trabajar en este mismo sentido con AI que funcionan de manera local como por ejemplo ChatGPT4ALL ?

    • @AMPTech
      @AMPTech  Před rokem +1

      Si, ahorita he hecho unas pruebas con gpt4all y aun no esta integrado el tema de embeddings. La ventaja que tienen es que desde hace una semana usan gptj en vez de llama. El desempeño es peor jaja pero se puede usar un estornos comerciales a diferencia de Llama

  • @Maximiliano.R
    @Maximiliano.R Před rokem +1

    Hola Alex! mucho gusto! Soy maxi, me enseñarias que preciso dominar para usar de referencia el historial de respuestas de una ACC de wasap mia? me gustaria que aprenda a responder como yo, y que solo me llegue una notificacion cuando digan determinada palabra, por ejemplo COMPRAR o Significados similares.

  • @danielromerocalero6720
    @danielromerocalero6720 Před měsícem

    Muy buen trabajo Alex, tus vídeos son increíbles. Tengo una duda, cómo puedo incluir en un promots un conjunto de embeddings muy grandes como contexto en el system prompt? Necesito enviar una serie de datos bastante grande en cada llamada a la API de OPEN AI y estoy teniendo el problema de que superó los máximo de tokens por minuto que puedo enviar en una llamada a la API

  • @gocodeart
    @gocodeart Před rokem

    Genial, exelente video. Una consulta de estas posibles respuestas, ejemplo tomo la primera y pudiera pasarle a chatgpt para que la randomize y no se sienta tan repetitivo?

    • @AMPTech
      @AMPTech  Před rokem +1

      Si se puede hacer. Solo incluyes la respuesta que te dan los embedding al prompt hacia gpt. Y le mencionas a gpt convertir el texto a algo mas casual, formal, o le das unos ejemplos del estilo que te gustaría.

  • @RaycelGraterol
    @RaycelGraterol Před 6 měsíci

    Gracias amigos una pregunta se puede hacer este mismo codigo en NodeJS tienes algun ejemplo?

  • @gerardoguzman1079
    @gerardoguzman1079 Před rokem

    E#xcelente!

  • @dibluuee3777
    @dibluuee3777 Před rokem +1

    Como se haría con información que está cambiando constantemente y se requiere que el sistema conteste en base a lo que se actualiza ? Ejemplo en una asignación de citas medicas tengo 10 citas pero después ya bajan a 8 citas y así sucesivamente incluso se aumenta de más citas disponibles

  • @miguela.cuevas6629
    @miguela.cuevas6629 Před rokem

    Me fascino este video y ya estoy jugando con estas tecnologías, una duda ¿hay forma de que si a respuesta no esta en la base de conocimiento pueda dar un simple: no lo se...insertando algún tipo de libreria o quizá una condicional en el código?😅 y por supuesto que me gustaría mucho saber mas de gradio y langchain, y mucha gracias por compartir tu conocimiento bro..

    • @AMPTech
      @AMPTech  Před rokem

      Imagino podrias ponerle que si no cumple con un umbral de similutud, entonces usas chatGPT para generarla. Pero pues con el tema de posibles alucinaciones.

  • @leonardoespejo
    @leonardoespejo Před rokem

    crack

  • @cristobalartetacmah
    @cristobalartetacmah Před 4 měsíci

    queria consultar en base a tu experiencia , me podrias ayudar con algunas ideas para realizar un trabajo final de MASTER ? tengo varias ideas relacionado con el tema del video pero quizas con tus ideas imnovadoras podria ser mejor . gracias .

  • @brianmartinez0014
    @brianmartinez0014 Před 11 měsíci

    ¿Puedo utilizar este mismo método en Java o PHP? O todavía no existen las bibliotecas para hacer esto mismo y trabajar con IA

  • @alxx736
    @alxx736 Před rokem

    Hola! Muy bueno ! Sigo sin entender como se haría si el usuario pregunta cualquier cosa fuera de contexto para no responder

  • @programadornovato
    @programadornovato Před rokem

    Sabras si se puede colocar un historial,algo asi como lo que se hace con catgpt, donde chatgpt te da seguimiento a tu conversacion.

  • @roilopez5992
    @roilopez5992 Před rokem

    langchain con otros llm para trabajar en local, por favor! LLama creo que se podria?

  • @clonetrooper-cr0390
    @clonetrooper-cr0390 Před 11 měsíci

    Hola soy nuevo en esto, tengo una duda como se puede hacer un servicio API para consumir esos datos y mostrar en un chatbot?

  • @dumvsu
    @dumvsu Před rokem +1

    buen video, existe la forma de usarlo en local? o hay alguna otra alternativa sin tener que enviar los datos a openia? gracias

  • @nadanada5304
    @nadanada5304 Před rokem

    disculpa que editor de texto estas usando no se si es google colab o visual studio

  • @maycolsteven1170
    @maycolsteven1170 Před rokem +1

    Hola, muchas gracias por compartir tu conocimiento en este tema que muy pocos comprenden. Podrias por favor decime porque al ejecutar esta linea "datos["Similitud"] = datos['Embedding'].apply(lambda x: cosine_similarity(x ,busqueda_embed))" me sale este error -> UFuncTypeError: ufunc 'multiply' did not contain a loop with signature matching types (dtype('

    • @Victor-rs4ku
      @Victor-rs4ku Před 11 měsíci

      Creo que puede ser porque existe algún inconveniente con utils.
      Si el inconveniente es con el cosine_similarity, podrías crear la función, que es la misma que se encuentra en el github de openai
      def cosine_similarity(a, b):
      return np.dot(a, b) / (np.linalg.norm(a) * np.linalg.norm(b))

  • @joseeduardoortiz1769
    @joseeduardoortiz1769 Před rokem

    Interesante video es lo que estaba buscando, pero si hacemos una pregunta que no tiene nada que ver con la base de datos o la respuesta no es lo que esperábamos, podemos hacer que solite información y la almacene para tener una respuesta en el futuro?

  • @gazorbpazorbian
    @gazorbpazorbian Před rokem

    por favor, detalla mas el tema de guardar el archivo en una base de datos para despues utilizarlo. existe alguna manera de usar otros motores con embedings para no utilizar openAI? o se podrian crear embedings de manera local?

  • @lubeckable
    @lubeckable Před rokem

    Hay algún paquete para hacer embeddings de manera eficiente y rápida sin el api de openAI (para uso offline).

  • @yarlosilva1
    @yarlosilva1 Před 7 měsíci

    No pude emmbeber un pdf porque no me deja instalar las paqueterias de OpenAI. Será que del momento que lo hiciste a hoy cambio algo?

  • @nicolasfernandez5256
    @nicolasfernandez5256 Před rokem +1

    Consulta, el significado semantico quien se lo otorga a la herramienta, esto ya viene desde Open IA, entiendo bien?

    • @AMPTech
      @AMPTech  Před rokem

      Por la manera en la que lo entrenan, el modelo aprende a asignarlo. Dependiendo de la relación que tiene una palabra con todas las palabras que lo rodean, sumale esto a un set de datos gigante. El modelo entendiendo "el significado" de algunas palabras y su relación con las demás.

  • @novacode999
    @novacode999 Před rokem

    Una pregunta, en que ID lo esta programando? es VS code? como haces para que se vea asi por pasos?

  • @miguelangelmurillo1297

    Amigo, seguimos esperando los vídeos de langchain!

    • @AMPTech
      @AMPTech  Před rokem

      Esta semana que viene sale una intro y después codigo.

  • @s.a1387
    @s.a1387 Před 11 měsíci

    Para preguntar a una base de datos de PDF de 600 páginas, ¿Qué es mejor Fine Tuning o Embedding?

  • @dibluuee3777
    @dibluuee3777 Před rokem

    Ya vi la solución a mi problema de código jajaja

  • @ennioagc
    @ennioagc Před 11 měsíci

    Pero como se hace para detectar que detecte que no puede responder la pregunta con los embeddings que tiene? como en el caso de la tienda, si pregunto por un producto que no tiene, pero igual vectoriza la respuesta que se relacione y efectivamente se va a relacionar más ese vector a un vector generico de negación ej. si pregunto en una tiene de ropa, cuanto cuesta la camisa roja (y no tienen camisa roja, pero si blanca) lo va a asociar a la camisa blanca y no a una respuesta "no tenemos ese producto"

  • @fernandocieri
    @fernandocieri Před rokem

    Me gustaría hacer esto con archivos CSV, pero no me queda claro cómo enfocarlo o dividir la info de los CSV

  • @xaviersandler3305
    @xaviersandler3305 Před rokem

    Hola amigo. He estafó buscando un bot virtual interactivo y no lo encuentro. Podrías asesorar como empezaría hacer mi propio robot virtual interactivo que lo pueda usar como maestro de inglés?

  • @danielmartinmonge4054

    Pregunto. En el ejemplo se utiliza un PDF muy pequeño. El contexto de GPT4 es mayor que eso.
    Funcionaría con archivos mayores, véase libros completos de 500- mil páginas?

    • @AMPTech
      @AMPTech  Před rokem

      Con embeddings si se puede, no importa la longitud. Con gpt4 si estas limitado al numero máximo de tokens que procesa.

    • @danielmartinmonge4054
      @danielmartinmonge4054 Před rokem

      @@AMPTech Entonces, eso es para mí una herramienta súper poderosa.
      Apenas estoy comenzando a programar. Creo que lo voy a tomar como proyecto de aprendizaje

  • @hbmichang
    @hbmichang Před rokem +1

    Buen vídeo! Pero me quedé con la duda con respecto al tamaño 300, me hace pensar que habrá párrafos que serán cortados a la mitad si tiene por ejemplo 350 de tamaño, y al brindar una respuesta que coincida con ese párrafo, de una respuesta incorrecta 😅

    • @AMPTech
      @AMPTech  Před rokem +3

      En ese caso lo mejor es experimentar para tu caso de uso. Si usaba un tamaño muy grande no me podia responder bien. Ahorita que me preguntas esto me di cuenta que olvide explicar un parametro que se puede poner que es overlap, para que permitas tambien que entre bloques se empalmen, para asegurarte de no tomar la parte inicial o la final sino una especia de conjunto.

  • @albertmathematics2024

    Buenas tardes, una pregunta, que programa usas para hacer tu vídeo. Gracias.

    • @AMPTech
      @AMPTech  Před rokem

      Hola Alberto, utilizo DaVinci Resolve 18 para editarlos.
      Saludos!

  • @albint3r532
    @albint3r532 Před rokem +1

    Existe alguna manera de contactarte o tienes algún grupo de discord?

    • @AMPTech
      @AMPTech  Před rokem

      El discord lo estaré probando inicialmente con un grupo de "beta testers" de mi patreon, pero mientras puedes contactarme por twitter que es la red social que mas uso (@amptech_cc).
      Saludos!

  • @aldo_negri
    @aldo_negri Před rokem

    Gracias por tus videos! Son muy interesantes!.
    Entiendo la lógica de vectorizar y guardar la información, pero no tengo muy claro cómo funcionan las consultas: Cada vez que se consulta el modelo, se están utilizando tokens con toda la información indexada?. Eso cómo es viable?. Gracias

    • @AMPTech
      @AMPTech  Před rokem

      Si, cada vez que haces un embedding te cobran. Peeero, puedes salvar los embeddings que ya tienes hechos en una base de datos y ya solo consultas directo de ahi. Ejemplo, perro siempre va a tener el mismo embedding, asi que si sabes que vas a usar mas de una vez ese dato, pasalo a una base de datos, una columna el vector y otra columna la palabra.

  • @zatiro2d522
    @zatiro2d522 Před rokem +1

    que tan grande puede ser el pdf?
    osea 1gb o tal vez 2?

    • @AMPTech
      @AMPTech  Před rokem

      No se si tenga un limite. Pero si lo tiene solo fraccionas el pdf es varios

  • @diegofernandoriveragomez4440

    Alex podrías explicar como guardar los embedding en un diccionario para un archivo de pdf, para que no me cobren a cada rato y pueda hacer el chatbot de ese texto? te lo agradezco

    • @CeroCool212004
      @CeroCool212004 Před rokem

      .

    • @AMPTech
      @AMPTech  Před rokem

      Hola Diego, En el código viene una linea donde grabo el dataframe a un csv. Asi puedes hacerlo, y cuando necesites solo lees el CSV.
      Saludos!

  • @gazorbpazorbian
    @gazorbpazorbian Před rokem

    el video esta super genial pero le faltaria ver los costos para ver que tan caro puede salirme hacer las pruebas jaja

    • @AMPTech
      @AMPTech  Před rokem +1

      Todas las pruebas que corrí para este video tuvieron un costo de $0.10 USD. Si vas a hacer pruebas te recomendaría que empieces con unos archivos chicos para que veas mas o menos el costo para el uso que tienes en mente.
      La plataforma te muestra en casi tiempo real (con unos 5 o 10 minutos de retraso) cuantos tokens y dolares has consumido.