Crea tu asistente virtual con ChatGPT (pt 3)
Vložit
- čas přidán 9. 07. 2024
- Esta es la tercera parte de nuestra serie para poder constuir un asistente virtual a la medida de nuestras necesidades.
Repositorio:
github.com/puigalex/asistente...
🔊 Si quieres apoyar al canal 🫶 para que haya mas y mejor contenido (ganar-ganar-ganar jaja) puedes hacerlo por Patreon! 🔊
patreon.com/amptech_cc
#inteligenciaartificial #nvidia #chatgpt #openai #gpt4 #gpt3
0:00 - Intro
0:25 - Problemas
0:50 - Que haremos
1:31 - ChatGPT
2:40 - Darle voz al asistente
3:35 - Probando el asistente
4:15 - Mejoras futuras - Věda a technologie
Eres un Crack. Dios te bendiga
Excelente avance, estaré pendiente de los siguientes vídeos para seguir aprendiendo, muchas gracias por compartir 👍. Te comento que vengo desarrollando algo semejante pero web y uno de los puntos esenciales es como reducir las respuestas y que sean más especificas 😅. Saludos.
Que tal si volvemos al modo offline con Dalai Alpaca y Llama? Instala bles en local y muy fluidos con CPU de 8 cores, sin GPU. he de mirar que tal va con una de 6. Lo han llegado a instalar en una Raspberry...
Que buen proyecto 👍🏼👍🏼
Excelente proyecto, muchos éxitos
Muchas gracias Victor!
Like y suscribir. Me puse a buscar esto ya que compré una laptop vieja y enchufe a mi smart TV principal donde esta toda mi familia en la cena. Pero el problema es que cada vez que queremos ver una película o algo hay que recurrir al teclado y la interfaz de Ubuntu no está diseñada para esto. Así que me puse a investigar sobre algún asistente para acelerar todo esto y poder controlar la TV solo con la voz para poner músicas, películas, etc.
Eres un Genio.
Nah, son años de experiencia. Pero muchas gracias!
hahaha muy bueno, gracias, menos técnico de lo que espere pero hay vamos :3
perfecto
Puedes hacer una explicación de como hacerlo en un raspberri pi porfavor? O si no se puede con un ordenador de intel o amd.
Podrías correr un LLM pequeño en local para hacer la tokenización y ciertas funciones
Ame este proyecto desde el inicio....
Muchas gracias por el comentario! Ahi va, poco a poco agarrando forma
Yo uso pyttsx3 para para el texto a voz, te permite elegir diferentes voces como también su velocidad, muy buen proyecto e interesante!, estaré atento a los próximos videos
Muchas gracias, ya le eche un ojo y parece una buena opción!
Se puede usar con la ia "pi"?
Desconozco, no he programado mas sorry @@patopato5627
Gracias 👋👋👋👍
Hola es justo lo que ando buscando, cómo poder hacer un asistente que esté al pendiente de sensores de una nave aeronáutica, tipo asistente de iron Man que le dice cuando hay algún daño, baja energía, etc etc ,
En vez que sea portatil, el asistente debería tener su propio server para que lo puedas integrar a cualquier dispositivo movil o directamente que se conecte a travez de whatsapp o telegram. Por otra parte, podrías darle mas control de otras utilidades como la de agendar usando LangChain. De momento no tengo mucho conocimiento en python pero intentaré echarle un vistazo al codigo y hacer alguna PR
El tema de ponerlo en un server esta para largo plazo. Ahi si quiero asegurarme que antes de hacerlo tenga todos los protocolos de seguridad en orden para poder hacer algo como acceso por VPN o algo así. También lo de langchain es buena idea, de hecho lo he estado utilizando para algunas cosas, pero no he entrado aun muy a detalle. A ver si esta semana tengo algo de tiempo para darle un rato.
@@AMPTech porque no usas jasper con un asistente de voz
Sería buena idea, al inicio del proyecto intente integrar Riva a la Jetson y como no era compatible creo que descarte gran parte de lo que está en el NGC, pero Jasper podría ser otro buen camino.
@@AMPTechyo estoy intentando crear mi backend utilizando websockets, mi idea es usar un esp32 o desde una app para movil conectarme al server, y para conectarme desde cualquier lado, quiero usar directamente cloudfire para crear un tunel (como ngrok solo con un dominio propio). Por otra parte estoy jugando con AutoGen para crear agentes y no solo funciones, quiero poder controlar focos entre otros dispositivos, por lo que estoy en duda si usar Home Assistsant o utilizar MQTT y mi propio software para esto. Saludos !
muy buena pinta, no se si usas automóvil habitualmente, pero ahí cobra una nueva dimensión el asistente con infinitas posibilidades.
En cuanto a cámaras con edge computing tienes las AOK de luxonis son las "oficiales" de opencv una pasada.
gracias por compartir
No he podido trabajar con las oak, pero les echare un ojo. Muchas gracias!
WEEE OCUPO TU AYUDA ISE LO MISMO CON EL MIO pero es un poco avanzado creo que le hace falta disciplina ;u como entreno mi ia?
Cuándo va a salir el siguiente?
y hacer una interfaz similar a las gafas de vegeta con esp32 camp o una cam directa al raspberry pi y que ayude a procesar algo y enviarle al server o asistente info necesaria para procesar lo que raspberry pi zero mire
estaria guay que se pudiera integrar con home assistant, y asi no tener que usar la nube para nada
Es mi tirada a largo plazo. Saludos!
Hola amigo, el proyecto puede evolucionar siendo más potente con las interfaces escritas en cpp (c++). Podriamos acercanos a un asistente offline.
Yo lo que hice fue utilizar voice recognition para detectar la palabra ordenador, y cuando la detecte que empezara a grabar, speech recognition no es tan bueno como whisper pero te detecta bien palabras como ordenador, me ha resultado bastante mas util que grabar todo lo que digo
ve el de nosotros te va gustar y todo es original creado desde cero .
El mío funciona por wathsapp. Recibe mensajes de audio, imágenes (aunque falla aveces), etc
Podrías hablar de la ia de stanford o la de Facebook. Como es eso q funciona sin internet
Si, tengo un par de videos planeados antes, pero sin duda alguna hablare sobre Llama de facebook, ya que es la pieza ideal para seguir manteniendo al asistente corriendo de manera local.
Lo que mas me gusta es que es offline, seria espectacular que pudieras implementar una funcion en el asistente que yo le pueda pedir busque en un manual tecnico pdf, doc o excel cierta informacion y el asistente lea y muestre en pantalla los resultados, me gusta tambien la idea de que con las esp32cam el asistente pueda saber donde estas (reconocimieto facial) asi te contesta solo en los altavoces que estan en esa habitacion. Gracias por compartir tus habilidades hermano.
Luego voy a integrar ese tipo de búsqueda que mencionas. Va a ser muy util.
@@AMPTech gracias hermano eres el mejor.
Gracias por compartir, recuerdo que antes usaba para leer texto creo que era Helena de IBM puede ser que pueda modificarse.
No había escuchado de Helena, y que tal estaba?
podrias añadir una alexa que se conecte atravez de una api para el asistente virtual y asi no tener problemas con el audio
Excelente trabajo. Para el audio, text-to-speech podrías usar coquiTTS, me gusta más la voz con ese paquete.
Le voy a echar un ojo, muchas gracias. No se si es porque ya escuche muchisimo la voz del asistente de google (que es la misma de gTTS) pero no me latió nada para este proyecto jajaja
Que tal. Buen video. Casualmente estoy haciendo algo similar, y la IA de Google me lanzó tu vídeo por obvias razones. Jajajaja. Hace un tiempo hice algo con asterisk en una llamada telefónica para realizar consultas a una base de datos con dialogflow. Dónde identificaba que producto estaba buscando y lo validaba en la base de datos nacional para hacer consulta de precios sobre el agro. Cómo fue hace un buen tiempo estoy retomando todo nuevamente y veo que con Chatgpt puedo simular los intent que generaba con dialogflow que ya lo volvieron pago. Por lo pronto he realizado validador de documentos, categorización de documentos en carpetas automático, he conectado a internet el asistente, etc con chatgpt y python. Si de algo te puedo aportar, con gusto
Muchas gracias por le oferta Cesar. Suena bastante interesante el proyecto que me cuentas. Con chatgpt y los embeddings de openai puedes hacer muchísimas tareas mas alla de generación de texto. Para algo como clasificación hay modelos mas pequeños que lo pueden hacer muy bien tambien, pero con Chatgpt se pueden agregar funcionalidades interesantes por encima.
Como hace para que escuche todo el tiempo y que envíe los trozos especificos cortandolos en el momento justo? es decir si le hago una pregunta que me demora 20 segundos decirsela , como sabe hasta donde cortar?
Si quieres echale un ojo al video pasado del asistente virtual, ahi lo menciono. Basicamente uso speech recognition para detectar espacios donde no se esta hablando, para asi poderlo cortar el audio sin cortar una palabra a la mitad.
Cómo podría hacer para darle una personalidad inicial a la api de chatgpt? Por ejemplo decirle que actúe como una consulta de Linux. Pero para no enviarle ese texto en cada consulta, sino que ya tenga esa personalidad desde antes de hacer la consulta
Con finetunning puede modificarlo un poco. Tengo un video sobre como hacerlo.
czcams.com/video/zGTVgaaPMU4/video.html
Oye me encanta tu contenido, crees que con el FIne Tuning a GPT3 es posible hacer que responda como una persona en especifico? es decir, en los prompt del archivo csv irian las preguntas frecuentes, y en el completion la forma tipica en que esta persona las respondería, y si es posible, hay alguna forma de pasar este modelo con fine tuning a una aplicación o página web para que funcione como un chatbot independiente?
Hola Jeff, si se puede hacer, justo como mencionas, con algunos ejemplos de como respondería esa persona. Obvio habra algunas diferencias de vez en cuando, pero este caso que mencionas es uno bueno para fine tuning.
Para desplegarlo a una pagina web, sería mandar a llamar openAI desde un api REST (para no depende de python y hacerlo agnostico a lenguajes de programación)
@@AMPTech muchas gracias!
a nivel de miniaturizar esto mi idea seria usar un raspberry pi zero levantar el sistema entero en un server remoto y que el raspberry pi mande las peticiones al server el server los procésese y lo devuelva de esta manera podemos tener el servidor principal en un vps (eso creo que haria yo) o en el salon de casa y que tambien sea el asistente
¿Se puede ponerle voz a el asistente virtual "pi?
¿Le puedes poner voz de checo perez ó doña lucha?
Estupenda idea, ojala lo puedas llevar a un nivel como Jarvis usando el chat gpt.
No se pierde nada intentandolo! jaja Saludos!
exacto, ya hay videos en youtube de como hacer tu propio Jarvis, videos viejos de hace más de 5 años... yo los vi, por eso lo comento... esto sería prácticamente lo mismo solo que con ChatGPT como inteligencia...o sea.
@@Equinoxio Exactamente porque los otros son con comandos muy basicos y ya preescritos en el codigo, en cambio con chat gpt puedes decir o preguntar infinidades de cosas y el bot te responderia, no tendrias que colocar tantas condiciones para cada palabra en especifico.
Quiero armar algo así pero con tortoise para usar mi propia voz y llama/alpaca para que sea local
Disculpa.
Como está pasando el tiempo y parece que salen cosas nuevas cada día.
¿Crees que saldría rentable cargar Stable Vicuna?.
¿Crees que sacarán Auto Stable Vicuna como hicieron con Auto GPT?.
Hay un canal que se llama un loco y su tecnología que trata mucho de temas domóticos que quizá te ayuden a unir esas grandes ideas que tienes sobre cámaras y reconocimiento.
En serio, tu proyecto es apasionante.
Hola, ¿el proyecto es OpenSource? tal vez podriamos colaborar... :)
Si es, acabo de poner la liga del repo en la descripción del video. Hoy en la tarde voy a actualizarlo. Justo antes de hacer el push de estos cambios al repo tuve unos problemas con el Sistema operativo de la Jetson AGX :/
*HACE UNA VERSION DE ESTE MISMO ASISTENTE PARA WINDOWS DE 32 BITS POR Q NO TODOS USAR UBUNTU O LINUX, YA Q ES AL CONTRARIO LA MAYORIA DE LAS PERSONAS USAN WINDOWS Y Q SEA DE 32 BITS MUY IMPORTANTE PARA Q CORRA EN MAQUINAS ANTIGUAS OSEA SIN LIMITACIONES PARA NADIE*
No se si me perdi en el proyecto pero la idea inicial era hacerlo de manera local y segun entiendo al usar gpt y gtts estas necesitando internet o me equiboco
Hola Marco,
Si lo siguiente que estaré probando es Llama para correrlo de manera local. gTTS ese si corre local, pero no me termina de acomodar, asi que se irá.
Saludos!
@@AMPTech y que paso con este proyecto que estaba muy interesante
todo eso llegará muy pronto para que los uses con tus airpods
Excelente. Pensé usarias Alpaca o LLaMa, para evitar enviar datos a internet.
Es justo lo que voy a hcer despues! Privacidad ante todo es lo que busco con esto
Estaría bien hacer que las respuestas sean lo mas cortas posibles a no ser que se lo especifiques en el prompt.
Por ejemplo si le digo a chatgpt "2 mas 2" me ha respondido esto: "2 mas 2 es igual a 4. "Mas" es una palabra en español que significa "más", y "2 más 2" es una expresión matemática que se resuelve sumando 2 y 2 para obtener un total de 4."
Lo veo absurdo y molesto si lo tiene que dictar encima con voz de robot 😅
Totalmente de acuerdo! jaja, probablemente con un par de ejemplos en el prom se puedan mitigar algunos de los casos.
Yo integre ChatGPT a walkietalkies, eso resuelve lo de cargar todo hasta cierto punto
También e pensado en contruir un asistente, solo que me iría por cambiar un poco el comportamiento de ChatGPT, como un diálogo en 3 personas systema , asistente y nosotros usuarios, de esa forma preguntas clave serán solicitadas las acciones a sistema, aunque aún no estoy seguro si lo ideal es usar ChatGPT o usar gpt directo dado a qué chat tiene "la costumbre" de hacer un diálogo entre nosotros y el (solo dos entes)
Totalmente! Creo que para eso algo como embeddings o gpt3 "normal" serviría mejor. Aqui lo hice con ChatGPT para poder tener una primera versión de manera muy rápida.
Gracias por el comentario
@@AMPTech intente por medio de prompt ajustar el comportamiento, cuando le preguntaba sobre la temperatura me regresaba $temp, aunque me hacía una redacción de que tenía que solicitar al sistema mencionaba la variable quizá filtrando la redacción antes de mostrarla o de ponerla en un Audio y regresar el dato podría responder
Te tenía perdida la pista desde hace meses.
Y no sé porqué, ya que además tengo activa la campana.
En serio? Es que CZcams tiene muchos problemas con eso, la verdad es un tema de la manera en la que todas las redes sociales (tomando YT como una) curan algoritmicamente lo que te enseñan. Lo importante es que diste con mi video.
Muchas gracias por el comentario :)
@@AMPTech Ya te tengo localizado.
No te voy a volver a perder y para asegurarme estoy viendo todos los vídeos que puedo de tu canal.
Así CZcams me mostrará tus vídeos de sugerencia.
La api de chat gpt, no te cobra o cuál es su límite?
Si cobran, pero son centavos de dolar. Por lo cual usarlo para solucionar algunas cuantas dudas no me sale ni mas de medio dolar al dia.
Aqui esta la lista de sus precios openai.com/pricing
Aqui esta un video donde explico un poco como cobran (En el minuto 3:40): czcams.com/video/oBjubWuvBPE/video.html
@@AMPTech muchas gracias, una última pregunta está api es para usar únicamente con el modelo 3 ?
Puedes entrar a un waitlist para gpt4, pero en teoría es la misma api cuando lo liberen para todos.
Se cae el internet adiós, bajas llama pierdes un disco entero y mucha ram...
Pd: está cool el proyecto
Hola Marlon, justo después lo que voy a hacer es meterle algún modelo como LLama para que sea 100% local, no por la persistencia del servicio sin internet (que también es un buen punto!) pero un poco mas por temas de privacidad.
Saludos!
Pero no es muy pesado llama como para integrarlo con el jetson?
En este caso no, esta jetson tiene 32 GB de ram y Llama con algo de 8GB ya puedes empezar a tener resultados. Lo que quiero corroborar es que tanto tarde en generar las respuestas
Muy bueno, pero te das cuenta que ya hay video de hace +5 años que hacen lo mismo? estamos usando ChatGPT para cosas demasiado sencillas, te das cuenta?... yo que vos, pensaría cuales son las MEJORES cosas que se pueden alcanzar con ChatGPT y similares... NO las cosa "sencillas"... si no LO MEJOR...!!!
Hola! Si, esta aplicación es muy directa. Hay aplicaciones mucho más elaboradas que podríamos hacer, aunque no creo con ChatGPT, me iria por GPT directo o embeddings. En este caso es para poderle integrar esa pieza conversacional a mi asistente de manera rápida.
Saludos
Interesante, pero todo lo que mencionas ya existe
disculpa queria saber si me podrias ayudar con un correo para contactarme contigo queria solventar algunas dudas
Hola Lisseth, claro me puedes escribir a mi twitter @puigalex o a alejandro@inteligencia.tech