Cambia tu vida con este generador de voz (texto a voz)
Vložit
- čas přidán 9. 11. 2023
- Explora Transformers js: la biblioteca de código abierto que transforma texto en voces realistas con solo unas líneas de código
¡Descubre cómo generar audio de manera sencilla y potente!
▶ No te pierdas más directos en: / midudev - Věda a technologie
¡Hola Midu! Quería agradecerte por el contenido de calidad que nos brindas cada semana, yo no llevo mucho aprendiendo a programar, y el año pasado estaba a punto de tirar la toalla, pero en eso, llegaste tu, en verdad no sabes cuanto agradezco que hayas aparecido en esos momentos difíciles de mi aprendizaje. Me ha servido cada tutorial, cada curso y cada short que haces.
Actualmente se HTML, CSS, JS, PHP y MYSQL. Y después veré tu curso de REACT y no sé si haya uno de NEXT JS.
No sé si pudieras hacer un tutorial desde cero haciendo una ecommerce con panel de administración (crud). Me serviría mucho para aprender del backend y creo que para todos también. Saber también como se hace los métodos de pagos a través de una página web.
¡Gracias por TODO CRACK!
Es increíble lo versátil que vuelven a JS las librerías y Node. Esto seria una tarea un poco mas relacionado a lenguajes como Python, pero acá está un lenguaje para web ejecutándose con 20 líneas de código y en 2 segundos en local generando un resultado terriblemente satisfactorio
Sí, aunque curiosamente lo que está ejecutando son modelos y código en Python en un runtime llamado ONNX. Un poco la gracia de este runtime es que hay una versión compilada a webassembly, por lo que puedes correrlo no solo en Node.js, sino también en tu navegador.
@@charliea6038 y si. Correrse en el navegador es el chiste de JS
Excelente miduv! 👍🏼
Video corto rápido, super claro y además le tira palos a php, que mejor.
Mifu, Gracias por el contenido, Pregunta porfavor, De donde sacas los enbeddings para sacar una voz diferente?
Lanzamiento de ChatGPT (30 de noviembre de 2022).
Apenas 1 año del lanzamiento de estas tecnologias de OPENAI y los grandes avances que hemos visto. Imaginar dentro de 30 años.... y los avances del open source que se vienen.
Impresionante, desde luego ¡¡¡¡es impresionante la velocidad a la que avanza la IA casi que dentro de un mismo año!!!! ¿se podría poner que use una voz como CABAL del command conquer tiberian sun en español? 😋
como amo al editor/a
Me sorprende como midu conoce tanta herramientas. Danos los trucos
El secreto de Midu es mirar a Midu para enterarse
El no es humano, es un ia donde de apoco se está integrando a nosotros de forma pacífica, hasta el momento "x"
Me sorprende como alguien desconoce tantas herramientas. Danos los trucos
15 años de experiencia, ese es el truco jaja
Se llama ser senior con 15 años de experiencia
Hola midulive, gracias por compartir, tengo una duda impresionante, soy senior dev con muchos años de experiencia, pero mi gran problema ha sido el ingles. Crees que existirá prontamente una herramienta que traduzca tu voz en tiempo real de español a ingles? usando tu misma voz? ya que así se rompería las barreras del idioma en el desarrollo de software. gracias espero tu respuesta!
Me encantan estos videos donde nos muestras la ultima tecnologia de manera super simple. Aguante midu!
Muchas gracias!
Hola miudev, queria preguntarte que si a nivel de salario, es importante saber ingles en españa, gracias
Esa librería instala el modelo en la máquina local? O lo que hace es consultar un Endpoint del modelo específico?
2:08 Tenes la voz de Ricardo Milos. Midu cada dia superandote mas!!
hola midu, no se si te ocurre a ti tambien pero next js en entorno local es muy lento sabrias como solucionarlo? :/
Estaría genial si logramos implementarlo en español ❤
08:14 "Claro con php tardaria 4 veces menos" jajajaja un maestro el del comentario ese xD
Impresionante, haz un video profundizando en las demas opciones!
hola, busque pero no encontré nada sobre otras voces ni en ingles ni en español. alguien podría indicarme donde puedo empezar a buscar?
Se puede usar para asistente de voz entonces.??
Un vídeo sobre los EMBED 🙏🏼 entiendo pero a la vez no entiendo 😅y nose como hacerlo…
El futuro es hoy oíste viejo
midu ya todos vamos a tener nuestros servidores como siempre debio ser
Tienes la musica del final ? No esta mal
Midu dónde consigo los speaker embeddings? Porque en la documentación solo encontré el que colocaste. O solo es ese qué esta disponible??
@@elaprendiz0000 Me tocará revisar mejor, muchas gracias.
bro, no logre encontrar los demás speakers, podrías ser mas especifico en qué zona exacta se encuentran. Se lo agradecería enormemente.@@elaprendiz0000
Puedo usar esa dependencia para un proyecto sin que nadie me demande si mi proyecto se hace viral ?
Consumirá mucho sevidor? será muy caro?
Yo trabajo con eso en Python, pero si es una locura.
Esto si es genial, que el open source llegue a este nivel es la clave al futuro. Fuck Microsoft que me quiere cobrar copilot robando el codigo que escribio otro
lo de codellama es una locura
Ok entonces esto se puede ejecutar en el navegador del cliente, no?
Me gusta esa miniatura 🤓
alguien encontró la voz en español?
Megaman cada día esta más cerca de volverse canon...
Cada uno con una IA personal
El opensource va a traer de nuevo el uso de aplicaciones instaladas en local pero me imagino que esta vez con conexion a servidores o cosas asi, creo eso porque si no se hace asi se van a quedar atras las empresas.
Hahaha el node what's up 😂
alguna ia que cambie de un idioma a otro en texto heygen solo da 5 min creo que hasta pagando
Ojalá voces en español 🙏
llamitas 🦙🦙🦙🦙
mmm creo que desde hace años existe los tts
Conoces alguna para clonar mi voz ?
Loquendo un adelantado a su epoca
Hace rato el Open source es el presente y futuro, hace rato....
En general no y en especifico, justo en esto, tampoco.
La mayoría de cosas opensource son una reverenda mierda, entre toda la inmundicia sale algo decente, pero por algo decente que sale del opensource salen muchas más privadas, por no hablar de que siempre está por delante, el opensource casi siempre suele imitiar lo que ya existe, cosa que no es facil pero es significativamente más dificil que tener la idea y plasmarla.
@@JorgeDev92 ffmpeg una joyita
Ahora me entero q sos modelos 96, cómo te ha tratado la vida no? Jajaja saludos
Sabiendo lo que pasó con Aitana, ¿habrá algún modelo para generar cositas así?, generar dinero easy jsjsjs .__.
No creo que haya sido muy fácil lograr el alcancé de Aitana ( Al menos eso quiero creer)
Eso es con stable difusión. Pero lo de Aitana supongo que será también un buen manejo de las redes sociales.
siempre lo fue
ya no funciona
Lo acabo de probar y me va bien...
@@alerxses magia negra :/
Lo tienes en un repo ? @@alerxses
2 comentario xD
Nada mal, pero aún se escucha muy robótica. Esperemos que se logre llegar al modelo de ElevenLabs.
tio y funciona para espanol : cuestanos
Piper le gana 🫡
use la prueba de estos servicios y son demasiado lentos. no se adaptan a mis casos de uso pipipi
en ese caso debes de usar o mejor maquina o pagar el premium de voz de open ai
Conozco unos amigos que se ve que programan porque de dia son hombres y de noche transformers.js
loquendo ha muerto
Yo no lo descargo porque ya lo tengo
Yo lo tengo en español bueno realmente no puse mucha atención pero este scrip introduces lo que necesitas y lo habla al español
from gtts import gTTS
import os
def text_to_speech(text, lang='es'):
tts = gTTS(text, lang=lang)
tts.save("speech.mp3")
def main():
while True:
user_input = input("Ingresa una palabra o frase (o 'q' para salir): ")
if user_input == 'q':
break # Salir del bucle si el usuario ingresa 'q'
text_to_speech(user_input, lang='es') # 'es' para español
# Reproducir el sonido en Termux usando `mpv`
os.system("mpv speech.mp3")
os.remove("speech.mp3") # Eliminar el archivo de sonido
if __name__ == "__main__":
main()
Este scrip está diseñado para ejecutar y usar en Termux para Android