Clustering con K-Means. Explicación Matemática y Mucho más…

Sdílet
Vložit
  • čas přidán 25. 07. 2024
  • Si te sirvió el vídeo y deseas apoyarme directamente, te dejo mi cuenta Paypal 😊:
    www.paypal.com/paypalme/rocio...
    Mis cursos en línea:
    ======================
    - Aplica SQL al Mundo del Data Science
    - Creación de Reportes Visuales con RMarkdown
    rociochavezml.com/cursos-en-l...
    Descarga los archivos que voy analizando en: github.com/rociochavezmx/Roci...
    Blog "Aprende Ciencia de Datos con Rocío Chávez": rociochavezml.com/
    Espero que mis videos te estén siendo de utilidad. Si gustas cooperar por medio de PayPal para poder seguir creando contenido, puedes hacerlo en la página de mi Blog
    En este video te hablaré acerca de un algoritmo para segmentar poblaciones llamado Método de las K-Medias o K-Means, el cuál ha sido muy utilizado en diversas áreas y es parte de los métodos no jerárquicos de Clustering
    Aquí te explicaré los pasos del algoritmo, las acciones previas a su aplicación, algunas de las técnicas que se utilizan para determinar en cuantos segmentos dividir los datos que queremos analizar y también te contaré de tres diferentes maneras que existen para inicializar el algoritmo, además de mostrarte con ejemplos numéricos cómo influye la inicialización en los resultados obtenidos.
    Si quieres aprender más acerca de este tipo de técnicas, visita mi canal de youtube y suscríbete.
    Estaré subiendo videos de Machine Learning, Estadística y de Matemáticas en general aplicadas a los negocios.
    Si conoces a alguna persona a la que le pudiera ser de utilidad ésta información, por favor ayúdame a compartirla. Te lo agradeceré muchísimo 😉
    #machinelearning #datascience #statistics
  • Věda a technologie

Komentáře • 64

  • @RocioChavezCienciadeDatos

    Obtén los scripts, archivos y diapositivas que se muestran en mis videos en: www.patreon.com/rociochavezcienciadedatos

  • @jorge1869
    @jorge1869 Před 3 lety +6

    Mejor explicado imposible, mis respetos para este contenido. Saludos

  • @cg8770
    @cg8770 Před 4 lety +1

    Muy bien explicado! Muchísimas gracias

  • @MS-BeatrizBosques
    @MS-BeatrizBosques Před 2 lety

    Me encantó tu video mil graciaaas!

  • @ernestocamara9880
    @ernestocamara9880 Před 3 lety

    Excelentes las explicaciones! muchas gracias Rocio!

  • @RicardoQuispeM
    @RicardoQuispeM Před 3 lety

    ¡Excelente y clara explicación! Muchas gracias Rocio! :D

  • @camilomurcia5564
    @camilomurcia5564 Před 3 lety

    Gracias Rocio por el contenido, esta bien claro.

  • @gerardoab253
    @gerardoab253 Před 3 lety

    Excelente video, espero con ansias el de componentes principales 🙌🏻

  • @gustavos.c2304
    @gustavos.c2304 Před 2 lety

    Excelente explicación, muchas gracias.

  • @MrROkeRpOweR
    @MrROkeRpOweR Před 4 lety +2

    Un canal de verdad para llevar la cuarentena :) excelente !!!

  • @chagoignacio
    @chagoignacio Před 3 lety

    Excelente explicación te felicito........ muy bueno !!!!!!

  • @luisparada3970
    @luisparada3970 Před rokem

    Excelente video, muy buena calidad

  • @rbarragan1234
    @rbarragan1234 Před 3 lety

    Excelente explicación, saludos!

  • @AventurasaEscala
    @AventurasaEscala Před 11 měsíci

    MUCHAS GRACIAS .. ME AYUDO MUCHISIMO SALUDOS

  • @gustavorodriguez6365
    @gustavorodriguez6365 Před rokem

    Excelente, y en castellano. Saludos y felicitaciones.

  • @imerlopez3019
    @imerlopez3019 Před 4 lety +1

    Se agradece cada vídeo he aprendido mucho. saludos

  • @Nanidani41
    @Nanidani41 Před 3 lety +2

    Madre mía, el mejor vídeo de Clustering con K-Means de la historia!!!

  • @JonathanRamirez-cs2jx
    @JonathanRamirez-cs2jx Před 3 lety

    Está increíble el vídeo, estaría increíble también uno sobre K-modas ^.^

  • @tensoescalar1
    @tensoescalar1 Před 4 lety +2

    Voy a ver el vídeo por partes por tengas de tiempo, pero se ve excelente este video y como siempre lo voy a compartir en Redes Sociales.
    Saludos

  • @escaff
    @escaff Před 4 lety +1

    Muchas gracias Rocio

  • @elPADREdeDIOSsoyYO
    @elPADREdeDIOSsoyYO Před 4 lety

    Muchas gracias. Me han ayudado mucho tus videos, tus explicaciones son muy claras ☺

  • @emilianocaballerovazquez7798

    Muy bueno :)

  • @jortigasperu
    @jortigasperu Před rokem

    Buenísimo

  • @niltonortizbarraza8895
    @niltonortizbarraza8895 Před 6 měsíci

    Gracias🎉

  • @pallo_gamer
    @pallo_gamer Před 2 lety

    Que buen video profe, saludos ;D

  • @yenylaricosoncco9278
    @yenylaricosoncco9278 Před 2 lety

    Excelente Video!, podrías hacer un vídeo de K Medoids por favor
    Me gusta mucho tu explicación

  • @blackrock2222
    @blackrock2222 Před 3 lety

    Perfecto

  • @cMonsalveAdm
    @cMonsalveAdm Před 3 lety +1

    deberias hacer uno sobre kmodas para variables discretas o para analisis cualitativo

  • @RocioChavezCienciadeDatos

    Si te fue de utilidad este video y deseas ayudarme a seguir creando contenido, puedes hacerlo de varias formas:
    - Dando clic en "Me gusta" para incrementar la probabilidad de que el algoritmo de CZcams promueva mi contenido
    - Dejándome un comentario
    - Suscribiéndote a mi canal
    - Compartiendo mi canal en tus redes sociales
    - Presionando el ícono "Gracias" y haciendo una donación

  • @RocioChavezCienciadeDatos

    Para llevar a cabo el pre-procesamiento de tus datos y poder obtener
    información confiable en tus análisis, visita mi lista de reproducción
    llamada Pre-procesamiento de Datos en R
    czcams.com/play/PLUofJx5RUeFqGJJxKflkhDRTot29M7CYj.html

  • @cMonsalveAdm
    @cMonsalveAdm Před 3 lety +1

    Muy util , aunque el Kmeans hace esto de forma automatica es util saber como trabaja.

  • @joelcasas7999
    @joelcasas7999 Před 4 lety +1

    Muy buen contenido!!, solo una consulta, la distancia o mejor dicho la fórmula con la que se calcula las distancias puede ser también la de Mahalnobis?, si fuese el caso, que diferencia habría entre esos dos métodos para calcularlos?

    • @RocioChavezCienciadeDatos
      @RocioChavezCienciadeDatos  Před 4 lety

      Hola Joel! Muchas gracias por tus palabras. Acerca de la pregunta que me planteas, no sé si exista ya implementado el cálculo de la distancia de Mahalanobis en K-Means, pero en este enlace, puedes ver una tesis que habla al respecto. pdfs.semanticscholar.org/b029/5854310ef3e35a0d71bd73554840e38a5bd8.pdf

  • @guillermolarriva7884
    @guillermolarriva7884 Před rokem

    Hola, como aplicaría el K-means para agrupar varios tipos de archivos que se encuentran en una carpeta?

  • @RocioChavezCienciadeDatos

    Si deseas realizar el clustering K-Means en Python, visita mi video Clustering Método K-Means en Python czcams.com/video/s6PSSzeUMFk/video.html

  • @eliananavarro3461
    @eliananavarro3461 Před 2 lety

    En el ejemplo de normalización ¿cómo hizo para que las variables queden en el rango de 0 a 1?

  • @davidbarragan6814
    @davidbarragan6814 Před 2 lety

    Podrías explicar, como se hace para que un cluster quede vacío?

  • @martinrivarossa196
    @martinrivarossa196 Před rokem

    Hola Rocío,
    Primero quería felicitarte por e canal y el blog.
    Quería hacerte una consulta y porque una invitación a participar de una publicación.
    Te cuento mi problema: trabajo con imágenes satelitales en formato raster (tengo un conjunto de 800 imágenes que conforman una serie temporal de una variable ambiental en una región). Que sea formato raster no debería ser problema porque se pueden transformar en matrix csv. Cada pixel podría ser interpretado como un individuo. Tengo que reproducir este protocolo.
    1) hacer un análisis EOF para calcular los modos EOF que explican los distintos comportamientos temporales de la clorofila.
    2) Luego se usan los modos EOF dominantes para realizar una preclasificación clustering jerárquica de ward y fijar el numero fnal de conglomerados teniendo en cuenta un cambio brusco en la distancia de enlace entre los grupos.
    3) Finalmente hacer una clasificación k-means para asignar cada pixel a uno de los grupos obtenidos en los pasos anteriores.
    Esto es para una publicación que estoy escribiendo para mi doctorado en biología y como te conté anteriormente es una invitación a formar parte.
    Muchas gracias por la atención, un saludo, Martín

    • @RocioChavezCienciadeDatos
      @RocioChavezCienciadeDatos  Před rokem

      Hola Martín!. Muchas gracias! Y gracias también por pensar en mí como colaboradora en tu artículo. Desafortunadamente me encuentro muy llena de trabajo, por lo que no podría colaborar contigo en este momento :(

  • @jortigasperu
    @jortigasperu Před rokem

    hola Rocío, muy didáctica, aparte tendrás algún tutorial de fuzzy? gracias

  • @eliananavarro3461
    @eliananavarro3461 Před 2 lety

    ¿Cómo genera aleatoriamente los centroides?

  • @jesusgonzalezbecerril2156
    @jesusgonzalezbecerril2156 Před 8 měsíci

    Alguien puede indicarme cual es el proceso para realizar la normalización. Pense que era tomar el valor mas alto como 1 y despies obtebet ciertos porcentajes pero no me cuadran los cálculos. Además difiere en cada columna.

    • @RocioChavezCienciadeDatos
      @RocioChavezCienciadeDatos  Před 8 měsíci +1

      Hola! En el minuto 6:50 de mi video "Escalado y Estandarización de Variables en Python" puedes ver la fórmula que apliqué para dejar los valores entre 0 y 1

  • @RocioChavezCienciadeDatos

    Si estás interesado en conocer acerca de un algoritmo utilizado en el desarrollo de sistemas de recomendación, te recomiendo que veas mi video Algoritmo Apriori en R czcams.com/video/h7hOQWfhgh8/video.html ... ;)

  • @tensoescalar1
    @tensoescalar1 Před 4 lety

    Doctora aquí yo tengo una duda, usted utilizó para obtener distancias la métrica euclidiana, pero qué pasa si utilizamos la metrica de minkowski? Podemos obtener que el cuadrado de la distancia es negativo o también puede ocurrir que la distancia sea imaginaria, por qué los espacios de mikowsky son pseudo métricos, cómo se interpreta una distancia imaginaria en este método y para este algoritmo?
    Gracias y un Saludo

    • @RocioChavezCienciadeDatos
      @RocioChavezCienciadeDatos  Před 4 lety +1

      Hola Adalberto! La distancia de Minkovski siempre es positiva. Cuando haces la resta de las características tomas el valor absoluto de la misma.

    • @tensoescalar1
      @tensoescalar1 Před 4 lety

      @@RocioChavezCienciadeDatos si se toma el valor absoluto siempre es positiva la distancia, pero no siempre igual, entre dos puntos puede haber tres distancias distintas numéricamente, sería muy interesante ver un ejemplo de ese algoritmo, que ventajas tiene usar a mikuusky ? O cuando se recomienda usar esa métrica?

  • @cristianviera2930
    @cristianviera2930 Před 3 lety

    Hola, me podria ayudar con el algoritmo spherical kMeans... Necesito entregar un proyecto para terminar mi carrera y estoy perdidisimo

    • @RocioChavezCienciadeDatos
      @RocioChavezCienciadeDatos  Před 3 lety

      Hola Cristian! Desgraciadamente no te puedo ayudar debido a que me encuentro muy llena de trabajo :(

    • @cristianviera2930
      @cristianviera2930 Před 3 lety

      @@RocioChavezCienciadeDatos me podria orientar donde llevar acabo mi estudio? Saludos

  • @michellecueva8125
    @michellecueva8125 Před 2 lety

    Páseme las diapos

  • @RocioChavezCienciadeDatos

    Si estás interesado en adquirir alguno de mis cursos en línea, vista mi página web rociochavezml.com/cursos-en-linea/ ;)

    • @yenylaricosoncco9278
      @yenylaricosoncco9278 Před 2 lety

      Muchas gracias Rocío, ha sido la mejor explicación que he presenciado