Clustering con K-Means. Explicación Matemática y Mucho más…
Vložit
- čas přidán 25. 07. 2024
- Si te sirvió el vídeo y deseas apoyarme directamente, te dejo mi cuenta Paypal 😊:
www.paypal.com/paypalme/rocio...
Mis cursos en línea:
======================
- Aplica SQL al Mundo del Data Science
- Creación de Reportes Visuales con RMarkdown
rociochavezml.com/cursos-en-l...
Descarga los archivos que voy analizando en: github.com/rociochavezmx/Roci...
Blog "Aprende Ciencia de Datos con Rocío Chávez": rociochavezml.com/
Espero que mis videos te estén siendo de utilidad. Si gustas cooperar por medio de PayPal para poder seguir creando contenido, puedes hacerlo en la página de mi Blog
En este video te hablaré acerca de un algoritmo para segmentar poblaciones llamado Método de las K-Medias o K-Means, el cuál ha sido muy utilizado en diversas áreas y es parte de los métodos no jerárquicos de Clustering
Aquí te explicaré los pasos del algoritmo, las acciones previas a su aplicación, algunas de las técnicas que se utilizan para determinar en cuantos segmentos dividir los datos que queremos analizar y también te contaré de tres diferentes maneras que existen para inicializar el algoritmo, además de mostrarte con ejemplos numéricos cómo influye la inicialización en los resultados obtenidos.
Si quieres aprender más acerca de este tipo de técnicas, visita mi canal de youtube y suscríbete.
Estaré subiendo videos de Machine Learning, Estadística y de Matemáticas en general aplicadas a los negocios.
Si conoces a alguna persona a la que le pudiera ser de utilidad ésta información, por favor ayúdame a compartirla. Te lo agradeceré muchísimo 😉
#machinelearning #datascience #statistics - Věda a technologie
Obtén los scripts, archivos y diapositivas que se muestran en mis videos en: www.patreon.com/rociochavezcienciadedatos
Mejor explicado imposible, mis respetos para este contenido. Saludos
Muy bien explicado! Muchísimas gracias
Me encantó tu video mil graciaaas!
Excelentes las explicaciones! muchas gracias Rocio!
¡Excelente y clara explicación! Muchas gracias Rocio! :D
Gracias Rocio por el contenido, esta bien claro.
Excelente video, espero con ansias el de componentes principales 🙌🏻
Excelente explicación, muchas gracias.
Un canal de verdad para llevar la cuarentena :) excelente !!!
Gracias Eliu!. Espero que lo sigas viendo ya que se termine la cuarentena... jejejeje
Excelente explicación te felicito........ muy bueno !!!!!!
Excelente video, muy buena calidad
Excelente explicación, saludos!
MUCHAS GRACIAS .. ME AYUDO MUCHISIMO SALUDOS
Excelente, y en castellano. Saludos y felicitaciones.
Se agradece cada vídeo he aprendido mucho. saludos
Me dá gusto que te estén siendo de utilidad los videos. Muchas gracias por verlos!! ;)
Madre mía, el mejor vídeo de Clustering con K-Means de la historia!!!
x2
x3
Está increíble el vídeo, estaría increíble también uno sobre K-modas ^.^
Voy a ver el vídeo por partes por tengas de tiempo, pero se ve excelente este video y como siempre lo voy a compartir en Redes Sociales.
Saludos
Muchas gracias Adaberto! ;)
Muchas gracias Rocio
Es un placer Gustavo! ;)
Muchas gracias. Me han ayudado mucho tus videos, tus explicaciones son muy claras ☺
Es un placer! Saludos a tu hijo... jejeje ;)
Muy bueno :)
Buenísimo
Gracias🎉
Que buen video profe, saludos ;D
Excelente Video!, podrías hacer un vídeo de K Medoids por favor
Me gusta mucho tu explicación
Perfecto
deberias hacer uno sobre kmodas para variables discretas o para analisis cualitativo
Si te fue de utilidad este video y deseas ayudarme a seguir creando contenido, puedes hacerlo de varias formas:
- Dando clic en "Me gusta" para incrementar la probabilidad de que el algoritmo de CZcams promueva mi contenido
- Dejándome un comentario
- Suscribiéndote a mi canal
- Compartiendo mi canal en tus redes sociales
- Presionando el ícono "Gracias" y haciendo una donación
Para llevar a cabo el pre-procesamiento de tus datos y poder obtener
información confiable en tus análisis, visita mi lista de reproducción
llamada Pre-procesamiento de Datos en R
czcams.com/play/PLUofJx5RUeFqGJJxKflkhDRTot29M7CYj.html
Muy util , aunque el Kmeans hace esto de forma automatica es util saber como trabaja.
Muy buen contenido!!, solo una consulta, la distancia o mejor dicho la fórmula con la que se calcula las distancias puede ser también la de Mahalnobis?, si fuese el caso, que diferencia habría entre esos dos métodos para calcularlos?
Hola Joel! Muchas gracias por tus palabras. Acerca de la pregunta que me planteas, no sé si exista ya implementado el cálculo de la distancia de Mahalanobis en K-Means, pero en este enlace, puedes ver una tesis que habla al respecto. pdfs.semanticscholar.org/b029/5854310ef3e35a0d71bd73554840e38a5bd8.pdf
Hola, como aplicaría el K-means para agrupar varios tipos de archivos que se encuentran en una carpeta?
Si deseas realizar el clustering K-Means en Python, visita mi video Clustering Método K-Means en Python czcams.com/video/s6PSSzeUMFk/video.html
En el ejemplo de normalización ¿cómo hizo para que las variables queden en el rango de 0 a 1?
Podrías explicar, como se hace para que un cluster quede vacío?
Hola Rocío,
Primero quería felicitarte por e canal y el blog.
Quería hacerte una consulta y porque una invitación a participar de una publicación.
Te cuento mi problema: trabajo con imágenes satelitales en formato raster (tengo un conjunto de 800 imágenes que conforman una serie temporal de una variable ambiental en una región). Que sea formato raster no debería ser problema porque se pueden transformar en matrix csv. Cada pixel podría ser interpretado como un individuo. Tengo que reproducir este protocolo.
1) hacer un análisis EOF para calcular los modos EOF que explican los distintos comportamientos temporales de la clorofila.
2) Luego se usan los modos EOF dominantes para realizar una preclasificación clustering jerárquica de ward y fijar el numero fnal de conglomerados teniendo en cuenta un cambio brusco en la distancia de enlace entre los grupos.
3) Finalmente hacer una clasificación k-means para asignar cada pixel a uno de los grupos obtenidos en los pasos anteriores.
Esto es para una publicación que estoy escribiendo para mi doctorado en biología y como te conté anteriormente es una invitación a formar parte.
Muchas gracias por la atención, un saludo, Martín
Hola Martín!. Muchas gracias! Y gracias también por pensar en mí como colaboradora en tu artículo. Desafortunadamente me encuentro muy llena de trabajo, por lo que no podría colaborar contigo en este momento :(
hola Rocío, muy didáctica, aparte tendrás algún tutorial de fuzzy? gracias
Hola! Todavía no tengo videos acerca de lógica fuzzy
@@RocioChavezCienciadeDatos oky gracias
¿Cómo genera aleatoriamente los centroides?
Alguien puede indicarme cual es el proceso para realizar la normalización. Pense que era tomar el valor mas alto como 1 y despies obtebet ciertos porcentajes pero no me cuadran los cálculos. Además difiere en cada columna.
Hola! En el minuto 6:50 de mi video "Escalado y Estandarización de Variables en Python" puedes ver la fórmula que apliqué para dejar los valores entre 0 y 1
Si estás interesado en conocer acerca de un algoritmo utilizado en el desarrollo de sistemas de recomendación, te recomiendo que veas mi video Algoritmo Apriori en R czcams.com/video/h7hOQWfhgh8/video.html ... ;)
Doctora aquí yo tengo una duda, usted utilizó para obtener distancias la métrica euclidiana, pero qué pasa si utilizamos la metrica de minkowski? Podemos obtener que el cuadrado de la distancia es negativo o también puede ocurrir que la distancia sea imaginaria, por qué los espacios de mikowsky son pseudo métricos, cómo se interpreta una distancia imaginaria en este método y para este algoritmo?
Gracias y un Saludo
Hola Adalberto! La distancia de Minkovski siempre es positiva. Cuando haces la resta de las características tomas el valor absoluto de la misma.
@@RocioChavezCienciadeDatos si se toma el valor absoluto siempre es positiva la distancia, pero no siempre igual, entre dos puntos puede haber tres distancias distintas numéricamente, sería muy interesante ver un ejemplo de ese algoritmo, que ventajas tiene usar a mikuusky ? O cuando se recomienda usar esa métrica?
Hola, me podria ayudar con el algoritmo spherical kMeans... Necesito entregar un proyecto para terminar mi carrera y estoy perdidisimo
Hola Cristian! Desgraciadamente no te puedo ayudar debido a que me encuentro muy llena de trabajo :(
@@RocioChavezCienciadeDatos me podria orientar donde llevar acabo mi estudio? Saludos
Páseme las diapos
Si gustas, envíame un correo a rociochavezmx@yahoo.com ;)
Si estás interesado en adquirir alguno de mis cursos en línea, vista mi página web rociochavezml.com/cursos-en-linea/ ;)
Muchas gracias Rocío, ha sido la mejor explicación que he presenciado