Normalmente el nombre es un campo que no mejora el desempeño del modelo (obvio habrá casos donde puede tener alguna relevancia pero son la minoría), por lo cual esa columna se tiende a eliminar durante el entrenamiento. Pero en general si tienes ese problema tal vez tienes que encontrar otra representación numerica del datos, justo como dices, tener un dataframe de 1,000 es una locura y mas cuando 999 columnas van a estar en 0 y solo una con 1
La verdad son todos, pero quería evitar que alguien mencionara algún paper oscuro de hace unos años que usa cadenas de texto para aprender algo jaja. Saludos!
Muchas gracias, estoy estudiando Machine Learning y aparece mucho esta tecnica, pero nunca supe que era exactamente lo que hacia 🤗🤗
Muy concreto!, gracias!
Excellent short video
Muy útil!
Y si hay una columna con 1.000 nombres?? En ese caso que hariamos?? Porque no puedes hacer un dataframe con 1.000 columnas....
Normalmente el nombre es un campo que no mejora el desempeño del modelo (obvio habrá casos donde puede tener alguna relevancia pero son la minoría), por lo cual esa columna se tiende a eliminar durante el entrenamiento. Pero en general si tienes ese problema tal vez tienes que encontrar otra representación numerica del datos, justo como dices, tener un dataframe de 1,000 es una locura y mas cuando 999 columnas van a estar en 0 y solo una con 1
La mayoría de modelos de ML???
Cuáles sí? Gracias
La verdad son todos, pero quería evitar que alguien mencionara algún paper oscuro de hace unos años que usa cadenas de texto para aprender algo jaja. Saludos!