Ayuda con variables categóricas del conjunto de datos
Publicado por Brian (1 intervención) el 10/07/2024 09:04:32
Para mí, esta bien , pero ante la duda
#Identificación
numerical_cols = df.select_dtypes(include=[np.number]).columns
print(numerical_cols)
Sobre las variables categóricas del conjunto de datos.
a. ¿Cuálesson las variables categóricas en el conjunto de datos?
b. ¿Cuántas categorías únicas hay en cada variable categórica?
c. ¿Cuál esla frecuencia de cada categoría en las variables categóricas?
edad
tv3_1, tv3_2, tv3_3, tv3_4, tv3_5, tv3_6
tv7_1, tv7_2, tv7_3, tv7_4, tv7_5, tv7_6, tv7_7, tv7_8, tv7_9, tv7_10, tv7_11
tv8.5
tv11_1, tv11_2, tv11_3, tv11_4, tv11_5, tv11_6, tv11_7, tv11_8, tv11_9, tv11_10
tv14_1, tv14_2, tv14_3, tv14_4
tv15_1, tv15_2, tv15_3, tv15_4, tv15_5, tv15_6, tv15_7, tv15_8, tv15_9, tv15_10, tv15_11
tv18_1, tv18_2, tv18_3, tv18_4, tv18_5, tv18_6
tv19_1, tv19_2, tv19_3, tv19_4, tv19_5, tv19_6, tv19_7, tv19_8
int5.1
int6_1, int6_2, int6_3, int6_4, int6_5, int6_6
int8, int9, int10
int11_1, int11_2, int11_3, int11_4, int11_5, int11_6, int11_7, int11_8, int11_9, int11_10, int11_11, int11_12
soc2, soc3, soc4, soc5, soc6, soc7, soc8
Sirven para análisis estadísticos y detectar patrones. Tomando como ejemplo la variable de la edad, podemos calcular:
#Identificación
numerical_cols = df.select_dtypes(include=[np.number]).columns
print(numerical_cols)
Sobre las variables categóricas del conjunto de datos.
a. ¿Cuálesson las variables categóricas en el conjunto de datos?
b. ¿Cuántas categorías únicas hay en cada variable categórica?
c. ¿Cuál esla frecuencia de cada categoría en las variables categóricas?
edad
tv3_1, tv3_2, tv3_3, tv3_4, tv3_5, tv3_6
tv7_1, tv7_2, tv7_3, tv7_4, tv7_5, tv7_6, tv7_7, tv7_8, tv7_9, tv7_10, tv7_11
tv8.5
tv11_1, tv11_2, tv11_3, tv11_4, tv11_5, tv11_6, tv11_7, tv11_8, tv11_9, tv11_10
tv14_1, tv14_2, tv14_3, tv14_4
tv15_1, tv15_2, tv15_3, tv15_4, tv15_5, tv15_6, tv15_7, tv15_8, tv15_9, tv15_10, tv15_11
tv18_1, tv18_2, tv18_3, tv18_4, tv18_5, tv18_6
tv19_1, tv19_2, tv19_3, tv19_4, tv19_5, tv19_6, tv19_7, tv19_8
int5.1
int6_1, int6_2, int6_3, int6_4, int6_5, int6_6
int8, int9, int10
int11_1, int11_2, int11_3, int11_4, int11_5, int11_6, int11_7, int11_8, int11_9, int11_10, int11_11, int11_12
soc2, soc3, soc4, soc5, soc6, soc7, soc8
Sirven para análisis estadísticos y detectar patrones. Tomando como ejemplo la variable de la edad, podemos calcular:
Valora esta pregunta


0