medida del Gobierno #2: Clasificación del condado del continuum rural-urbano del servicio de investigación económica del departamento de Agricultura de los Estados Unidos
otra medida del gobierno de los Estados Unidos que consultamos fue los códigos del continuum rural-urbano (rucc) del servicio de Investigación Económica del departamento de Agricultura de los Estados Unidos., Estos códigos dividen los condados Metropolitanos por el tamaño del área metropolitana (similar a la clasificación NCHS) mientras que también clasifican los condados no metropolitanos por el grado de urbanización.
específicamente, los condados en áreas metropolitanas se clasifican por uno de los tres tamaños de población del área metropolitana de la que forman parte: menos de 250,000, entre 250,000 y 999,999, o 1 millón o más., La característica distintiva de este esquema de clasificación es que los condados no metropolitanos se clasifican por el número de personas que viven en un área urbana definida por la Oficina del Censo: menos de 2,500, entre 2,500 y 19,999, y 20,000 o más. ERS señala que dividir los condados no metropolitanos por el tamaño de la población urbana permite un análisis más detallado de las tendencias que afectan a las áreas no metropolitanas.
Similar a la NCHS, esta medida del gobierno generalmente se mapeó muy bien en el tipo de comunidad autoinformada., En general, ocho de cada diez encuestados que fueron clasificados como viviendo en un área no metropolitana con una población de menos de 2,500 dijeron en nuestra encuesta que viven en un área rural.
Aquí, de nuevo, que se derrumbó el seis Rural-Urbano Continuo de los Códigos urbanos, suburbanas y rurales para comparar con el auto-reporte de tipo de comunidad. Similar a la medida NCHS, los códigos RUCC clasificaron a los estadounidenses rurales con un alto grado de precisión., Un total de 68% de los clasificados como residentes en un área rural también dijeron que viven en una comunidad rural, mientras que 42% de los clasificados como residentes en un área suburbana dijeron que viven en una comunidad suburbana.
Este esquema de codificación ha comportado un poco peor cuando llegó a clasificar con precisión las zonas urbanas., Solo alrededor de un tercio (32%) de los clasificados como residentes en un área urbana — condados en un área metropolitana con una población de 1 millón o más — dijeron que viven en una comunidad urbana.
medida del Código Postal
Además de las métricas a nivel de Condado disponibles de fuentes gubernamentales, queríamos ver si podíamos comprender mejor el tipo de comunidad observando áreas geográficas más pequeñas. Específicamente, queríamos ver los códigos postales donde viven nuestros encuestados para ver si las características del área coincidían con su propia descripción.,
evaluamos esto usando dos factores como entradas: la distancia desde el Código Postal hasta el Centro de la ciudad principal más grande en el área metropolitana más cercana (medida por la distancia al ayuntamiento) y la densidad de hogares en el código postal.
Estos se incluyeron en un árbol de decisión, una técnica de aprendizaje automático diseñada para identificar la mejor configuración de variables para predecir un resultado particular, en este caso, el tipo de comunidad donde viven los estadounidenses.
el análisis del árbol de decisiones identifica varias formas de dividir un conjunto de datos en ramas en función de las opciones para cada variable., El algoritmo comienza buscando el valor entre las variables predictoras que se pueden usar para dividir el conjunto de datos en dos grupos que sean más homogéneos con respecto a la variable de resultado, en este caso, el tipo de comunidad. Estos subgrupos se llaman nodos, y el algoritmo del árbol de decisión procede a dividir cada nodo en grupos progresivamente más y más homogéneos hasta que se alcanza un criterio de detención.
nuestro análisis produjo ocho nodos que eran en gran medida homogéneos., A continuación, se seleccionaron las que se clasificarían como urbanas, suburbanas y rurales, con base en la clasificación mayoritaria dentro del nodo. En los nodos sin una mayoría clara para un solo tipo de comunidad, los datos a nivel de código postal dentro de ese nodo se evaluaron para determinar la mejor clasificación. Aquí está la clasificación resultante:
urbano: estadounidenses que viven en códigos postales que están a 12 millas o menos del centro de la ciudad más cercana y tienen una densidad de hogares de más de 1,314 hogares por milla cuadrada.,
Suburban: estadounidenses que viven en códigos postales que están a 12 millas o menos del centro de la ciudad más cercana y tienen una densidad de hogares de 1,314 hogares o menos por milla cuadrada. Este grupo también incluye personas que viven en códigos postales que están a más de 12 millas del centro de la ciudad y tienen una densidad de hogares de más de 106 hogares por milla cuadrada.
Rural: estadounidenses que viven en códigos postales que están a más de 12 millas del centro de la ciudad más cercana y tienen una densidad familiar de 106 hogares o menos por milla cuadrada.,
en la práctica, esta clasificación de áreas urbanas se aplica en gran medida a aquellos que viven en áreas densas cerca del centro de la ciudad, mientras que la clasificación de áreas rurales se aplica a aquellos que viven en áreas menos densas más lejos de las ciudades. Las áreas suburbanas son tanto las áreas menos densas cerca de las ciudades como las áreas más densas que podrían estar un poco más lejos del centro de la ciudad.
utilizando nuestro modelo de árbol de decisión, encontramos que el 56% de los que fueron clasificados como residentes en un área urbana autoidentificaron su comunidad como urbana, mientras que el 34% la identificó como suburbana y el 9% como rural., Entre los que fueron clasificados como residentes en un área suburbana, el 58% identificó su comunidad como suburbana, mientras que alrededor de una cuarta parte (24%) la identificó como urbana y el 17% como rural. Y entre aquellos que fueron clasificados como viviendo en un área rural, cerca de dos tercios (66%) identificaron su comunidad como rural, con 22% identificándola como suburbana y 9% como urbana.,
Cómo los tres medidas ido
Un par de patrones surgió cuando se compararon los tres medidas en contra de nuestros hallazgos de la encuesta. Los tres métodos clasificaron con mayor precisión a los estadounidenses rurales y les fue menos bien con los estadounidenses en áreas urbanas y suburbanas. Y si bien todas las medidas tuvieron un desempeño relativamente bueno en general, el árbol de decisiones coincidió más estrechamente con los autoinformes de los tres tipos de comunidades.,
al evaluar el modelo de árbol de decisión, cerca de dos tercios (66%) de los que fueron clasificados como residentes en un área rural también se auto-reportaron como residentes en una comunidad rural. Del mismo modo, gran parte de los que se clasificaron como residentes en zonas suburbanas (58%) y urbanas (56%) también informaron que vivían en ese tipo de comunidades.,
utilizando la clasificación del Condado de NCHS, la mayoría de los que fueron identificados como residentes en un área rural (68%) reportaron vivir en el mismo tipo de comunidad, en comparación con aproximadamente la mitad de los que fueron clasificados como residentes en una comunidad suburbana (48%) y 45% de los clasificados como residentes en áreas urbanas.
Usando la clasificación del Condado de RUCC, nuevamente cerca de dos tercios de los clasificados como rurales (68%) auto-reportaron lo mismo., La proporción más pequeña de los que se clasificaron como residentes en zonas suburbanas (42%) y urbanas (32%) informó que vivían en ese tipo de comunidades.
conclusión
si bien la medida del árbol de decisiones fue ligeramente mejor que las dos medidas gubernamentales, no hubo un ganador claro para nuestros propósitos analíticos. Al final, decidimos que el tipo de comunidad autoinformada resultó ser la métrica más útil.
el tipo de comunidad autoinformada tiene la ventaja de medir cómo se siente el encuestado., Tomemos, por ejemplo, una comunidad que se encuentra justo en el borde de una ciudad importante, técnicamente dentro de los límites. Las casas están muy separadas y no están a poca distancia de la comida o el comercio. Dado que técnicamente está dentro de los límites de la ciudad, ¿es urbana? O, debido a que las casas están muy separadas, ¿es suburbana? Determinamos que la forma en que los encuestados se sienten acerca de su comunidad nos ayudó a evaluar mejor su comunidad en una encuesta.
Este post fue escrito por Ruth Igielnik, Elizabeth Grieco y Alexandra Castillo del Pew Research Center. Ruth Igielnik es investigadora principal., Elizabeth Grieco es una escritora / editora senior centrada en la investigación periodística. Alexandra Castillo es una investigadora asociada que se centra en métodos de investigación de encuestas internacionales.