Race to the Bottom: Spatial Aggregation and Event Data

INTERNATIONAL INTERACTIONS(2022)

引用 2|浏览0
暂无评分
摘要
Researchers now have greater access to granular georeferenced (i.e., spatial) data on social and political phenomena than ever before. Such data have seen wide use, as they offer the potential for researchers to analyze local phenomena, test mechanisms, and better understand micro-level behavior. With these political event data, it has become increasingly common for researchers to select the smallest spatial scale permitted by the data. We argue that this practice requires greater scrutiny, as smaller spatial or temporal scales do not necessarily improve the quality of inferences. While highly disaggregated data reduce some threats to inference (e.g., aggregation bias), they increase the risk of others (e.g., outcome misclassification). Therefore, we argue that researchers should adopt a more principled approach when selecting the spatial scale for their analysis. To help inform this choice, we characterize the aggregation problem for spatial data, discuss the consequences of too much (or too little) aggregation, and provide some guidance for applied researchers. We demonstrate these issues using both simulated experiments and an analysis of spatial patterns of violence in Afghanistan. Los investigadores tienen ahora un acceso como nunca antes a datos georreferenciados granulares (es decir, espaciales) sobre fenomenos sociales y politicos. Estos datos se han utilizado ampliamente, ya que ofrecen a los investigadores la posibilidad de analizar fenomenos locales, probar mecanismos y comprender mejor el comportamiento a nivel micro. Con estos datos sobre acontecimientos politicos, es cada vez mas frecuente que los investigadores seleccionen la escala espacial mas pequena que permitan los datos. Sostenemos que esta practica requiere un mayor escrutinio, ya que las escalas espaciales o temporales no necesariamente mejoran la calidad de las inferencias. Si bien los datos altamente desagregados reducen algunas amenazas para la inferencia (por ejemplo, el sesgo de agregacion), aumentan el riesgo de otras (por ejemplo, la clasificacion erronea de los resultados). Por lo tanto, sostenemos que los investigadores deberian adoptar un enfoque basandose mas en principios a la hora de seleccionar la escala espacial para su analisis. Para contribuir a realizar esta eleccion, caracterizamos el problema de la agregacion de los datos espaciales, analizamos las consecuencias de una agregacion excesiva (o insuficiente) y ofrecemos algunas orientaciones para la investigacion aplicada. Demostramos estas cuestiones utilizando tanto experimentos simulados como un analisis de los patrones de violencia en Afganistan. Les chercheurs ont maintenant un meilleur acces a des donnees granulaires georeferencees (c-a-d, spatiales) sur les phenomenes politiques et sociaux que jamais auparavant. Ces donnees ont ete largement utilisees, car elles offrent aux chercheurs le potentiel d'analyser des phenomenes locaux, de tester des mecanismes et de mieux comprendre les comportements au niveau micro. Avec ces donnees sur les evenements politiques, il est devenu de plus en plus courant pour les chercheurs de selectionner la plus petite echelle spatiale permise par les donnees. Nous soutenons que cette pratique exige un examen plus approfondi, car des echelles spatiales ou temporelles plus petites n'ameliorent pas necessairement la qualite des deductions. Bien que les donnees tres desagregees reduisent certains risques pour les deductions (p. ex. biais d'agregation), elles accroissent le risque d'autres facteurs (p. ex. mauvaise classification des resultats). Par consequent, nous soutenons que les chercheurs devraient adopter une approche plus raisonnee lorsqu'ils choisissent l'echelle spatiale pour leur analyse. Afin d'eclairer ce choix, nous caracterisons le probleme de l'agregation des donnees spatiales, nous discutons des consequences d'une trop grande (ou trop faible) agregations des donnees et nous fournissons quelques conseils aux chercheurs appliques. Nous demontrons ces problemes en utilisant a la fois des experimentations simulees et une analyse des schemas spatiaux de la violence en Afghanistan.
更多
查看译文
关键词
Ecological inference, event data, measurement error, spatial scale
AI 理解论文
溯源树
样例
生成溯源树,研究论文发展脉络
Chat Paper
正在生成论文摘要