RD se usa en experimentos cuasiexperimentales, lo cual es diferente de los modelos en experimentos aleatorios naturales que agregan directamente variables ficticias y usan estimación MCO.
Los métodos de estimación son diferentes. RD generalmente utiliza un método de regresión lineal local (es decir, luego selecciona muestras dentro de un determinado ancho de banda en lugar de todas las muestras), que es esencialmente una estimación del efecto de procesamiento promedio local alrededor del punto de interrupción. Imbens y Kalyanaraman (2009) proporcionan estimaciones del ancho de banda óptimo y, a menudo, proporcionan resultados para diferentes anchos de banda para mostrar la solidez de los resultados. A veces, RD también utiliza el método no paramétrico de regresión del kernel.
RD necesita probar el problema de la clasificación endógena, es decir, asumir que si los individuos conocen las reglas de agrupación de antemano y pueden controlar completamente las variables de agrupación a través de sus propios esfuerzos, esto conducirá al fracaso de la discontinuidad. regresión.
Si agrega covariables a RD, debe verificar si la densidad condicional de la covariable es continua en el punto de interrupción, es decir, el "salto" en el punto de interrupción no es causado por el "salto" de la covariable.
Nota: El contenido anterior se centra principalmente en si la variable ficticia de la variable de agrupación (llamada z) es mayor que el punto de interrupción y se utiliza como variable instrumental para procesar la variable (llamada d, el estimador principal ). Obviamente, Z está relacionado con D. Z es equivalente a un experimento aleatorio local cerca del punto de interrupción, por lo que solo afecta a las variables Y a D y no tiene nada que ver con el término de perturbación, por lo que cumple con la externalidad. Se puede estimar utilizando z como variable instrumental para d y 2SLS.