El paquete R-Language "earth"

El año pasado, Minitab compró Salford Systems y aumentó el precio de todos sus paquetes. En particular, ahora cuesta alrededor de $ 15,000 comprar su paquete MARS, poniéndolo fuera del alcance de la mayoría de tasadores residenciales.

El sustituto más cercano del paquete MARS de Salford Systems es el paquete R Language “earth”. Sin embargo, la última vez que lo utilicé hace unos 12 años, no proporcionaba modelos satisfactorios. Sin embargo, Stephen Milborrow lo ha actualizado varias veces.

Aunque tengo derechos adquiridos en las actualizaciones anuales de Salford Sytems MARS a la antigua tarifa baja, me gustaría poder hacer referencia a las técnicas de MARS en tasaciones, artículos y quizás cursos para otros tasadores. Por tanto, es necesario saber si existe una aplicación MARS alternativa disponible para otros tasadores, revisores y clientes. Entonces, me tomé un tiempo este fin de semana para ver la última versión de R / earth.

La buena noticia es que la última versión de R / earth ahora ofrece modelos que parecen ser bastante comparables a los proporcionados por Salford Sytems MARS. También es muy rápido. Debo advertir que he estado usando el producto de Salford Systems desde aproximadamente 2003 y soy bastante bueno ajustando los numerosos parámetros. Por otro lado, no tengo tanta experiencia con el paquete terrestre. Por lo tanto, estoy seguro de que con más experiencia probablemente podría hacer más ajustes en los parámetros R / earth y los paquetes de soporte para obtener mejores resultados y más salida. Si bien me inclino a creer que el paquete de Salford Systems es más fácil de usar y más robusto, no puedo asegurarlo sin una experiencia más amplia en el uso de R y Earth.

No obstante, llego a la conclusión de que el último paquete de Earth es muy bueno y debería ser una herramienta muy útil y productiva para tasadores avanzados.

He subido un conjunto de datos que contiene un subconjunto de los campos para transacciones de ventas para varias áreas MLS en Pacifica desde el 30 de enero de 2001 al 30 de enero de 2018. Puede encontrar esto en:

https://github.com/wcraytor/MLS_DATA

Este directorio público de GitHub contiene los datos como MyData.csv, una hoja de cálculo que compara lado a lado la salida de la Tierra y Marte, una lista de los comandos R / earth utilizados y un informe de la salida MARS de Salford Systems con gráficos. Los gráficos para la salida R / tierra deberían ser similares, aunque no generan tantas funciones básicas.

Cómo usar Earth:

Pon tus datos en un CSV. Recomendaría poner todas las columnas que contienen datos para la predicción en las columnas más a la izquierda, y la variable de destino, la variable que desea predecir, en la columna más a la derecha. Evite colocar otros datos en la hoja de cálculo. Use solo una hoja para simplificar las cosas.
Si sigue el paso anterior, suponiendo que sus datos están en una hoja de cálculo almacenada como C: \ Data \ MyData.csv, use los siguientes comandos de R

MyData = read.csv ("d: \ data \ MyData.csv", encabezado = VERDADERO)

x = data.frame (MyData [, 1: (ncol (MyData) -1)])
y = MyData [, ncol (MyData)]
b = tierra (x, y, nprune = 12)
resumen (b, dígitos = 2, estilo = "pmax")
Lo anterior producirá rápidamente el siguiente modelo:

y =  610,000 +

+ 234 * pmax (0, 1887 - SaleAge) // "SaleAge" son los días COE antes del 1/30/2018
- 455 * pmáx (0, Edad de venta - 1887)
+ 591 * pmáx (0, Edad de venta - 2164)
- 435 * pmáx (0, Edad de venta - 4498)
+ 239 * pmáx (0, Edad de venta - 5439)

+ 49318 * pmax (0, AreaID - 652)
+ 14475 * pmáx (0, 654 - AreaID)
- 66058 * pmax (0, AreaID - 654)

- 120 * pmáx (0, 1450 - LivingSqFt)
+ 148 * pmáx (0, LivingSqFt - 1450)

- 6.9 * pmáx (0, 15041 - Tamaño del lote)
+ 6.2 * pmáx (0, Tamaño del lote - 15041)

- 22086 * pmáx (0, 2 - Garaje)
+ 85767 * pmáx (0, Garaje - 2)

  • Este modelo tiene un R2 informado o aproximadamente 0.82. El modelo de Salford Systems tiene un R2 más alto de más de 0.84 y proporciona un modelo algo mejor, probablemente debido a mi experiencia más extensa trabajando con él.

    CONCLUSIÓN: Los tasadores encontrarán que el paquete R / earth es bastante adecuado para el trabajo de tasación mediante el uso de splines de rectificación adaptativa multivariante (MARS).

Nota a pie de página: Earth se llama "tierra" porque Salford Systems ha puesto una marca comercial en su paquete de software MARS y no permitirá que nadie más la use como etiqueta para una aplicación de software. Por lo tanto, "tierra".

http://www.milbo.org/doc/earth-notes.pdf

Deja tu comentario.

Traducir »