Serie de aprendizaje automático (36): descripción general de los árboles de decisión de regresión y los árboles de decisión

Los árboles de decisión de regresión son modelos de árboles de decisión que se utilizan para la regresión. El árbol de decisión de regresión se refiere principalmente al algoritmo CART, que también es una estructura de árbol binario. Tomando como ejemplo el problema de regresión de dos resultados de predicción de características, el principio del árbol de regresión es dividir el plano de características en varias unidades, y cada unidad corresponde a una salida específica. Debido a que cada nodo es un juicio de sí o no, los límites son paralelos a los ejes de coordenadas. Para los datos de prueba, solo necesitamos clasificar las características en una determinada unidad de acuerdo con el proceso de toma de decisiones para obtener el valor de salida de regresión correspondiente.

Según la división y el árbol de regresión correspondiente que se muestran en la figura anterior, si las características de un nuevo dato son (6, 7.5), según el árbol de regresión, el resultado de regresión correspondiente es C5. El proceso de dividir nodos es también el proceso de construir un árbol. Cada vez que se realiza una división, se determina inmediatamente la salida correspondiente a la unidad de división y hay un nodo más. Cuando finaliza la partición de acuerdo con las restricciones correspondientes, finalmente se determina la salida de cada unidad, y la salida también es un nodo hoja. Esto puede parecer similar a un árbol de clasificación, pero en realidad es muy diferente. Encontrar el punto de corte y determinar el valor de salida son las dos cuestiones centrales de los árboles de decisión de regresión.

El error de segmentación del espacio de entrada se mide mediante el método de mínimos cuadrados entre el valor real y el valor predicho de la región segmentada:

dónde está el valor predicho de cada unidad segmentada , la predicción El valor es una combinación de los valores de cada punto de muestra en la unidad, por ejemplo, se puede tomar la media:

(El espacio de características de entrada se divide en)

Entonces resolver la segmentación óptima es resolver la pregunta de optimización:

Dónde y están las dos regiones formadas por cada partición.

La solución a este problema de optimización no se presentará aquí. Usamos directamente el árbol de regresión de decisión en skleen para ver el efecto de regresión del árbol de decisión. El conjunto de datos utiliza datos de precios de vivienda de Boston:

Sin ajuste de parámetros, podemos ver que el R cuadrado en el conjunto de prueba es 0,59, lo que obviamente no es un buen resultado, pero es un fenómeno interesante, en el conjunto de entrenamiento:

El valor de R cuadrado es 1.0, lo que significa que los resultados de regresión predichos por el árbol de decisión en el conjunto de entrenamiento son completamente consistentes, sin desviación y obviamente sobreajustados. Este ejemplo también muestra que el algoritmo del árbol de decisión es muy propenso al sobreajuste. Por supuesto, podemos aliviar el sobreajuste ajustando los parámetros.

Dibujemos una curva de aprendizaje para ver directamente el rendimiento del modelo de regresión del árbol de decisión. Primero, dibuje una curva de aprendizaje basada en MSE:

La curva de aprendizaje es la siguiente:

Luego dibuje la curva de aprendizaje basada en r-cuadrado:

La Los dos resultados anteriores se obtienen de forma predeterminada, es decir, la profundidad y el número de nodos de hoja del árbol de decisión no están limitados. Se descubrió que en el conjunto de entrenamiento, si no hay restricciones, se puede lograr una desviación cero, lo que es un sobreajuste obvio. Luego ajuste los parámetros y dibuje una curva de aprendizaje. Para ahorrar espacio, solo se ajusta la profundidad del árbol de decisión y solo se dibuja la curva de aprendizaje basada en r-cuadrado:

Max_profundidad=1

Cuando profundidad máxima=3

Cuando la profundidad máxima = 5

A medida que aumenta la profundidad, la complejidad del modelo se vuelve cada vez mayor y el fenómeno de sobreajuste se vuelve cada vez más obvio. Se puede verificar que cuando max_profundidad = 20, hay una línea recta imparcial con y = 1 en el conjunto de entrenamiento. Los estudiantes interesados aún pueden modificar otros parámetros para dibujar una curva de aprendizaje.

Limitaciones de los árboles de decisión:

Utilizando los datos del iris del último artículo de esta serie, analizamos las consecuencias de la sensibilidad de los árboles de decisión a los datos individuales. En el artículo anterior de esta serie, se utilizó la entropía de la información para la partición y el límite de decisión trazado de forma predeterminada para otros parámetros fue:

Luego eliminamos los datos con el índice 138 y luego dibujamos el límite de decisión:

Se descubre que el límite de decisión en este momento es completamente diferente, y esto es solo el impacto de un punto de datos.

En resumen, sabemos que el árbol de decisión es en realidad un algoritmo inestable y su rendimiento depende en gran medida de los parámetros y datos de ajuste. Sin embargo, aunque el árbol de decisión en sí no es un algoritmo de aprendizaje automático eficiente, su combinación basada en el aprendizaje conjunto - Random Forest (RF) es un algoritmo de aprendizaje automático muy robusto, que se presentará en el próximo capítulo.

上篇: ¿Qué significa soñar con fuego? La interpretación de los sueños del duque Zhou. 下篇: Biografía de SangcaihuaBiografía de Jinyang Lanze En una tarde soleada de marzo, la niña tibetana llamada Jinyang Lanze estaba tan saludable como la nieve y el sol. Su sonrisa franca cuenta su hermosa y conmovedora historia. vida y arte, tierra y emoción, búsqueda y sueño. Ayer y hoy, la predicción y la realidad, el accidente y la necesidad, intencionales y no intencionales, algo llamado "destino", con su actitud inexplicable y maravillosamente atractiva, se ha estado balanceando en el camino ante los ojos de Yang Jinlanze, convirtiéndose en un extraño paisaje en el camino. de la vida. Se trataba de una temporada soleada en la segunda mitad de 2005. En el ruidoso mercado lleno de canciones pop, la gente se sorprendió de repente al escuchar una canción melodiosa que salía del videoclub que daba a la calle. El canto es como el hilo interminable de agua de manantial, y como el raro y hermoso hada de seda del mundo, que susurra suavemente y baila ligeramente. La expresión simple y concisa de la letra y la expresión de sentimientos verdaderos, profundos y atemporales hacen que toda la canción se extienda y sea desenfrenada mientras se canta en voz baja. Xu Xiansheng es de mente abierta, profunda y reservada, y la cantante puede liberar libremente una voz magnética ligeramente ronca, lo que hace que las canciones sean más abiertas y cordiales, capturando instantáneamente los tímpanos y los corazones de las personas. La canción combina perfectamente las características melódicas de las costumbres étnicas y los elementos de la moda, especialmente el timbre y la voz únicos de la cantante, lo que hizo que muchas personas pensaran erróneamente que se trata de otra nueva obra maestra presentada a los fans por esta popular cantante de la escena musical tibetana. Hasta que más personas finalmente descubrieron un nombre aún hermoso pero completamente desconocido en la portada del álbum bellamente encuadernado: Jin Yang Lanze. Este nombre, junto con la canción titulada "Meeting You Is My Fate", ya no se propaga como la pólvora, extendiéndose por todas partes. Otra estrella brillante y deslumbrante se eleva lentamente. ■Dream in the Bag, el título de la canción que hizo famosa a Yang Jinlanze de un solo golpe, parece haberse convertido en una profecía, lo que hizo que su joven vida artística estuviera destinada a estar indisolublemente ligada al "destino" desde el principio. Jin Yang Lanze nació en la ciudad de Jiegu, prefectura autónoma tibetana de Yushu, Qinghai, conocida como la "ciudad natal de la canción y la danza". Las antiguas y milagrosas montañas sagradas y las aguas benditas del Tíbet y los magníficos cantos y danzas tibetanos han influido y nutrido profundamente al pequeño Jin Yang desde que era un niño. Además, mi padre trabaja en el grupo de danza y canto de la prefectura de Yushu, mi madre es actriz en la primera clase de "Little Eight Road" del departamento de danza de la Universidad Renmin del Noroeste y mi hermana también toca el violín en el grupo de danza y canto de la prefectura de Yushu. Compañía de Danza. La fuerte atmósfera artística familiar dotó a Xiao Yangjin de buenos talentos para el canto y el baile. Ha sido alegre y vivaz desde niña, le encanta cantar y bailar. Nace con una voz clara y pura. Cuando estaba en la escuela secundaria, a mi maestra siempre le gustaba elegirla como cantante principal en varios concursos literarios en la escuela. Esta puede ser su primera asociación con el arte. El presagio de su vida siempre ha sido silencioso. Cuando me gradué de la escuela secundaria, la escuela de arte provincial vino a Yushu para reclutar estudiantes. Xiao Jin Yang, que ama la música y el arte desde la infancia, siempre ha envidiado a su hermana y anhelaba tocar un violín hermoso y genial como su hermana. Con el consejo y el aliento de su hermana, la pequeña Jin Yang finalmente fue a la escuela de arte provincial como Ding Bai con todas sus expectativas. En comparación con el tono sentimental y melancólico del violín, descubrió que prefería la música instrumental folclórica ligera, alegre y rítmica, que parecía estar más cerca de su brillante personalidad, por lo que decidió especializarse en dulcimer. A partir de entonces, Xiao, que se había adaptado a su destino, tropezó con el camino del arte e inesperadamente forjó un significado inolvidable para "qin" durante cuatro años. Mirando retrospectivamente el repentino ascenso de Jin Yang Lanze en el mundo de la música vocal, parece ser contrario a su elección original. De hecho, a lo largo de cuatro años de riguroso estudio de la música instrumental, no solo ejercitó eficazmente sus cualidades básicas como escuchar y escuchar, sentando una base sólida, sino que también aprendió a comprender y captar con precisión y profundidad el significado transmitido por una pieza de música. Música, pensamientos, emociones y contenidos espirituales. Esta valiosísima acumulación y práctica en el arte es precisamente la enfermedad crónica de los cantantes más impetuosos y exagerados del mundo musical actual. Yang Jinlan caminó hacia la entrada sin ningún sentimiento y abrió los canales Ren y Du. ¿Quién no puede decir que esto es el destino? Entre el destino y el azar, el giro mutuo de causa y efecto entre sujeto y objeto siempre coincide con el punto de partida y el punto final de su cadena vital. Después de graduarse de la escuela de arte, Yang Jinlanze regresó a su ciudad natal y trabajó como dulcimerista a tiempo completo en el grupo de danza y canto de la prefectura de Yushu, y comenzó a dedicarse a actuaciones coloridas y ajetreadas. Mucha práctica escénica le dio a Yang Jinlanze más oportunidades de mostrar sus diversos talentos artísticos. Yang Jinlanze es una persona natural a la que siempre le gusta hacer lo que le gusta. No se limitará ni establecerá sus propias barreras debido a divisiones profesionales u opiniones mundanas. En presentaciones frecuentes, a menudo improvisa en el escenario, imitando vívidamente los estilos de cantantes pop como Na Ying y A Mei, y ocasionalmente presentadores invitados. A medida que crecía, su voz se volvió más madura y sexy.