Разлика између вреве и случајне шуме

Током година, више класификаторских система, који се називају и ансамбл системи, постало је популарна истраживачка тема и уживало је све већу пажњу унутар рачунарске рачунарске и машинске учења. Привукло је интересовање научника из неколико области, укључујући машинско учење, статистику, препознавање образаца и откривање знања у базама података. Временом су се методе ансамбла показале врло ефикасним и свестраним у широком спектру проблематичних домена и апликација у стварном свету. Првобитно развијена да би се смањила разлика у аутоматизованом систему доношења одлука, методе ансамбла отада се користе за решавање разних проблема машинског учења. Представљамо преглед два најистакнутија алгоритма ансамбла - Баггинг и Рандом Форест - а затим расправљамо о разликама између ова два.

У многим случајевима се показало да врећа са врећама, која користи узорковање за подизање система за подизање система за обућу, има класификацију да има већу тачност од једног стабла класификације. Пребацивање је један од најстаријих и најједноставнијих алгоритама заснованих на ансамблу, који се могу применити на алгоритме засноване на дрвету како би се повећала тачност предвиђања. Постоји још једна побољшана верзија паковања под називом Рандом Форест алгоритам, која је у основи ансамбл стабала која су обучена механизмом за пакирање. Погледајмо како функционише случајни алгоритам шума и како се он разликује од пакирања у ансамблове моделе.

Торба

Агрегат покретања, такође познат као стварање врећа, један је од најранијих и најједноставнијих алгоритама заснованих на ансамблу како би стабла одлука била снажнија и постигла боље перформансе. Концепт који се крије иза паковања смета је комбиновање предвиђања неколико основних ученика како би се добио тачнији резултат. Лео Бреиман је представио алгоритам мешања у 1994. Показао је да здруживање покретања може донијети жељене резултате у нестабилним алгоритамима учења где мале промене података о тренингу могу проузроковати велике варијације у предвиђањима. Боотстрап је узорак скупа података са заменом и сваки узорак се генерише равномерним узорковањем тренинг-сета величине м док се не добије нови скуп са м инстанцама.

Рандом Форест

Случајна шума је надзирани алгоритам машинског учења заснован на учењу ансамбла и еволуцији Бреимановог оригиналног алгоритма за дрварање. То је велико побољшање у односу на скупљена стабла одлука како би се изградило више стабала одлука и објединило их да би се добио тачан резултат. Бреиман је додао додатну случајну варијацију у поступку пуњења, стварајући већу разноликост међу резултирајућим моделима. Случајне шуме разликују се од заклоњених стабала по томе што присиљавају дрво да користи само подскуп својих доступних предвиђача да се цепају у фази раста. Сва стабла одлука која чине случајну шуму су различита јер је свако стабло изграђено на различитом случајном подскупу података. Будући да минимизира прекомерно уклапање, тежи да буде тачнији од једног стабла одлука.

Разлика између вреве и случајне шуме

Основе

- И врећа и насумична шума су алгоритми засновани на ансамблу који имају за циљ да смање сложеност модела који прекомерно задовољавају податке о тренингу. Сакупљање чизама, такођер названо пакирање, једна је од најстаријих и моћних метода ансамбла за спречавање прекомерног намештања. То је мета техника која користи више класификатора за побољшање прецизности предвиђања. Торба једноставно значи извлачење случајних узорака из узорка тренинга ради замјене како би се добио ансамбл различитих модела. Случајна шума је надзирани алгоритам машинског учења заснован на ансамбловом учењу и еволуцији Бреимановог оригиналног алгоритма за пакирање.

Концепт

- Концепт узорковања боотстрап-а (пакирање у боотстрап) је тренирање гомиле непотпуњених стабала одлука на различитим случајним подскуповима података о тренингу, узорковање са заменом, како би се смањила варијанца стабала одлука. Идеја је да се комбинују предвиђања неколико полазника како би се створио тачнији резултат. Уз случајне шуме, додатна случајна варијација је додата у поступак смештања како би се створила већа разноликост међу резултирајућим моделима. Идеја иза насумичних шума је да се направе више стабала одлука и обједине их како би се добио тачан резултат.

Циљ

- И дрвеће у врећама и случајна шума најчешћи су инструменти за учење ансамбла који се користе за рјешавање различитих проблема машинског учења. Узорковање боотстрап-а је мета-алгоритам дизајниран да побољша прецизност и стабилност модела машинског учења користећи ансамбл учење и смањи сложеност модела прекомпоновања. Алгоритам случајних шума врло је чврст против прекомерног уклапања и добар је са неуравнотеженим и недостајућим подацима. Такође је преферирани избор алгоритма за изградњу предиктивних модела. Циљ је смањити одступање просечним више стабала дубоких одлука, обучених на различитим узорцима података.

Баггинг вс. Рандом Форест: упоредни графикон

Резиме

И дрвеће у врећама и случајна шума најчешћи су инструменти за учење ансамбла који се користе за рјешавање различитих проблема машинског учења. Пребацивање је један од најстаријих и најједноставнијих алгоритама заснованих на ансамблу, који се могу применити на алгоритме засноване на дрвету како би се повећала тачност предвиђања. Насумично, шуме су алгоритам машинског учења под надзором и побољшана верзија модела узорковања при покретању система који се користи и за регресију и за класификацију. Идеја иза случајне шуме је да се изгради више стабала одлука и њихово здруживање како би се добио тачан резултат. Насумична шума обично је тачнија од једног стабла одлука јер минимизира прекомерно уклапање.