2019-04-04

決策樹 / 機器學習【隨機森林優缺點 RF 新興教育統計理論】重抽樣/重採樣

首次發佈 2019 決策樹 / 機器學習【隨機森林 RF 新興教育統計理論】有關隨機森林(Random Forests)之敘述,下列何者正確? (A)採用 Boosting 方法。 (B)使用多個淺層決策樹 (Decision Stump) 構建整個森林。 (C)是一種重抽樣(Re-sampling)技術的應用。 (D)模型訓練的運算較難平行化 (答案 C。重抽樣又稱重採樣)獨家剖析擴增如下:
隨機森林顧名思義,是用隨機的方式建立一個森林。隨機森林的用途,主要是處理分類與回歸問題,並且在沒有提高運算量的情況下提高了精確度。簡單的說,隨機森林可以視為決策樹(Decision Tree)的延伸在機器學習中,隨機森林是一個包含多個決策樹的分類器,並且其輸出的類別是由個別樹輸出的類別的眾數而定。 Leo Breiman和 Adele Cutler發展出推論出隨機森林的演算法。
【優缺點】優點如下 1.有效的處理缺失值,並且填補缺失值,即使有大量數據缺失仍然可以維持高精確度.2.有效的處理少量資料。3.對於數據挖掘、檢測離群點和數據可視化非常有用。缺點:在某些雜訊較大的分類和回歸問題上會過擬合(overfitting)#區塊鏈機器學習 #人工智慧大數據 #心理與教育統計學教甄 #教育新興議題 #教甄口試自介