中小幼教甄 首次發佈 2020決策樹 / 機器學習【RF 隨機森林 4 大優缺點:新興教育統計理論】考古題如下:
.
有關隨機森林(Random Forests)之敘述,下列何者正確? (#教育新興議題)
..............
(A)採用 Boosting 方法。
(B)使用多個淺層決策樹 (Decision Stump) 構建整個森林。
(C)是一種重抽樣(Re-sampling)技術的應用。
(D)模型訓練的運算較難平行化
.
答案 C。(重抽樣又稱重採樣)
.
獨家剖析 #教甄檢考古題擴充 如下:
...........
.
《隨機森林》顧名思義,是用隨機的方式建立一個森林。
.
「隨機森林的用途」主要是處理分類與回歸問題,並且在沒有提高運算量的情況下提高了精確度。
.
簡單的說,隨機森林可以視為「決策樹」(Decision Tree)的延伸在機器學習中,
.
隨機森林是一個包含「多個決策樹的分類器」並且其輸出的類別是由「個別樹」輸出的類別的眾數而定。
.
Leo Breiman和 Adele Cutler發展出推論出隨機森林的演算法。
.
#心理與教育統計學教甄
.........
.
【優缺點】優點如下:
.
1.有效的處理缺失值,並且填補缺失值,即使有大量數據缺失仍然可以維持高精確度.
.
2.有效的處理少量資料。
.
3.對於數據挖掘、檢測離群點和數據可視化非常有用。
.
4.「缺點」:在某些雜訊較大的分類和回歸問題上會過擬合(overfitting)
.......
.
參見:
1.#教育研究院 2020 等網路資訊
2.心理與教育 2020 學術研討會
3.初複試自介人設 2020 部落格
.
#區塊鏈機器學習
.
#人工智慧大數據