決策樹是一種通過樹形結(jié)構(gòu)進(jìn)行分類的人工智能預(yù)測(cè)模型,如根據(jù)圖1所示“氣象特點(diǎn)與游客是否來游樂場(chǎng)的關(guān)系”繪制的如圖2所示的決策樹樹形結(jié)構(gòu):
通過了解當(dāng)天的是否有風(fēng)、天氣、溫度和濕度這4個(gè)節(jié)點(diǎn)參數(shù)即可預(yù)測(cè)當(dāng)天是否有人來游樂場(chǎng)。
不同的節(jié)點(diǎn)劃分順序可以繪制不同的決策樹,為了選出最優(yōu)的節(jié)點(diǎn)劃分順序,需要采用“信息熵”與“信息增益”指標(biāo)。
信息熵,又稱香農(nóng)熵,被用來度量信息量的大小,信息熵越大表示信息量越大。
信息增益,表示樣本經(jīng)某節(jié)點(diǎn)劃分后的信息熵變化大小。我們繪制決策樹時(shí)應(yīng)當(dāng)逐次選擇信息增益最大的節(jié)點(diǎn)作為當(dāng)前節(jié)點(diǎn)。
對(duì)于有n個(gè)信息的樣本D,記第k個(gè)信息發(fā)生的概率為pk,信息熵計(jì)算公式為E(D)=?∑n1pklog2(pk),
例如游樂場(chǎng)14個(gè)樣本中“去”(9個(gè))、“不去”(5個(gè)),則信息熵=?(914log2914+514log2514)=0.940
若樣本按“是否有風(fēng)”節(jié)點(diǎn)劃分,“是”(6個(gè),其中3個(gè)去,3個(gè)不去)信息熵=?(36log236+36log236)=1;
“否”(8個(gè),其中6個(gè)去,2個(gè)不去)信息熵=?(68log268+28log228)=0.811;經(jīng)過此節(jié)點(diǎn)劃分后的信息增益=原始信息熵?按此節(jié)點(diǎn)劃分后樣本信息熵比例和=0.940?(614×1+814×0.811)=0.048。
(1)根據(jù)上述描述與圖1,則“天氣”節(jié)點(diǎn)中的“多云”信息熵是 00。
(2)實(shí)現(xiàn)求首次劃分節(jié)點(diǎn)的程序如下,請(qǐng)?jiān)跈M線處填入合適的代碼:
n
1
9
14
9
14
5
14
5
14
3
6
3
6
3
6
3
6
6
8
6
8
2
8
2
8
6
14
8
14
【考點(diǎn)】應(yīng)用程序的試運(yùn)行和保存.
【答案】0
【解答】
【點(diǎn)評(píng)】
聲明:本試題解析著作權(quán)屬菁優(yōu)網(wǎng)所有,未經(jīng)書面同意,不得復(fù)制發(fā)布。
發(fā)布:2024/6/27 10:35:59組卷:0引用:1難度:0.3
相似題
-
1.有如下VB程序段:
執(zhí)行該程序段后,變量c的值是( )發(fā)布:2024/12/16 5:0:1組卷:1引用:2難度:0.3 -
2.由大寫字母組成的長(zhǎng)度相同的兩個(gè)字符串s1和s2,檢測(cè)各字母的數(shù)量,如“ABDAC”與“AABCD”所含字母數(shù)量一樣,與“AABBC”所含字母數(shù)量不一樣。實(shí)現(xiàn)該功能的VB程序段如下:
填空處的代碼可以由以下部分組成:
①Text2.Text ②val(Text2.Text) ③b(a)=b(a)+1 ④b(a)=b(a)-1 ⑤b(i)<>0⑥b(i)=0
代碼順序正確的是( ?。?/h2>發(fā)布:2024/12/16 9:30:1組卷:3引用:3難度:0.4 -
3.小明用python語言中對(duì)大小為100*100像素的圖像“上.jpg”(如圖所示)進(jìn)行簡(jiǎn)單處理,部分代碼如圖:
程序執(zhí)行后的圖像效果是( )發(fā)布:2024/12/20 9:30:2組卷:3引用:5難度:0.4
把好題分享給你的好友吧~~