唐詩是中國文學(xué)的瑰寶.為了研究計算機(jī)上唐詩分類工作中檢索關(guān)鍵字的選取,某研究人員將唐詩分成7大類別,并從《全唐詩》48900多篇唐詩中隨機(jī)抽取了500篇,統(tǒng)計了每個類別及各類別包含“花”、“山”、“簾”字的篇數(shù),得到如表:
|
愛情婚姻 |
詠史懷古 |
邊塞戰(zhàn)爭 |
山水田園 |
交游送別 |
羈旅思鄉(xiāng) |
其他 |
總計 |
篇數(shù) |
100 |
64 |
55 |
99 |
91 |
73 |
18 |
500 |
含“山”字的篇數(shù) |
51 |
48 |
21 |
69 |
48 |
30 |
4 |
271 |
含“簾”字的篇數(shù) |
21 |
2 |
0 |
0 |
7 |
3 |
5 |
38 |
含“花”字的篇數(shù) |
60 |
6 |
14 |
17 |
32 |
28 |
3 |
160 |
(1)根據(jù)上表判斷,若從《全唐詩》含“山”字的唐詩中隨機(jī)抽取一篇,則它屬于哪個類別的可能性最大,屬于哪個類別的可能性最小,并分別估計該唐詩屬于這兩個類別的概率;
(2)已知檢索關(guān)鍵字的選取規(guī)則為:
①若有超過95%的把握判斷“某字”與“某類別”有關(guān)系,則“某字”為“某類別”的關(guān)鍵字;
②若“某字”被選為“某類別”關(guān)鍵字,則由其對應(yīng)列聯(lián)表得到的K
2的觀測值越大,排名就越靠前;
設(shè)“山”“簾”“花”和“愛情婚姻”對應(yīng)的K
2觀測值分別為k
1,k
2,k
3.已知k
1≈0.516,k
2≈31.962,請完成下面列聯(lián)表,并從上述三個字中選出“愛情婚姻”類別的關(guān)鍵字并排名.
|
屬于“愛情婚姻”類 |
不屬于“愛情婚姻”類 |
總計 |
含“花”字的篇數(shù) |
|
|
|
不含“花”字的篇數(shù) |
|
|
|
總計 |
|
|
|
附:K
2=
,其中n=a+b+c+d.
P(K2≥k) |
0.05 |
0.025 |
0.010 |
k |
3.841 |
5.024 |
6.635 |