導讀筆記
人工智慧基礎概論
人工智慧基礎概論機器學習概念
資料處理與分析概念- 模型評估
下列哪一個敘述關於四分位距(IQR)是正確的?(A)四分位距會受到極端值的影響(B)四分位距代表資料中所有數據的分散程度(C)四分位距是第三四分位數與第一四分位數的差(D)四分位距與平均數一樣,容易受到極端值影響
答案:(C)四分位距是第三四分位數與第一四分位數的差
原因:四分位距(IQR)是描述資料分散程度的一個統計量,它是第三四分位數(Q3)與第一四分位數(Q1)的差值,表示資料中間50%的範圍。四分位距不受極端值的影響,因此是一個較為穩健的統計量。
其他選項的錯誤原因:
(A)四分位距不會受到極端值的影響:四分位距是根據第一四分位數和第三四分位數計算的,這兩個四分位數不受極端值的影響,因此四分位距也不受極端值的影響。(B)四分位距不代表資料中所有數據的分散程度:四分位距只代表資料中間50%的範圍,不能完全代表所有數據的分散程度。(D)四分位距與平均數不同,且不容易受到極端值影響:四分位距是一個描述分散程度的統計量,而平均數是一個描述中心趨勢的統計量。四分位距不容易受到極端值的影響,而平均數則容易受到極端值的影響。
下列何者「並非」KMatrix)
/精確率
答案:(A)原理相對其他集群法較為複雜
原因:K-means/集群法的原理其實相對簡單,主要是根據資料點之間的距離來進行聚類。與其他一些集群法相比,K-means召回率
(B)可結合其他方法,使用上較為彈性:K-means/ 可以與其他機器學習方法結合使用,例如使用層次聚類法來初始化AUC K-means值