Skip to main content

導讀筆記

人工智慧基礎概論

人工智慧基礎概論機器學習概念

資料處理與分析概念- 模型評估

下列哪一個敘述關於四分位距(IQR)是正確的?
(A)四分位距會受到極端值的影響
(B)四分位距代表資料中所有數據的分散程度
(C)四分位距是第三四分位數與第一四分位數的差
(D)四分位距與平均數一樣,容易受到極端值影響

答案:(C)四分位距是第三四分位數與第一四分位數的差

分類問題:

原因:四分位距(IQR)是描述資料分散程度的一個統計量,它是第三四分位數(Q3)與第一四分位數(Q1)的差值,表示資料中間50%的範圍。四分位距不受極端值的影響,因此是一個較為穩健的統計量。

其他選項的錯誤原因:

混淆矩陣

(A)四分位距不會受到極端值的影響:四分位距是根據第一四分位數和第三四分位數計算的,這兩個四分位數不受極端值的影響,因此四分位距也不受極端值的影響。
(B)四分位距不代表資料中所有數據的分散程度:四分位距只代表資料中間50%的範圍,不能完全代表所有數據的分散程度。
(D)四分位距與平均數不同,且不容易受到極端值影響:四分位距是一個描述分散程度的統計量,而平均數是一個描述中心趨勢的統計量。四分位距不容易受到極端值的影響,而平均數則容易受到極端值的影響。

(Confusion

下列何者「並非」KMatrix)

平均數(k-means)集群法的特點?
(A)原理相對其他集群法較為複雜
(B)可結合其他方法,使用上較為彈性
(C)在特定情況下,能將集群的任務處理得足夠好
(D)不適合非球形、數據密度變化大或有離群數據的集群問題準確度
/ 

答案:(A)原理相對其他集群法較為複雜

精確率

原因:K-means/ 集群法的原理其實相對簡單,主要是根據資料點之間的距離來進行聚類。與其他一些集群法相比,K-means召回率

的原理並不複雜。其他選項(B)、(C)和(D)都是F1-score K-meansROC 的特點或限制。曲線

(B)可結合其他方法,使用上較為彈性:K-means/ 可以與其他機器學習方法結合使用,例如使用層次聚類法來初始化AUC K-means

的中心點。
(C)在特定情況下,能將集群的任務處理得足夠好:K-means 在某些情況下可以取得良好的聚類結果,例如當資料點分佈成明顯的集群時。
(D)不適合非球形、數據密度變化大或有離群數據的集群問題:K-means 不適合處理非球形的集群、數據密度變化大的情況或有離群數據的集群問題,因為它假設集群是球形的,並且對於離群數據敏感。迴歸問題:
    均方誤差 (MSE) 平均絕對誤差 (MAE) R 分數 (R-Squared Score)