導讀筆記

人工智慧基礎概論

人工智慧基礎概論機器學習概念

資料處理與分析概念- 模型評估

~~下列哪一個敘述關於四分位距（IQR）是正確的？~~
~~（A）四分位距會受到極端值的影響~~
~~（B）四分位距代表資料中所有數據的分散程度~~
~~（C）四分位距是第三四分位數與第一四分位數的差~~
~~（D）四分位距與平均數一樣，容易受到極端值影響~~

~~答案：（C）四分位距是第三四分位數與第一四分位數的差~~

分類問題：

原因：四分位距（IQR）是描述資料分散程度的一個統計量，它是第三四分位數（Q3）與第一四分位數（Q1）的差值，表示資料中間50%的範圍。四分位距不受極端值的影響，因此是一個較為穩健的統計量。

~~其他選項的錯誤原因：~~

混淆矩陣

（A）四分位距不會受到極端值的影響：四分位距是根據第一四分位數和第三四分位數計算的，這兩個四分位數不受極端值的影響，因此四分位距也不受極端值的影響。
~~（B）四分位距不代表資料中所有數據的分散程度：四分位距只代表資料中間50%的範圍，不能完全代表所有數據的分散程度。~~
（D）四分位距與平均數不同，且不容易受到極端值影響：四分位距是一個描述分散程度的統計量，而平均數是一個描述中心趨勢的統計量。四分位距不容易受到極端值的影響，而平均數則容易受到極端值的影響。

(Confusion

~~下列何者「並非」K~~Matrix)

~~平均數（k-means）集群法的特點？~~
~~（A）原理相對其他集群法較為複雜~~
~~（B）可結合其他方法，使用上較為彈性~~
~~（C）在特定情況下，能將集群的任務處理得足夠好~~
~~（D）不適合非球形、數據密度變化大或有離群數據的集群問題~~準確度

/
~~答案：（A）原理相對其他集群法較為複雜~~
精確率
~~原因：K-means~~/ ~~集群法的原理其實相對簡單，主要是根據資料點之間的距離來進行聚類。與其他一些集群法相比，K-means~~召回率

~~的原理並不複雜。其他選項（B）、（C）和（D）都是~~F1-score ~~K-means~~ROC ~~的特點或限制。~~曲線

~~（B）可結合其他方法，使用上較為彈性：K-means~~/ ~~可以與其他機器學習方法結合使用，例如使用層次聚類法來初始化~~AUC ~~K-means~~值

~~的中心點。~~
~~（C）在特定情況下，能將集群的任務處理得足夠好：K-means~~ ~~在某些情況下可以取得良好的聚類結果，例如當資料點分佈成明顯的集群時。~~
~~（D）不適合非球形、數據密度變化大或有離群數據的集群問題：K-means~~ ~~不適合處理非球形的集群、數據密度變化大的情況或有離群數據的集群問題，因為它假設集群是球形的，並且對於離群數據敏感。~~迴歸問題：

均方誤差 (MSE) 平均絕對誤差 (MAE) R 分數 (R-Squared Score)