第一部分:考試內(nèi)容及要求
一、數(shù)據(jù)挖掘概述
考試內(nèi)容
數(shù)據(jù)挖掘的概念 數(shù)據(jù)挖掘的任務 數(shù)據(jù)挖掘應用 數(shù)據(jù)挖掘的主要問題
考試要求
1.了解數(shù)據(jù)庫系統(tǒng)技術的演變過程;理解數(shù)據(jù)挖掘的概念;掌握知識發(fā)現(xiàn)過程的7個步驟。
2.掌握數(shù)據(jù)挖掘要解決的問題;掌握數(shù)據(jù)挖掘功能和模式;理解數(shù)據(jù)挖掘與統(tǒng)計學、機器學習的聯(lián)系和區(qū)別;了解數(shù)據(jù)挖掘的起源;掌握數(shù)據(jù)挖掘的任務。
二、數(shù)據(jù)
考試內(nèi)容
數(shù)據(jù)類型 數(shù)據(jù)質(zhì)量 數(shù)據(jù)預處理 相似性和相異性度量
考試要求
1.了解數(shù)據(jù)對象與屬性類型。
2.了解進行數(shù)據(jù)預處理的原因及其重要性;了解數(shù)據(jù)質(zhì)量涉及的因素;掌握數(shù)據(jù)預處理的主要步驟。
4.了解數(shù)據(jù)清理的概念;了解處理數(shù)據(jù)缺失值的方法;了解處理噪音數(shù)據(jù)的方法。
5.理解數(shù)據(jù)預處理中的聚集、抽樣、特征子集選擇以及離散化和二元化等方法。
8.理解數(shù)據(jù)對象之間相似度;數(shù)據(jù)對象之間的相異度。
三.分類和預測
考試內(nèi)容
數(shù)據(jù)分類和預測的概念 判定樹歸類算法 信息增益 樹剪枝 回歸分析 分類法的準確性 組合分類器 類不平衡問題
考試要求
1.理解數(shù)據(jù)分類的概念;了解分類的兩個過程;理解監(jiān)督學習和非監(jiān)督學習的區(qū)別;了解分類和預測的數(shù)據(jù)預處理方法;掌握評估分類和預測方法的標準。
2.了解決策樹的概念和優(yōu)缺點;了解決策樹歸分類的主要步驟;了解常用的屬性選擇度量,掌握信息增益度量的求法;理解兩種常用的樹剪枝方法。
3、掌握神經(jīng)網(wǎng)絡的分類與構造原理
4、熟練掌握單層感知機原理與學習算法
5、掌握BP算法原理與學習過程
6.了解評估分類器性能的度量;了解評估分類和預測準確率的方法(混淆矩陣、靈敏度和特小型、F度量)。
7、掌握Boosting算法的基本思想。
8、熟練掌握支持向量機SVM分類建模原理和計算方法。
9.了解組合分類器的概念和常用的組合分類方法;了解裝袋和提升的基本思想以及兩者的區(qū)別;了解隨機森林的基本思想。
10.了解類不平衡問題的概念;了解提高類不平衡數(shù)據(jù)分類準確率的一般方法。
四.挖掘頻繁模式、關聯(lián)和相關性
考試內(nèi)容
頻繁項集概念 頻繁項集挖掘方法 Apriori算法 FP-growth算法
考試要求
1.理解項集、閉項集、頻繁項集和關聯(lián)規(guī)則的概念 ;了解規(guī)則興趣度的兩種度量(支持度和置信度)。
2.了解關聯(lián)規(guī)則挖掘的步驟。
3.了解Apriori算法的步驟;了解FP-growth算法的步驟和優(yōu)缺點;掌握相關性度量提升度(lift)的計算方法。
五. 聚類分析
考試內(nèi)容
聚類分析的概念 聚類方法的分類 算法方法的距離度量 劃分方法 層次方法 基于密度的方法 基于網(wǎng)格的方法 聚類評估
考試要求
1.理解聚類分析的概念;了解聚類分析的應用領域;了解比較聚類方法的標準;了解數(shù)據(jù)挖掘?qū)垲惖牡湫鸵?;了解比較聚類方法的各個方面。
2.理解劃分方法的概念和一般特點,以及典型算法;理解層次方法的概念和一般特點,以及典型算法;理解基于密度的聚類方法的概念和一般特點,以及典型算法;理解基于網(wǎng)格的聚類方法的概念和一般特點,以及典型算法;
3.理解K-均值算法的步驟和優(yōu)缺點;
4.了解算法方法的距離度量。
5.了解聚類評估概念和主要任務;了解測定聚類質(zhì)量的方法。
第二部分:考試方法和考試時間
數(shù)據(jù)挖掘?qū)д摽荚嚥捎瞄]卷、筆試形式,考試時間為180分鐘。
第三部分:試卷結(jié)構及參考書目
(一)題分:試卷滿分為150分
(二)題型比例:
選擇題與判斷題 約30%
簡答題和計算題 約70%
(三)參考書目:
《數(shù)據(jù)挖掘?qū)д摗罚溃╆惙饽?,(美)斯坦巴赫,(美)庫瑪爾,人民郵電出版社,2010年。
以上就是成都華新文登考研輔導中心為您提供2024年浙江財經(jīng)大學研究生初試《數(shù)據(jù)挖掘綜合》考試大綱的全部內(nèi)容,更多內(nèi)容請進入考研資訊欄目 查看