劉華鵬,劉華鵬講師,劉華鵬聯(lián)系方式,劉華鵬培訓(xùn)師-【中華講師網(wǎng)】
AI 驅(qū)動(dòng)數(shù)字化轉(zhuǎn)型實(shí)戰(zhàn)專(zhuān)家
49
鮮花排名
0
鮮花數(shù)量
掃一掃加我微信
劉華鵬:淺析十三種常用的數(shù)據(jù)挖掘的技術(shù)
2016-01-20 12851

更多精彩內(nèi)容參見(jiàn):https://liuhuapeng.jiangshi.org

數(shù)據(jù)挖掘的技術(shù)有很多種,按照不同的分類(lèi)有不同的分類(lèi)法。下面著重討論一下數(shù)據(jù)挖掘中常用的一些技術(shù):統(tǒng)計(jì)技術(shù),關(guān)聯(lián)規(guī)則,基于歷史的分析,遺傳算法,聚集檢測(cè),連接分析,決策樹(shù),神經(jīng)網(wǎng)絡(luò),粗糙集,模糊集,回歸分析,差別分析,概念描述等十三種常用的數(shù)據(jù)挖掘的技術(shù)

1、統(tǒng)計(jì)技術(shù)

數(shù)據(jù)挖掘涉及的科學(xué)領(lǐng)域和技術(shù)很多,如統(tǒng)計(jì)技術(shù)。統(tǒng)計(jì)技術(shù)對(duì)數(shù)據(jù)集進(jìn)行挖掘的主要思想是:統(tǒng)計(jì)的方法對(duì)給定的數(shù)據(jù)集合假設(shè)了一個(gè)分布或者概率模型(例如一個(gè)正態(tài)分布)然后根據(jù)模型采用相應(yīng)的方法來(lái)進(jìn)行挖掘。

2、關(guān)聯(lián)規(guī)則

數(shù)據(jù)關(guān)聯(lián)是數(shù)據(jù)庫(kù)中存在的一類(lèi)重要的可被發(fā)現(xiàn)的知識(shí)。若兩個(gè)或多個(gè)變量的取值之I司存在某種規(guī)律性,就稱(chēng)為關(guān)聯(lián)。關(guān)聯(lián)可分為簡(jiǎn)單關(guān)聯(lián)、時(shí)序關(guān)聯(lián)、因果關(guān)聯(lián)。關(guān)聯(lián)分析的目的是找出數(shù)據(jù)庫(kù)中隱藏的關(guān)聯(lián)網(wǎng)。有時(shí)并不知道數(shù)據(jù)庫(kù)中數(shù)據(jù)的關(guān)聯(lián)函數(shù),即使知道也是不確定的,因此關(guān)聯(lián)分析生成的規(guī)則帶有可信度。

3、基于歷史的MBR(Memory-basedReasoning)分析

先根據(jù)經(jīng)驗(yàn)知識(shí)尋找相似的情況,然后將這些情況的信息應(yīng)用于當(dāng)前的例子中。這個(gè)就是MBR(Memory BasedReasoning)的本質(zhì)。MBR首先尋找和新記錄相似的鄰居,然后利用這些鄰居對(duì)新數(shù)據(jù)進(jìn)行分類(lèi)和估值。使用MBR有三個(gè)主要問(wèn)題,尋找確定的歷史數(shù)據(jù);決定表示歷史數(shù)據(jù)的最有效的方法;決定距離函數(shù)、聯(lián)合函數(shù)和鄰居的數(shù)量。

4、遺傳算法GA(Genetic Algorithms)

基于進(jìn)化理論,并采用遺傳結(jié)合、遺傳變異、以及自然選擇等設(shè)計(jì)方法的優(yōu)化技術(shù)。主要思想是:根據(jù)適者生存的原則,形成由當(dāng)前群體中最適合的規(guī)則組成新的群體,以及這些規(guī)則的后代。典型情況下,規(guī)則的適合度(Fitness)用它對(duì)訓(xùn)練樣本集的分類(lèi)準(zhǔn)確率評(píng)估。

5、聚集檢測(cè)

將物理或抽象對(duì)象的集合分組成為由類(lèi)似的對(duì)象組成的多個(gè)類(lèi)的過(guò)程被稱(chēng)為聚類(lèi)。由聚類(lèi)所生成的簇是一組數(shù)據(jù)對(duì)象的集合,這些對(duì)象與同一個(gè)簇中的對(duì)象彼此相似,與其它簇中的對(duì)象相異。相異度是根據(jù)描述對(duì)象的屬眭值來(lái)計(jì)算的,距離是經(jīng)常采用的度量方式。

6、連接分析

連接分析,Link analysis,它的基本理論是圖論。圖論的思想是尋找一個(gè)可以得出好結(jié)果但不是完美結(jié)果的算法,而不是去尋找完美的解的算法。連接分析就是運(yùn)用了這樣的思想:不完美的結(jié)果如果是可行的,那么這樣的分析就是一個(gè)好的分析。利用連接分析,可以從一些用戶(hù)的行為中分析出一些模式;同時(shí)將產(chǎn)生的概念應(yīng)用于更廣的用戶(hù)群體中。


7、決策樹(shù)

決策樹(shù)提供了一種展示類(lèi)似在什么條件下會(huì)得到什么值這類(lèi)規(guī)則的方法。

8、神經(jīng)網(wǎng)絡(luò)

在結(jié)構(gòu)上,可以把一個(gè)神經(jīng)網(wǎng)絡(luò)劃分為輸入層、輸出層和隱含層。輸入層的每個(gè)節(jié)點(diǎn)對(duì)應(yīng)—個(gè)個(gè)的預(yù)測(cè)變量。輸出層的節(jié)點(diǎn)對(duì)應(yīng)目標(biāo)變量,可有多個(gè)。在輸入層和輸出層之間是隱含層(對(duì)神經(jīng)網(wǎng)絡(luò)使用者來(lái)說(shuō)不可見(jiàn)),隱含層的層數(shù)和每層節(jié)點(diǎn)的個(gè)數(shù)決定了神經(jīng)網(wǎng)絡(luò)的復(fù)雜度。

除了輸入層的節(jié)點(diǎn),神經(jīng)網(wǎng)絡(luò)的每個(gè)節(jié)點(diǎn)都與很多它前面的節(jié)點(diǎn)(稱(chēng)為此節(jié)點(diǎn)的輸入節(jié)點(diǎn))連接在一起,每個(gè)連接對(duì)應(yīng)一個(gè)權(quán)重Wxy,此節(jié)點(diǎn)的值就是通過(guò)它所有輸入節(jié)點(diǎn)的值與對(duì)應(yīng)連接權(quán)重乘積的和作為—個(gè)函數(shù)的輸入而得到,我們把這個(gè)函數(shù)稱(chēng)為活動(dòng)函數(shù)或擠壓函數(shù)。

9、粗糙集

粗糙集理論基于給定訓(xùn)練數(shù)據(jù)內(nèi)部的等價(jià)類(lèi)的建立。形成等價(jià)類(lèi)的所有數(shù)據(jù)樣本是不加區(qū)分的,即對(duì)于描述數(shù)據(jù)的屬性,這些樣本是等價(jià)的。給定現(xiàn)實(shí)世界數(shù)據(jù),通常有些類(lèi)不能被可用的屬性區(qū)分。粗糙集就是用來(lái)近似或粗略地定義這種類(lèi)。

10、模糊集

模糊集理論將模糊邏輯引入數(shù)據(jù)挖掘分類(lèi)系統(tǒng),允許定義“模糊”域值或邊界。模糊邏輯使用0.0和1.0之間的真值表示一個(gè)特定的值是一個(gè)給定成員的程度,而不是用類(lèi)或集合的精確截?cái)唷D:壿嬏峁┝嗽诟叱橄髮犹幚淼谋憷?/span>

11、回歸分析

回歸分析分為線(xiàn)性回歸、多元回歸和非線(xiàn)性同歸。在線(xiàn)性回歸中,數(shù)據(jù)用直線(xiàn)建模,多元回歸是線(xiàn)性回歸的擴(kuò)展,涉及多個(gè)預(yù)測(cè)變量。非線(xiàn)性回歸是在基本線(xiàn)性模型上添加多項(xiàng)式項(xiàng)形成非線(xiàn)性同門(mén)模型。

12、差別分析

差別分析的目的是試圖發(fā)現(xiàn)數(shù)據(jù)中的異常情況,如噪音數(shù)據(jù),欺詐數(shù)據(jù)等異常數(shù)據(jù),從而獲得有用信息。

13、概念描述

概念描述就是對(duì)某類(lèi)對(duì)象的內(nèi)涵進(jìn)行描述,并概括這類(lèi)對(duì)象的有關(guān)特征。概念描述分為特征性描述和區(qū)別性描述,前者描述某類(lèi)對(duì)象的共同特征,后者描述不同類(lèi)對(duì)象之間的區(qū)別,生成一個(gè)類(lèi)的特征性描述只涉及該類(lèi)對(duì)象中所有對(duì)象的共性。

更多精彩內(nèi)容參見(jiàn):https://liuhuapeng.jiangshi.org

 

全部評(píng)論 (0)
熱門(mén)領(lǐng)域講師
互聯(lián)網(wǎng)營(yíng)銷(xiāo) 互聯(lián)網(wǎng) 新媒體運(yùn)營(yíng) 短視頻 電子商務(wù) 社群營(yíng)銷(xiāo) 抖音快手 新零售 網(wǎng)絡(luò)推廣 領(lǐng)導(dǎo)力 管理技能 中高層管理 中層管理 團(tuán)隊(duì)建設(shè) 團(tuán)隊(duì)管理 高績(jī)效團(tuán)隊(duì) 創(chuàng)新管理 溝通技巧 執(zhí)行力 阿米巴 MTP 銷(xiāo)售技巧 品牌營(yíng)銷(xiāo) 銷(xiāo)售 大客戶(hù)營(yíng)銷(xiāo) 經(jīng)銷(xiāo)商管理 銷(xiāo)講 門(mén)店管理 商務(wù)談判 經(jīng)濟(jì)形勢(shì) 宏觀經(jīng)濟(jì) 商業(yè)模式 私董會(huì) 轉(zhuǎn)型升級(jí) 股權(quán)激勵(lì) 納稅籌劃 非財(cái)管理 培訓(xùn)師培訓(xùn) TTT 公眾演說(shuō) 招聘面試 人力資源 非人管理 服裝行業(yè) 績(jī)效管理 商務(wù)禮儀 形象禮儀 職業(yè)素養(yǎng) 新員工培訓(xùn) 班組長(zhǎng)管理 生產(chǎn)管理 精益生產(chǎn) 采購(gòu)管理 易經(jīng)風(fēng)水 供應(yīng)鏈管理 國(guó)學(xué) 國(guó)學(xué)文化 國(guó)學(xué)管理 國(guó)學(xué)經(jīng)典 易經(jīng) 易經(jīng)與管理 易經(jīng)智慧 家居風(fēng)水 國(guó)際貿(mào)易
鮮花榜
頭像
+6107朵
頭像
+6098朵
頭像
+6087朵
頭像
+6087朵
頭像
+6065朵
頭像
+6059朵
頭像
+6054朵
頭像
+6049朵
頭像
+6019朵

Copyright©2008-2025 版權(quán)所有 浙ICP備06026258號(hào)-1 浙公網(wǎng)安備 33010802003509號(hào) 杭州講師網(wǎng)絡(luò)科技有限公司
講師網(wǎng) m.kasajewelry.com 直接對(duì)接10000多名優(yōu)秀講師-省時(shí)省力省錢(qián)
講師網(wǎng)常年法律顧問(wèn):浙江麥迪律師事務(wù)所 梁俊景律師 李小平律師