国产99久久精品_欧美日本韩国一区二区_激情小说综合网_欧美一级二级视频_午夜av电影_日本久久精品视频

最新文章專題視頻專題問答1問答10問答100問答1000問答2000關(guān)鍵字專題1關(guān)鍵字專題50關(guān)鍵字專題500關(guān)鍵字專題1500TAG最新視頻文章推薦1 推薦3 推薦5 推薦7 推薦9 推薦11 推薦13 推薦15 推薦17 推薦19 推薦21 推薦23 推薦25 推薦27 推薦29 推薦31 推薦33 推薦35 推薦37視頻文章20視頻文章30視頻文章40視頻文章50視頻文章60 視頻文章70視頻文章80視頻文章90視頻文章100視頻文章120視頻文章140 視頻2關(guān)鍵字專題關(guān)鍵字專題tag2tag3文章專題文章專題2文章索引1文章索引2文章索引3文章索引4文章索引5123456789101112131415文章專題3
問答文章1 問答文章501 問答文章1001 問答文章1501 問答文章2001 問答文章2501 問答文章3001 問答文章3501 問答文章4001 問答文章4501 問答文章5001 問答文章5501 問答文章6001 問答文章6501 問答文章7001 問答文章7501 問答文章8001 問答文章8501 問答文章9001 問答文章9501
當(dāng)前位置: 首頁 - 科技 - 知識百科 - 正文

程序員怎能不知道什么是數(shù)據(jù)挖掘

來源:懂視網(wǎng) 責(zé)編:小采 時(shí)間:2020-11-09 14:14:55
文檔

程序員怎能不知道什么是數(shù)據(jù)挖掘

程序員怎能不知道什么是數(shù)據(jù)挖掘:視乎已經(jīng)聽到或看到無數(shù)遍數(shù)據(jù)挖掘了,那么,你知道那是什么嗎?關(guān)于什么是數(shù)據(jù)挖掘,很多學(xué)者和專家給出了不同的定義,以下我們列出幾種常見的說法: 簡單地說,數(shù)據(jù)挖掘是從大量數(shù)據(jù)中提取或挖掘知識。該術(shù)語實(shí)際上有點(diǎn)用詞不當(dāng)。數(shù)據(jù)挖掘應(yīng)當(dāng)更正確地命名
推薦度:
導(dǎo)讀程序員怎能不知道什么是數(shù)據(jù)挖掘:視乎已經(jīng)聽到或看到無數(shù)遍數(shù)據(jù)挖掘了,那么,你知道那是什么嗎?關(guān)于什么是數(shù)據(jù)挖掘,很多學(xué)者和專家給出了不同的定義,以下我們列出幾種常見的說法: 簡單地說,數(shù)據(jù)挖掘是從大量數(shù)據(jù)中提取或挖掘知識。該術(shù)語實(shí)際上有點(diǎn)用詞不當(dāng)。數(shù)據(jù)挖掘應(yīng)當(dāng)更正確地命名

視乎已經(jīng)聽到或看到無數(shù)遍數(shù)據(jù)挖掘了,那么,你知道那是什么嗎?關(guān)于什么是數(shù)據(jù)挖掘,很多學(xué)者和專家給出了不同的定義,以下我們列出幾種常見的說法: 簡單地說,數(shù)據(jù)挖掘是從大量數(shù)據(jù)中提取或挖掘知識。該術(shù)語實(shí)際上有點(diǎn)用詞不當(dāng)。數(shù)據(jù)挖掘應(yīng)當(dāng)更正確地命名

視乎已經(jīng)聽到或看到無數(shù)遍數(shù)據(jù)挖掘了,那么,你知道那是什么嗎?關(guān)于什么是數(shù)據(jù)挖掘,很多學(xué)者和專家給出了不同的定義,以下我們列出幾種常見的說法:

“簡單地說,數(shù)據(jù)挖掘是從大量數(shù)據(jù)中提取或‘挖掘’知識。該術(shù)語實(shí)際上有點(diǎn)用詞不當(dāng)。數(shù)據(jù)挖掘應(yīng)當(dāng)更正確地命名為‘從數(shù)據(jù)中挖掘知識’,不幸的是它有點(diǎn)長。許多人把數(shù)據(jù)挖掘視為另一個(gè)常用的術(shù)語‘數(shù)據(jù)庫中知識發(fā)現(xiàn)’或KDD的同義詞。而另一些人只是把數(shù)據(jù)挖掘視為數(shù)據(jù)庫中知識發(fā)現(xiàn)過程的一個(gè)基本步驟。” ——《數(shù)據(jù)挖掘:概念與技術(shù)》(FreeEIM J. Han and M. Kamber)

“數(shù)據(jù)挖掘就是對觀測到的數(shù)據(jù)集(經(jīng)常是很龐大的)進(jìn)行分析,目的是發(fā)現(xiàn)未知的關(guān)系和以數(shù)據(jù)擁有者可以理解并對其有價(jià)值的新穎方式來總結(jié)數(shù)據(jù)。”——《數(shù)據(jù)挖掘原理》(David Hand, et al)

“運(yùn)用基于計(jì)算機(jī)的方法,包括新技術(shù),從而在數(shù)據(jù)中獲得有用知識的整個(gè)過程,就叫做數(shù)據(jù)挖掘。”——《數(shù)據(jù)挖掘--概念、模型、方法和算法》(Mehmed Kantardzic openeim)

“數(shù)據(jù)挖掘,簡單地說,就是從一個(gè)數(shù)據(jù)庫中自動(dòng)地發(fā)現(xiàn)相關(guān)模式。”——《構(gòu)建面向CRM的數(shù)據(jù)挖掘應(yīng)用》(Alex Berson, et al)

“數(shù)據(jù)挖掘(DM)是從大型數(shù)據(jù)庫中將隱藏的預(yù)測信息抽取出來的過程。”——《數(shù)據(jù)挖掘:機(jī)遇與挑戰(zhàn)》(John Wang)

而作為數(shù)據(jù)挖掘領(lǐng)域的華人第一人,韓家煒教授在《數(shù)據(jù)挖掘:概念與技術(shù)》的教學(xué)幻燈片中,給出一個(gè)更清晰的定義:“數(shù)據(jù)挖掘,就是從大型數(shù)據(jù)庫中抽取有意義的(非平凡的,隱含的,以前未知的并且是有潛在價(jià)值的)信息或模式的過程。”

這里我們可以看到數(shù)據(jù)挖掘具有以下幾個(gè)特點(diǎn):

l 基于大量數(shù)據(jù):并非說小數(shù)據(jù)量上就不可以進(jìn)行挖掘,實(shí)際上大多數(shù)數(shù)據(jù)挖掘的算法都可以在小數(shù)據(jù)量上運(yùn)行并得到結(jié)果。但是,一方面過小的數(shù)據(jù)量完全可以通過人工分析來總結(jié)規(guī)律,另一方面來說,小數(shù)據(jù)量常常無法反映出真實(shí)世界中的普遍特性。

l 非平凡性:所謂非平凡,指的是挖掘出來的知識應(yīng)該是不簡單的,絕不能是類似某著名體育評論員所說的“經(jīng)過我的計(jì)算,我發(fā)現(xiàn)了一個(gè)有趣的現(xiàn)象,到本場比賽結(jié)束為止,這屆世界杯的進(jìn)球數(shù)和失球數(shù)是一樣的。非常的巧合!”那種知識。這點(diǎn)看起來勿庸贅言,但是很多不懂業(yè)務(wù)知識的數(shù)據(jù)挖掘新手卻常常犯這種錯(cuò)誤。

l 隱含性:數(shù)據(jù)挖掘是要發(fā)現(xiàn)深藏在數(shù)據(jù)內(nèi)部的知識,而不是那些直接浮現(xiàn)在數(shù)據(jù)表面的信息。常用的BI工具,例如報(bào)表和OLAP,完全可以讓用戶找出這些信息。

l 新奇性:挖掘出來的知識應(yīng)該是以前未知的,否則只不過是驗(yàn)證了業(yè)務(wù)專家的經(jīng)驗(yàn)而已。只有全新的知識,才可以幫助企業(yè)獲得進(jìn)一步的洞察力。

l 價(jià)值性:挖掘的結(jié)果必須能給企業(yè)帶來直接的或間接的效益。有人說數(shù)據(jù)挖掘只是“屠龍之技”,看起來神乎其神,卻什么用處也沒有。這只是一種誤解,不可否認(rèn)的是在一些數(shù)據(jù)挖掘項(xiàng)目中,或者因?yàn)槿狈γ鞔_的業(yè)務(wù)目標(biāo),或者因?yàn)閿?shù)據(jù)質(zhì)量的不足,或者因?yàn)槿藗儗Ω淖儤I(yè)務(wù)流程的抵制,或者因?yàn)橥诰蛉藛T的經(jīng)驗(yàn)不足,都會導(dǎo)致效果不佳甚至完全沒有效果。但大量的成功案例也在證明,數(shù)據(jù)挖掘的確可以變成提升效益的利器。

“數(shù)據(jù)挖掘”這個(gè)術(shù)語是在什么時(shí)候被大家普遍接受的,已經(jīng)難以考證,大約在上世紀(jì)90年代開始興起。其中還有一段趣話。在科研界,最初一直沿用“數(shù)據(jù)庫中的知識發(fā)現(xiàn)”(即KDD,Knowledge Discovery in Database 5z20)。在第一屆KDD國際會議中,委員會曾經(jīng)展開討論,是繼續(xù)沿用KDD,還是改名為Data Mining(數(shù)據(jù)挖掘)?最后大家決定投票表決,采納票數(shù)多的一方的選擇。投票結(jié)果頗有戲劇性,一共14名委員,其中7位投票贊成KDD,另7位贊成Data Mining。最后一位元老提出“數(shù)據(jù)挖掘這個(gè)術(shù)語過于含糊,做科研應(yīng)該要有知識”,于是在科研界便繼續(xù)沿用KDD這個(gè)術(shù)語。而在商用領(lǐng)域,因?yàn)?ldquo;數(shù)據(jù)庫中的知識發(fā)現(xiàn)”顯得過于冗長,就普遍采用了更加通俗簡單的術(shù)語——“數(shù)據(jù)挖掘”。

嚴(yán)格地說,數(shù)據(jù)挖掘并不是一個(gè)全新的領(lǐng)域,它頗有點(diǎn)“新瓶裝舊酒”的意味。組成數(shù)據(jù)挖掘的三大支柱包括統(tǒng)計(jì)學(xué)、機(jī)器學(xué)習(xí)和數(shù)據(jù)庫等領(lǐng)域內(nèi)的研究成果,其它還包含了可視化、信息科學(xué)等內(nèi)容。數(shù)據(jù)挖掘納入了統(tǒng)計(jì)學(xué)中的回歸分析、判別分析、聚類分析以及置信區(qū)間等技術(shù),機(jī)器學(xué)習(xí)中的決策樹、神經(jīng)網(wǎng)絡(luò)等技術(shù),數(shù)據(jù)庫中的關(guān)聯(lián)分析、序列分析等技術(shù)。

聲明:本網(wǎng)頁內(nèi)容旨在傳播知識,若有侵權(quán)等問題請及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。TEL:177 7030 7066 E-MAIL:11247931@qq.com

文檔

程序員怎能不知道什么是數(shù)據(jù)挖掘

程序員怎能不知道什么是數(shù)據(jù)挖掘:視乎已經(jīng)聽到或看到無數(shù)遍數(shù)據(jù)挖掘了,那么,你知道那是什么嗎?關(guān)于什么是數(shù)據(jù)挖掘,很多學(xué)者和專家給出了不同的定義,以下我們列出幾種常見的說法: 簡單地說,數(shù)據(jù)挖掘是從大量數(shù)據(jù)中提取或挖掘知識。該術(shù)語實(shí)際上有點(diǎn)用詞不當(dāng)。數(shù)據(jù)挖掘應(yīng)當(dāng)更正確地命名
推薦度:
標(biāo)簽: 分組 數(shù)據(jù) 如何
  • 熱門焦點(diǎn)

最新推薦

猜你喜歡

熱門推薦

專題
Top
主站蜘蛛池模板: 国产大片黄在线播放 | 国产自在线拍 | 欧美日韩亚洲第一页 | 免费国产叼嘿视频大全网站 | 一区二区三区欧美视频 | 大陆一级毛片 | 精品国产a | 免费a黄色 | 国产一区二区三区在线 | 麻豆精品久久久 | 在线观看亚洲一区二区 | 日韩欧美系列 | 一区二区三区视频在线播放 | 国产黄色片在线观看 | 制服丝袜一区 | 日韩国产欧美一区二区三区 | 国产精品国产三级国产 | 欧美伦禁片在线播放 | 亚洲欧美v | 91麻豆免费观看 | 日本成人一区 | 国产日韩一区二区三区在线播放 | 久久久亚洲欧美综合 | 欧美激情爱爱 | 欧美一区二区三区视视频 | 国产精品亚洲色图 | 欧美一区二区三区视视频 | 暧暧免费视频 | 欧美高清在线不卡免费观看 | 久久久久久久国产精品 | 久久精品国产国产精品四凭 | 国产精品一区二区久久 | 青青国产成人久久91网站站 | 精品一区二区三区亚洲 | 亚洲国产成人久久综合区 | 国产 日韩 在线 | 久久福利免费视频 | 欧美伦禁片在线播放 | 国产成人一区 | 亚洲 欧美综合小说区图片区 | 欧美精品在线观看视频 |