趙衛(wèi)東,趙衛(wèi)東講師,趙衛(wèi)東聯(lián)系方式,趙衛(wèi)東培訓師-【中華講師網(wǎng)】
大數(shù)據(jù)及人工智能培訓專家、副教授
46
鮮花排名
0
鮮花數(shù)量
趙衛(wèi)東:數(shù)據(jù)集概述
2017-11-29 3459

Dataset是一個數(shù)據(jù)的集合,通常以表格形式出現(xiàn)。每一列代表一個特定變量。每一行都對應于某一成員的數(shù)據(jù)集的問題。它列出的價值觀為每一個變量,如身高和體重的一個物體或價值的隨機數(shù)。每個數(shù)值被稱為數(shù)據(jù)資料。對應于行數(shù),該數(shù)據(jù)集的數(shù)據(jù)可能包括一個或多個成員。

從歷史上看,這個術語起源于大型機領域,在那里它有一個明確界定的意義,非常接近現(xiàn)代的計算機檔案。這個主題是不包括在這里。

最簡單的情況下,只有一個變量,然后在數(shù)據(jù)集由一列列的數(shù)值組成,往往被描述為一個列表。盡管名稱,這樣一個單數(shù)據(jù)集不是一套通常的數(shù)學意義,因為某一個指定數(shù)值,可能會出現(xiàn)多次。通常的順序并不重要,然后這樣數(shù)值的集合可能被視為多重集,而不是(順序)列表。

值可能是數(shù)字,例如真正的數(shù)字或整數(shù),例如代表一個人的身高多少厘米,但也可能是象征性的數(shù)據(jù)(即不包括數(shù)字),例如代表一個人的種族問題。更一般的說,價值可以是任何類型描述為某種程度的測量。對于每一個變量,通常所有的值都是同類。但是也可能是“遺漏值”,其中需要指出的某種方式。

在統(tǒng)計數(shù)據(jù)集通常來自實際觀測得到的抽樣統(tǒng)計人口,每一行對應于觀測的一個組成部分,人口。數(shù)據(jù)集可能會進一步產(chǎn)生算法為測試目的某些種類的軟件。一些現(xiàn)代統(tǒng)計分析軟件,如PSPP仍然存在的數(shù)據(jù)中的經(jīng)典數(shù)據(jù)集的方式。

數(shù)據(jù)集在斷開緩存中存儲數(shù)據(jù)。數(shù)據(jù)集的結(jié)構(gòu)類似于關系數(shù)據(jù)庫的結(jié)構(gòu);它公開表、行和列的分層對象模型。另外,它包含為數(shù)據(jù)集定義的約束和關系。


全部評論 (0)

Copyright©2008-2025 版權所有 浙ICP備06026258號-1 浙公網(wǎng)安備 33010802003509號 杭州講師網(wǎng)絡科技有限公司
講師網(wǎng) m.kasajewelry.com 直接對接10000多名優(yōu)秀講師-省時省力省錢
講師網(wǎng)常年法律顧問:浙江麥迪律師事務所 梁俊景律師 李小平律師