熱門標(biāo)簽:
大家好,今天小編關(guān)注到一個比較有意思的話題,就是關(guān)于大數(shù)據(jù)概念的提出的問題,于是小編就整理了1個相關(guān)介紹大數(shù)據(jù)概念的提出的解答,讓我們一起看看吧。
大數(shù)據(jù)(big data),IT行業(yè)術(shù)語,是指無法在一定時間范圍內(nèi)用常規(guī)軟件工具進(jìn)行捕捉、管理和處理的數(shù)據(jù)集合,是需要新處理模式才能具有更強的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長率和多樣化的信息資產(chǎn)。
對于“大數(shù)據(jù)”(Big data)研究機構(gòu)Gartner給出了這樣的定義。“大數(shù)據(jù)”是需要新處理模式才能具有更強的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力來適應(yīng)海量、高增長率和多樣化的信息資產(chǎn)。
麥肯錫全球研究所給出的定義是:一種規(guī)模大到在獲取、存儲、管理、分析方面大大超出了傳統(tǒng)數(shù)據(jù)庫軟件工具能力范圍的數(shù)據(jù)集合,具有海量的數(shù)據(jù)規(guī)模、快速的數(shù)據(jù)流轉(zhuǎn)、多樣的數(shù)據(jù)類型和價值密度低四大特征。
大數(shù)據(jù)技術(shù)的戰(zhàn)略意義不在于掌握龐大的數(shù)據(jù)信息,而在于對這些含有意義的數(shù)據(jù)進(jìn)行專業(yè)化處理。換而言之,如果把大數(shù)據(jù)比作一種產(chǎn)業(yè),那么這種產(chǎn)業(yè)實現(xiàn)盈利的關(guān)鍵,在于提高對數(shù)據(jù)的“加工能力”,通過“加工”實現(xiàn)數(shù)據(jù)的“增值”。
從技術(shù)上看,大數(shù)據(jù)與云計算的關(guān)系就像一枚硬幣的正反面一樣密不可分。大數(shù)據(jù)必然無法用單臺的計算機進(jìn)行處理,必須采用分布式架構(gòu)。它的特色在于對海量數(shù)據(jù)進(jìn)行分布式數(shù)據(jù)挖掘。但它必須依托云計算的分布式處理、分布式數(shù)據(jù)庫和云存儲、虛擬化技術(shù)。
隨著云時代的來臨,大數(shù)據(jù)(Big data)也吸引了越來越多的關(guān)注。分析師團隊認(rèn)為,大數(shù)據(jù)(Big data)通常用來形容一個公司創(chuàng)造的大量非結(jié)構(gòu)化數(shù)據(jù)和半結(jié)構(gòu)化數(shù)據(jù),這些數(shù)據(jù)在下載到關(guān)系型數(shù)據(jù)庫用于分析時會花費過多時間和金錢。大數(shù)據(jù)分析常和云計算聯(lián)系到一起,因為實時的大型數(shù)據(jù)集分析需要像MapReduce一樣的框架來向數(shù)十、數(shù)百或甚至數(shù)千的電腦分配工作。
大數(shù)據(jù)需要特殊的技術(shù),以有效地處理大量的容忍經(jīng)過時間內(nèi)的數(shù)據(jù)。適用于大數(shù)據(jù)的技術(shù),包括大規(guī)模并行處理(MPP)數(shù)據(jù)庫、數(shù)據(jù)挖掘、分布式文件系統(tǒng)、分布式數(shù)據(jù)庫、云計算平臺、互聯(lián)網(wǎng)和可擴展的存儲系統(tǒng)。
什么是大數(shù)據(jù)呢?例如洛杉磯警方曾對以往的刑事案件做了統(tǒng)計,通過算法得出了第二天的高概率犯罪地點,然后有針對性的派警察去該處巡邏,從而使得當(dāng)?shù)氐姆缸铿F(xiàn)象下降20%。這是大數(shù)據(jù)。
再比如,經(jīng)濟學(xué)家都認(rèn)為股票無法預(yù)測,而一位劍橋大學(xué)畢業(yè)的博士搞了個公司,對有史以來幾乎所有的證券交易的數(shù)據(jù)進(jìn)行記錄,然后通過算法進(jìn)行分析。
他對什么國家政策、公司業(yè)績、行業(yè)走向等等一眼都不看,100%地排除主觀意志的,只根據(jù)計算結(jié)果來進(jìn)行投資,最后賺了大錢。這是大數(shù)據(jù)。
大數(shù)據(jù)的精髓并不在于數(shù)據(jù)的精準(zhǔn)和數(shù)量,而在于對內(nèi)在規(guī)律的挖掘和對未來趨勢的預(yù)測。其思路是:一個結(jié)果是有很多原因的,原因作用的強度可能是隨機的,我們對其中作用的機理并不清楚。
我們難以找出規(guī)律性,但知道規(guī)律性就蘊含在結(jié)果數(shù)據(jù)之中,如果我們能建設(shè)合適的模型,寫出好的算法,就有可能把這個規(guī)律性提煉出來,從而能科學(xué)地發(fā)現(xiàn)真相和預(yù)測未來。
大數(shù)據(jù)(英語:Big data),又稱為巨量資料,指的是在傳統(tǒng)數(shù)據(jù)處理應(yīng)用軟件不足以處理的大或復(fù)雜的數(shù)據(jù)集的術(shù)語。
數(shù)據(jù)也可以定義為來自各種來源的大量非結(jié)構(gòu)化或結(jié)構(gòu)化數(shù)據(jù)。從學(xué)術(shù)角度而言,大數(shù)據(jù)的出現(xiàn)促成廣泛主題的新穎研究。這也導(dǎo)致各種大數(shù)據(jù)統(tǒng)計方法的發(fā)展。大數(shù)據(jù)并沒有統(tǒng)計學(xué)的抽樣方法;它只是觀察和追蹤發(fā)生的事情。因此,大數(shù)據(jù)通常包含的數(shù)據(jù)大小超出傳統(tǒng)軟件在可接受的時間內(nèi)處理的能力。由于近期的技術(shù)進(jìn)步,發(fā)布新數(shù)據(jù)的便捷性以及全球大多數(shù)政府對高透明度的要求,大數(shù)據(jù)分析在現(xiàn)代研究中越來越突出。
到此,以上就是小編對于大數(shù)據(jù)概念的提出的問題就介紹到這了,希望介紹關(guān)于大數(shù)據(jù)概念的提出的1點解答對大家有用。