引言一場(chǎng)生活、工作與思維的大變革大數(shù)據(jù),變革思維
人們不再認(rèn)為數(shù)據(jù)是靜止和陳舊的。但在以前,一旦完成了收集數(shù)據(jù)的目的之后,數(shù)據(jù)就會(huì)被認(rèn)為已經(jīng)沒(méi)有用處了。比方說(shuō),在飛機(jī)降落之后,票價(jià)數(shù)據(jù)就沒(méi)有用了(對(duì)谷歌而言,則是一個(gè)檢索命令完成之后)。
信息社會(huì)所帶來(lái)的好處是顯而易見(jiàn)的:每個(gè)人口袋里都揣有一部手機(jī),每臺(tái)辦公桌上都放有一臺(tái)電腦,每間辦公室內(nèi)都擁有一個(gè)大型局域網(wǎng)。但是,信息本身的用處卻并沒(méi)有如此引人注目。半個(gè)世紀(jì)以來(lái),隨著計(jì)算機(jī)技術(shù)全面融入社會(huì)生活,信息爆炸已經(jīng)積累到了一個(gè)開(kāi)始引發(fā)變革的程度。它不僅使世界充斥著比以往更多的信息,而且其增長(zhǎng)速度也在加快。信息總量的變化還導(dǎo)致了信息形態(tài)的變化——量變引發(fā)了質(zhì)變。最先經(jīng)歷信息爆炸的學(xué)科,如天文學(xué)和基因?qū)W,創(chuàng)造出了“大數(shù)據(jù)”這個(gè)概念。如今,這個(gè)概念幾乎應(yīng)用到了所有人類致力于發(fā)展的領(lǐng)域中。
大數(shù)據(jù)并非一個(gè)確切的概念。最初,這個(gè)概念是指需要處理的信息量過(guò)大,已經(jīng)超出了一般電腦在處理數(shù)據(jù)時(shí)所能使用的內(nèi)存量,因此工程師們必須改進(jìn)處理數(shù)據(jù)的工具。這導(dǎo)致了新的處理技術(shù)的誕生,例如谷歌的mapreduce和開(kāi)源hadoop平臺(tái)(最初源于雅虎)。這些技術(shù)使得人們可以處理的數(shù)據(jù)量大大增加。更重要的是,這些數(shù)據(jù)不再需要用傳統(tǒng)的數(shù)據(jù)庫(kù)表格來(lái)整齊地排列——一些可以消除僵化的層次結(jié)構(gòu)和一致『性』的技術(shù)也出現(xiàn)了。同時(shí),因?yàn)榛ヂ?lián)網(wǎng)公司可以收集大量有價(jià)值的數(shù)據(jù),而且有利用這些數(shù)據(jù)的強(qiáng)烈的利益驅(qū)動(dòng)力,所以互聯(lián)網(wǎng)公司就順理成章地成為最新處理技術(shù)的領(lǐng)頭實(shí)踐者。它們甚至超過(guò)了很多有幾十年經(jīng)驗(yàn)的線下公司,成為新技術(shù)的領(lǐng)銜使用者。
今天,一種可能的方式是,亦是本書(shū)采取的方式,認(rèn)為大數(shù)據(jù)是人們?cè)诖笠?guī)模數(shù)據(jù)的基礎(chǔ)上可以做到的事情,而這些事情在小規(guī)模數(shù)據(jù)的基礎(chǔ)上是無(wú)法完成的。大數(shù)據(jù)是人們獲得新的認(rèn)知,創(chuàng)造新的價(jià)值的源泉;大數(shù)據(jù)還是改變市場(chǎng)、組織機(jī)構(gòu),以及『政府』與公民關(guān)系的方法。