sponsored links

大資料的歷史

大資料概念是由羅傑·穆加拉斯(Roger Mougalas)2005年提出的。但是,大資料的應用可追溯到7,000年前。

約翰·葛蘭特(John Graunt)是一位英國經濟學家,也是第一位從事人口統計學調查的研究者。葛蘭特與英國古典經濟學家威廉·配第一同研究人類統計與人口普查方法,以此為基礎發展現代人口統計學的架構,最為著名的成就是製作出第一張生命表,使計算人類某年之存活機率成為可能。他的著作《對死亡率表的自然與政治觀察》(Natural and Political Observations Made upon the Bills of Mortality)發表于格裡歷1663年或儒略曆1662年,分析查理二世時期倫敦地區死亡率的起伏,研究腺鼠疫的開始與擴散的系統性方法,併發出警告。由於他的工作,約翰·格蘭特被廣泛認為是統計學領域的先驅。

打孔卡跟蹤百萬人口,1937年美國國會透過《社會保障法》後,要求政府跟蹤數百萬美國人。政府與IBM簽訂了開發打孔卡讀取系統的合同,該系統被應用到這個龐大的資料專案中。IBM發明的80列、矩形孔卡片,成為事實上的標準。其工作原理如下:編號為0至9,總計10行;以及一塊區域,用於第11、第12行(注意,沒有編號為第10的行)。

每列的穿孔組合用於表示單個字元:

  • 數字透過在行0至行9直接打1個孔來表示。
  • 空格符的表示,不需要打孔。
  • 字母用2個孔表示:一個孔在第11、第12、第0行;另一個孔在第1至第9行。字母表被依次分為由9個字母組成的區(zones),每個區的字母依次在第1至第9行打孔。每個區分別在第11、第12、第0行打孔。第3區第1個字元保留未使用。
  • 一些特殊字元使用了額外的單孔表示,或者雙孔表示。
  • 大多數特殊字元(如標點符號等)用3孔表示:第8行被穿孔;第0、第11、第12行有1個穿孔;第1到第7行有1個穿孔。第9行保留未使用。

總計表示了67個字元。

進入到數字計算機時代,上述穿孔卡片字元表示方式發展為6位元的字元編碼:用4位元表示第0行至第9行的哪一行被穿孔;用2位元表示第11、第12行的哪一行被穿孔。這可以表示所有的單孔或者雙孔的字元表示,這被稱作“二進位制編碼的十進位制交換碼”(Binary Coded Decimal Information Code,BCDIC, BCD碼)。

首臺巨人計算機誕生巨人計算機(英語:Colossus computer)是英國密碼分析師在1943年至1945年間為幫助破譯洛侖茲密碼機而設計的一組計算機,使用真空管來進行邏輯代數和計數運算。巨人計算機因此被認為是[1]世上首臺可程式設計的電子數字計算機。

第一個資料中心,由美國政府於1965年建立的,目的是儲存數百萬份納稅申報表和指紋集。這是透過將每條記錄轉移到要系統儲存在中央位置的磁帶上來實現的。但是,由於擔心遭到破壞或收購,該專案未能持續。但是,這一計劃是電子大儲存的起點,這一點已被廣泛接受。

全球資訊網誕生,英國科學家蒂姆·伯納斯-李於1989年發明了全球資訊網。1990年12月25日,蒂姆·伯納斯-李成功利用網際網路實現了超文字傳輸協議客戶端與伺服器的第一次通訊。

超級計算機,2007年11月,IBM的Blue Gene/L,運算能力為478.2 TFlops,安裝了32768個處理器。它是PowerPC架構的修改版本,正式運作版本被推出到很多地點,包括羅蘭士利物摩亞國家實驗室(Lawrence Livermore National Laboratory)。截至2020年6月23日,目前全球最快的超級電腦是日本理化學研究所(Riken)與富士通(Fujitsu)共同研發的“富嶽”(Fugaku)。“富嶽”的運算能力是每秒415千兆次,和第二名的美國IBM超級電腦“高峰”(Summit)的148千兆次相差三倍。Fugaku採用了Arm架構為基礎的富士通48核心A64FX SoC,共有158,976個節點,尖峰效能可達到1 exaflops(1,000 petaflops)這也是全球500大超級電腦中首次由Arm架構系統奪下第一名,除了在Linpack中拿到好成績,Fukagu也在HPL-AI中獲得1.421 exaflops。

2005年,Roger Mougalas首次引入大資料一詞,同年(2005年),雅虎建立了現在的開源Hadoop,旨在為整個全球資訊網建立索引。如今,Hadoop已被數百萬企業使用,以處理大量資料。

隨著網際網路的發展,社交網路迅速增長,每天產生大量使用者訪問資料。企業和政府開始建立大資料專案。如,在2009年建立的有史以來最大的生物識別資料庫中,印度政府儲存了所有公民的指紋和虹膜掃描。

大資料已經存在很長時間了,大資料正處於強大的發展階段,隨著分散式計算的發展,在不久的將來,大資料將應用於生活的每個角落,造福人類發展。

分類: 科學
時間: 2021-10-12

相關文章

中國電信自研大資料和AI應用亮相世界網際網路大會

中國電信自研大資料和AI應用亮相世界網際網路大會
2021年9月25日,世界網際網路大會"網際網路之光"博覽會在浙江烏鎮正式開幕.中國電信自主研發的政法公安大資料中腦.天翼應急智慧監控平臺.智慧文旅景區監控平臺.景區影片智慧分析與 ...

大資料和創構認識論
作者:王天恩(上海大學馬克思主義學院.社會科學學部教授,博士生導師) 內容提要:新一代人工智慧的發展,在更深層次展示了大資料的重要性.正是在大資料基礎上,匯聚了資訊科技發展過程中生髮的新認識論旨趣.從 ...

專家解讀“十一”大資料:黃金週揭示經濟發展基本面
中國旅遊研究院副院長李仲廣解讀"十一"大資料 柴雅欣 薛鵬 今年"十一"假期是全面建成小康社會後的首個國慶黃金週,各地統籌疫情防控和經濟社會發展,在精準做好疫情 ...

國慶大資料:5.15億人出遊,實體商場火熱,超400萬人日均步數不足百
中國經濟週刊-經濟網訊 (記者 孫冰) 在萬分不捨之中,國慶假期結束了,這也意味著2021年所有的公共假期全部休完了. 今年的國慶假期期間,雖然國內仍有個別省區市出現新冠疫情新增病例,但遊客的出遊熱情 ...

大資料的威脅有多大,你要警惕

大資料的威脅有多大,你要警惕
你是否好奇,2021年7月盛傳的"國內某約車平臺把使用者資訊打包發給美國,會有什麼威脅"? 你是否好奇,為什麼頭條.抖音等平臺會推送你喜歡的內容,你周圍的人嗎? 它們都有共同的關鍵 ...

大資料局資料中心軟體平臺(二期)專案

大資料局資料中心軟體平臺(二期)專案
建設內容 根據省導則要求進行平臺功能升級迭代,包括公共資料工作門戶.資料供需平臺.資料目錄.資料交換.資料共享,並按省市兩級平臺要求對接省平臺:根據省導則要求新建資料上報.資料治理平臺.資料開放分域. ...

如何在享受大資料和人工智慧便利的同時,兼顧安全、可靠、可控?

如何在享受大資料和人工智慧便利的同時,兼顧安全、可靠、可控?
來源:方圓 (圖片來源:攝圖網) 網約車與計程車哪個更便宜?蘋果手機與非蘋果手機,誰打車更貴?新客戶打車便宜還是老客戶打車便宜? 帶著這樣的疑問,復旦大學教授孫金雲帶領他的學生,一個月時間內在北京.上 ...

大資料產業規模持續增長 2023年將超過萬億元
近年來,以大資料為核心的新一代資訊科技革命,加速推動我國各領域的數字化轉型升級.大資料技術的廣泛應用,加速了資料資源的彙集整合與開放共享,形成了以資料流為牽引的社會分工協作新體系,促進了傳統產業的轉型 ...

值得一看!7月重點城市大資料房價中位數

值得一看!7月重點城市大資料房價中位數
近日,緯房研究院釋出了最新重點城市大資料房價中位數,找找你所在城市的最新資料變化吧! 北京.上海.深圳位於樣本房價資料的前三位.值得關注的是,作為一線城市的廣州位於樣本資料的第七名. 大慶.鞍山.肇慶 ...

既要容災備份,又要大資料應用,英方守護醫院資料“生命線”

既要容災備份,又要大資料應用,英方守護醫院資料“生命線”
[案例]武漢某醫院由於突發光纖鏈路中斷,引發網路癱瘓.醫生電腦收不到任何患者資訊,無法開出檢查單或處方,醫院業務陷入"停擺"狀態-- 在醫聯體.醫共體建設的持續推進下,醫療資訊保安 ...

小米投資大資料服務商數說故事DataStory,持股6.81928%

小米投資大資料服務商數說故事DataStory,持股6.81928%
廣州數說故事資訊科技有限公司日前發生工商變更,註冊資本由2248.27萬元增至2401.76萬元,新增股東為小米關聯公司瀚星創業投資有限公司(持股6.81928%),Achiever Ventures ...

大資料“甄別”嫌疑人的通訊錄!應用於公安的“黑科技”資料庫亮相世界計算大會

大資料“甄別”嫌疑人的通訊錄!應用於公安的“黑科技”資料庫亮相世界計算大會
9月17日-18日世界計算大會在湖南長沙舉行,本次大會以"計算萬物·湘約未來--計算產業新格局"為主題,旨在全面演繹計算基礎研究.技術創新.應用融合的關鍵路徑和行業實踐. 隨著大資 ...

投訴資料告訴你,“大資料殺熟”有哪些套路?

投訴資料告訴你,“大資料殺熟”有哪些套路?
來源:讀特 人工智慧正像電力一般賦能各個產業,深刻地改變人類社會.中國正處於全球人工智慧發展第三次浪潮的時代潮頭,<演算法週刊>將聚焦人工智慧"上海高地"和中國新基建, ...

大資料助力發展人才測評,雲日核心產品 亮相智博會

大資料助力發展人才測評,雲日核心產品 亮相智博會
雲日集團研發的潛能測評系統主要綜合了腦科學.神經科學.心理科學.胚胎學.統計學等學科理論.系統檢測大腦腦電波的基本平均資訊及手指尖末梢神經的電位差等各項指標,取得兩者的交集與迴流,再依據1.4億筆系統 ...

國足4訊息,天價熱身費闢謠,下一戰遇苦主,大資料看好國足勝利

國足4訊息,天價熱身費闢謠,下一戰遇苦主,大資料看好國足勝利
第1個訊息來自於中國隊對陣敘利亞隊的熱身賽.據<北京青年報>報道,國足西亞的熱身賽不涉及出場費,具體代價或許就是免費提供飲用水. 最近有多家媒體都報道了敘利亞隊索要30萬美金的所謂&quo ...

大資料+決策人挖掘+郵件推廣+whatapp助手=3個月出50W貨值

大資料+決策人挖掘+郵件推廣+whatapp助手=3個月出50W貨值
我是如何用谷歌地圖大資料+決策人挖掘+郵件推廣+WhatsApp助手快速開發客戶,3個月出了五十萬貨值! 我先介紹谷歌地圖大資料.決策人挖掘.郵件推廣.WhatsApp助手,再介紹如何使用: 谷歌地圖 ...

曾經的日不落大英帝國現在實力如何?32組大資料對比中國英國實力

曾經的日不落大英帝國現在實力如何?32組大資料對比中國英國實力
英國,曾經的日不落大英帝國.18世紀初透過工業革命率先成為世界強國.1840年英國透過鴉片戰爭,迫使清政府簽訂不平等條約,使清政府開始淪為半殖民地國家. 近幾十年中國取得了突飛猛進的發展,綜合國力日益 ...

反殺“大資料殺熟”面臨認定難舉證難等困境
演算法面臨更強監管 禁止"大資料殺熟"立法程序加快 反殺"大資料殺熟"面臨認定難舉證難等困境 核心閱讀 對演算法予以更嚴格的監管,已是勢在必行.近期,多部法律規 ...

運營商大資料的優勢有哪些?

運營商大資料的優勢有哪些?
運營商大資料的優勢有哪些? 首先,我們必須要承認一點,目前的行業競爭下,獲客難,獲客成本高已經成為了很多公司在營銷發展方面上的首要問題!而且在這個問題下,有些有錢的大企業為了獲客,提高自己行業的競爭力 ...