從結繩記事到數字資源長期儲存(上)

關注我們 -

數字羅塞塔

計劃 -

我們生活在一個資訊爆炸的大資料時代,2020年全球產生資料量已經超過40ZB,相當於地球上每個人每年產生了5TB的資料。

從結繩記事到數字資源長期儲存(上)

這些資料中,80%以上是不經常使用的“冷”資料,同時至少有10%的資料是有價值的數字資源,需要被長期儲存。如何實現海量有價值數字資源的長期儲存是一個世界性的難題,這一難題的背後,資料儲存技術一直在默默的支撐著人類社會的進步發展,並且與我們的生活息息相關。

從最早應用於儲存紡織行業圖案的打孔紙卡,到後來用於調查人口時的資訊儲存,儲存介質在歷史的長河中也是不斷的更迭演變。唱片、磁帶、碟片的誕生,音樂和影視行業進入了大家的視野,風靡一時;半導體、硬碟、快閃記憶體等的出現,推進了資訊時代的發展進步。今天,就讓我們來了解一下資料儲存的發展歷史。

01

儲存器

這得從結繩記事開始說起,結繩記事是遠古時代人類為擺脫時空限制記錄事實、進行傳播的一種手段之一。它發生在語言產生以後、文字出現之前的漫長年代裡。在一些部落裡,為了把本部落的風俗傳統和傳說以及重大事件記錄下來,流傳下去,便用不同粗細的繩子,在上面結成不同距離的結,結又有大有小,每種結法、距離大小以及繩子粗細表示不同的意思,由專人(一般是酋長和巫師)循一定規則記錄,並代代相傳。

從結繩記事到數字資源長期儲存(上)

從資料儲存的角度去理解結繩記事,實際上是一種“儲存器”。古人用結繩記事來幫助記憶,而儲存器就是電子裝置中用來儲存資訊的“記憶”裝置,它具備儲存資料和資訊的能力,並且可以連續執行程式,進行廣泛的資訊處理。

在數字系統中,只要可以儲存二進位制資料的都可以稱為儲存器;在積體電路中,具有儲存功能的電子元器件也稱為儲存器(如隨機存取儲存器RAM、只讀儲存器ROM);在系統中,具有實物形式的儲存裝置也叫儲存器,如記憶體條、記憶體卡等。而儲存器又可以分為內部儲存器(記憶體)和外部儲存器。本文主要和大家一起來探討外部儲存器。

我們可以對外部儲存器中的資料進行讀取和寫入,外部儲存器中的資料會一直存在,直到被覆蓋或刪除,斷電也不會丟失,當然每種儲存器都有壽命。比如隨身碟就是一種很常見的外部儲存器,能低成本+可靠+便捷地儲存上GB甚至幾十GB的資料,因此常被用於個人資料交換或備份。

02

最早的儲存介質-打孔紙卡

打孔紙卡又稱穿孔卡、霍爾瑞斯式卡或IBM卡,是一塊紙板在預先知道的位置利用打洞與不打洞來表示數字訊息。早期的數字電腦運用打孔機已輸入資訊的打孔卡作為計算機程式和資料的主要輸入介質。

從結繩記事到數字資源長期儲存(上)

1801年,法國人約瑟夫·瑪麗·雅卡爾發明了打孔卡,當時用在控制織布機織出的圖案。1880年代,美國人口調查局職員赫爾曼·何樂禮發明了用於人口普查資料的穿孔卡片及打孔卡片製表機,並於 1888 年申請了第一個專利權。在1890年美國人口普查中,透過打孔製片和打孔機,僅6周就完成了統計,而此前1880年美國人口普查的資料全靠手工處理,歷時7年才得出最終結果。

何樂禮發明的打孔卡片製表機,是電腦的前身;他當時建立的製表公司,就是今天藍色巨人IBM的前身。

從結繩記事到數字資源長期儲存(上)

一個程式少說也有幾百上千條指令,在紙帶上穿孔後紙帶足有好幾米長,沒有個三五天是穿不完的。到了20世紀,打孔卡應用在單位記錄機作為輸入端、處理和計算機程式。到1940年代,紙卡標準是 80列×12行,一張卡能存 960 位資料。據我們所知的最大紙卡程式是美國軍方的“半自動地面防空系統”(簡稱SAGE),一個在1958年投入使用的防空系統,主程式儲存在62,500個紙卡上,大小5MB左右。

但其實打孔紙卡我們每個人幾乎都用過,只不過是革新之後的形式——答題卡。早期的答題卡和穿孔紙帶很像,也是採取穿孔方式:閱卷時,每一個答案的選項位置都會有一個金屬棒對應,如果答案是正確的,金屬幫就會從答題紙的孔穿下去;如果答案錯誤,金屬棒就穿不下去。最終根據答題紙的稱量結果換算出得分。

從結繩記事到數字資源長期儲存(上)

改進之後的答題卡使用石墨填塗對應位置,然後用一束光掃描答題卡,因為石墨的特性是隻會吸收和反射光線,而不會讓光線透過它,被塗寫的部分就會向外反射出光線。在反射出的方向上有捕捉光線的感測器,答卷資料就會被系統獲取並計算出得分。

除了作為答題卡很實用,打孔卡紙作為儲存介質,因為不用電而且便宜耐用,被持續使用了十多年。但它的缺點也很明顯,就是儲存容量小,讀取速度慢,並且只能寫入一次,打的孔無法輕易補上,對於儲存經常發生變化的臨時值,紙卡不好用,所以大家開始尋找更快更大更靈活的儲存方式。

03

儲存介質的發展史

1944年,賓夕法尼亞大學的J。 Presper Eckert發明了“延遲線儲存器”。原理如下,拿一個管子裝滿液體,如水銀,管子一端放揚聲器,另一端放麥克風,揚聲器發出脈衝時會產生壓力波,壓力波需要時間傳播到另一端的麥克風,麥克風將壓力波轉換回電訊號。

從結繩記事到數字資源長期儲存(上)

這個延遲線儲存器的原理,就是透過用壓力波的傳播延遲來儲存資料。有壓力波代表1,沒有代表0。透過內部電路連線麥克風和揚聲器,再透過放大器來彌補訊號衰弱,從而實現一個儲存資料的迴圈。研究出這個技術之後,Eckert和同事John Mauchly使用延遲線儲存器做了一個更大更好的計算機叫 EDVAC,總共用了128條延遲線,每條能存352 bits,總共能存45,000 bits,這也是最早的“儲存程式計算機”之一。

但“延遲線儲存器”也有一個很大的缺點:每一個時刻只能讀一位 (bit) 資料,並且只能順序讀取,所以又叫“順序儲存器”或者“迴圈儲存器”。因為這個原因,延遲線儲存器在1950年代中期就基本過時了。一項新的、效能和可靠性更高、成本更低的儲存技術——磁芯儲存器——應運而生。

給磁芯繞上電線,並施加電流,可以將磁化在一個方向,如果關掉電流,磁芯保持磁化;如果沿相反方向施加電流,磁化的方向(極性)會翻轉,這樣就可以用來區別儲存 1 和 0。

透過把磁芯排列成網格,由電線來負責遴選行和列,同時也將電線貫穿每個磁芯, 用於讀寫一位(bit)。

從結繩記事到數字資源長期儲存(上)

磁芯記憶體的第一次大規模運用是 1953 年麻省理工學院的Whirlwind 1計算機,磁芯排列是 32×32,用了16塊板子,能儲存大約16000 bits。更重要的是,不像延遲線儲存器,磁芯儲存器能隨時訪問任何一位(bit),這在當時非常了不起。

磁芯儲存器從1950年代中期開始成為主流,流行了20多年。但因為工藝問題,一般是用手工編織製作,所以成本較高,大約1美元1位(bit) 。到1970年代,透過技術革新才下降到1美分左右。不過即使每位1美分也很貴,現在我們的手機隨便拍張照片都有10多MB,約等於8000萬bit,你願意花80萬美元存一張照片嗎?

同期,1951年Eckert和Mauchly創立了自己的公司,設計了一臺叫UNIVAC的新電腦,是最早進行商業銷售的電腦之一,它推出了一種新儲存:磁帶。

磁帶是纖薄柔軟的一長條磁性帶子卷在軸上,磁帶可以在“磁帶驅動器”內前後移動,裡面有一個“寫頭”繞了電線,電流透過產生磁場,導致磁帶的一小部分被磁化,電流方向決定了極性,代表 1 和 0。

從結繩記事到數字資源長期儲存(上)

還有一個“讀頭”,可以非破壞性地檢測極性。UNIVAC用了半英寸寬,8條並行的磁帶,磁帶每英寸可存128位資料,每卷有1200英尺長,意味著一共可以存1500萬bits左右,接近2MB。經過不斷的最佳化,提高密度、縮小尺寸、降低單位儲存成本,直到1980年代磁帶才被廣泛應用。由於磁帶是循序存取的裝置,尤為適合傳統的儲存和備份以及順序讀寫大量資料的使用場景。但因為速度較慢,且體積較大等缺點,現在主要僅用作商業備份等用途。

1950、60年代,有個類似磁帶的技術是“磁鼓儲存器”,它是如何產生的?是怎樣的原理?相較於上一時期的磁帶,外觀是否有改進?

精彩待續。。。 。。。

關注我們 -

數字羅塞塔

計劃 -

精彩值得等待,下期將繼續講述1950年後

到21世紀的藍光光碟的

儲存介質發展史,和新世代的儲存介質,以及到如今的

數字羅塞塔計劃

,每一步都是人類文明的重大突破,

“儲存社會記憶,傳承人類文明”。

從結繩記事到數字資源長期儲存(上)