大公网

大公报电子版
首页 > 艺文 > 小公园 > 正文

知见录/脆弱的数字资源\胡一峰

2024-10-02 05:02:26大公报
字号
放大
标准
分享

  偶然看到一则消息,有家媒体公司有上万个九十年代用来存档的硬盘驱动器,现在五分之一无法读取,上面的资料可能全部遗失了。这很令人警觉。我曾下意识地认为资料数字化后就可以千年万代保存下去。这种想法其实是想当然,简单的生活经验就可以证伪。我有好几个损坏的U盘、硬盘和手机,里面的文档照片都无法读取了。它们摆在我的抽屉里,事实上毫无用处,没有丢进垃圾桶,既因爱惜旧物的习惯,也怕个人信息丢失。

  冗余资料的数量与媒介方便程度似乎成正比,到了数字时代更是疯狂增加。自打有了电脑写作,修改文稿更加方便,修改次数也大大增加。每改一次都留下过程稿,曾被我视为一个好习惯,后来却发现,就回溯修改过程而言,数字化的过程稿看似增删清晰,实则不如手改稿直观。每改必存毫无必要,反而制造了冗余累赘。

  据说,二○二○年全球产生数据量已经超过四十ZB,相当于地球上每个人每年产生了五TB的数据。其中,百分之八十以上是不经常使用的“冷数据”,但至少有百分之十的数据是有价值的数字资源,需要被长期保存。与传统的纸张相比,数字介质的维护成本更大。由于格式和载体对环境的依赖性,数字资源其实十分脆弱,如何长期保存和保真都已成为全球课题。

  其实,与此相关的另一话题同样值得关注,那就是选择。保存文化资源的目的是为了传递文明。历史地看,每个时代都在为后世立法,其方式就是对本时代的文化进行选择性保存。因此,研读历史不只是了解过去是个什么样子,更能搞懂如今为何是这般样子。如果说,前信息时代的选择性保存是受制于介质技术不得不为之“恶”,那么,在新介质的加持下,今天更要避免因为选择失误或放弃选择带来的信息负担之“恶”。

点击排行