找回密码
 立即注册
查看: 72|回复: 0

地球网络档案馆

[复制链接]

1

主题

0

回帖

5

积分

新手上路

积分
5
发表于 3 天前 | 显示全部楼层 |阅读模式
作为十月年度活动众多发布和公告的一部分,我们创建了“全球网络档案馆”(Whole Earth Web Archive,简称WEWA)。WEWA是一个概念验证项目,旨在探索如何改善全球代表性不足国家/地区已存档网站的访问方式。我们首先选取了50个小国作为样本,从互联网档案馆(Internet Archive)的网络存档中提取了它们的已存档网站内容,并在此基础上构建了特殊的搜索和访问功能,同时创建了一个专门的发现门户,方便用户进行搜索和浏览。未来的工作重点将是改进互联网档案馆对这些以及其他代表性不足国家/地区的国家级网站的采集,并扩大与这些国家/地区的图书馆和文化遗产机构以及国际组织的合作,为当地专家提供技术支持,帮助他们识别记录本国公民生活和活动的重要网站。

整个地球网络存档截图

网络存档资料在信息呈现、证据收集、历史文献记录和问责制方面发挥着日益重要的作用。然而,网络规模庞大,变化迅速,且需要大量的 WS 数据库 基础设施和专业知识才能收集并永久保存。因此,目前负责保存网络资料的国家图书馆和政府机构仍然 主要由来自欧洲和北美的资源雄厚的机构组成。我们希望WEWA项目能够帮助人们更好地访问那些在Wayback Machine超过20PB的海量数据中难以查找和浏览的存档资料。更重要的是,我们希望该项目能够引发人们对网络资料收集机构缺乏国家多样性这一问题的更广泛思考,并推动各方共同努力,减少“第一世界”国家和民族在全球网络档案库中的过度代表性。



与网络存档与数据服务团队之前的特别项目(例如 GifCities  (用于搜索 Geocities 网络集合中的动画 GIF 的搜索引擎)或 Military Industrial PowerPoint Complex  (来自 .mil(军事)域名网络存档的 PowerPoint 电子书))一样,本项目建立在我们探索性工作的基础上,旨在提供更便捷的方式访问网络存档中有价值的子集。我们的Archive-It服务为策展人提供了构建网络专题收藏的工具,同时我们也致力于从现有的全球网络存档中构建独特的收藏。

WEWA 的初步国家/地区集合是通过选择 50 个“最小”国家/地区确定的

这些国家/地区是根据其国家顶级域名(  ccTLD)注册的网站数量来衡量的——我们承认,这种衡量方式在某种程度上是任意的。底层搜索索引基于我们内部开发的文本和媒体搜索工具。索引的构建基于页面标题或来自其他页面的描述性超链接等特征,相关性排名会根据入站链接数量和受欢迎程度等标准进行提升,并且包含时间维度以考虑网络档案的历史性。有关搜索工程的更多技术信息,请参阅“通过时间锚文本探索网络档案”。


本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|NFT数字藏品交易-全球交流论坛

GMT+8, 2025-11-12 03:40 , Processed in 0.075470 second(s), 22 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表