Wayback Machine(互联网档案馆)
互联网档案馆(Internet Archive)的网页存档服务,可查看网站的历史快照,回溯网页变化。
网站介绍: web.archive.org是“Wayback Machine”(回溯机)的官方网站,由非营利组织Internet Archive于2001年推出。该服务定期爬取全球网页并存储快照,用户输入任意URL(如www.old-site.com),可查看该网站从开始收录至今的历史存档。每个快照包含当时页面的HTML、CSS、JavaScript、图片和链接(部分外部资源可能丢失)。Wayback Machine可用于:找回消失的网页内容、研究网站设计演变、验证历史信息、恢复误删内容或查看被屏蔽网站的旧版本。
爬取频率因网站而异(热门网站每天多次,一般网站数月一次)。用户可手动提交网址供存档。存档不包含需要登录或动态交互生成的内容。截至2024年,Wayback Machine已存储超过8,000亿个网页快照,总数据量超过100PB。该服务还存档了电影、音频、软件、图书和视频游戏。所有内容免费访问,运营依靠捐款和政府资助。网站提供日历式时间轴,用户可选择特定日期查看快照。
成立时间: 2001年10月24日
所属国家: 美国网站
行业分类: 美国网页档案馆、美国数字文化遗产、美国历史数据保存、非营利信息服务
网站语言: 英语
服务区域: 全球
网站链接: web.archive.org
操作流程: 访问web.archive.org,在搜索框输入要查询的URL(如www.nba.com);点击“Browse History”按钮;日历界面显示标记蓝圈的日期(表示有快照);点击任意蓝色日期,选择具体时间戳,查看当时页面快照;若看到“Save Page Now”框,可输入URL点击“Save Page”手动将当前页面加入存档;在快照页面中点击链接可以继续浏览关联快照。