|
首頁 > 相關網站
|
| |
依地區分類:
亞洲 |
美洲 |
歐洲 |
大洋洲
|
|
| |
亞洲
|
| . |
WARP
|
| |
WARP (Web ARchiving Project),系統網站是由日本國會圖書館負責研發,2002年開始實驗性質的開辦,於2006年計畫臻於成熟,仍由日本國會圖書館負責整個計畫的執行。目前WARP已經收錄三千多個網站,所有上傳的網站都有詳細的審核和授權機制,可以自我推薦或經由他人推薦,主要收藏中央/地方政府、公營/法人/大學網站、特殊重要主題的網站,爾後會慢慢擴大到非政府機關的網站,網站目錄除依照網站特質分類,也依照圖書館分類法分類,一年一次下載完整網站,亦提供關鍵字與全文檢索功能。目前WARP已著手留意已經消失機構或網站,並於首頁提供連結。
|
|
| . |
OASIS
|
| |
Online Archiving & Searching Internet Sources(OASIS)是韓國數位圖書館五項子計劃中的一項,是韓國國家圖書館為了典藏與保存網路時代的資源,而於2001年開始嘗試發展的計劃,並於2004年2月正式開始搜集,OASIS提供多樣化的檢索方式,使用者除了可以用全文、網址檢索外,也有類別瀏覽的功能,而且針對每一筆,OASIS都有提供詳細的編目,並對於對內容提供簡要的介紹,目前主要是以免費電子書為主。
|
|
| . |
WAS
|
| |
Web archive Singapore(WAS)是由新加坡國立圖書館所建置的計劃,搜集大約1000個以上與新加坡相關的線上資訊,包含社會、政治、文化、宗教、科學、經濟等議題相關的網站,共分成十一大類典藏主題,提供使用者瀏覽,瀏覽庫存網頁的界面十分簡明,對於每一筆資料,WAS都有提供詳細的編目,並對於對內容提供簡要的介紹。
|
|
| . |
Web Infomall
|
| |
中國web信息博物館是北京大學網絡實驗室負責架構,每月平均以4,500萬個網頁的速度擴展,截至2007年6月,已經有25億頁以中文為主的網頁。除了蒐集網站網頁,和美國國會圖書館MINERVA計畫相同,也建置主題性的網站網站典藏。Web Infomall除了自行設定典藏範圍外,也允許有意將網站網頁永久典藏的機構申請網站的上傳。目前Web Infomall系統僅提供網址的搜尋,必須輸入完整網址才能尋找到網站資料,對使用者較為不方便。
|
|
| . |
WAT
|
| |
國家圖書館有鑑於網路資源已成為目前重要的資訊管道,其內容豐富多元,可提供一般民眾資訊檢索及學術界研究參考所需。身為國家級圖書館,除致力於國內實體書刊文獻典藏,近十年來對館藏期刊、善本古籍及臺灣研究等文獻進行數位化及資訊服務,獲致相當成就,深受國內外學術界及民眾一致肯定。今網路資源環境更臻普及,資訊科技成熟,數位化文獻成長一日千里,有逐步取代實體文獻之趨勢。網路資源已成為兼負文獻典藏任務的國家圖書館,在進行國家文獻典藏時,不能忽略的重要職責。 然而網站成長的快,消失的也快,今日所看到的網站內容很可能隨時因為伺服器關閉、網站移除、網站名稱變更…等因素無法再次被利用。因此國家圖書館基於資源保存與學術研究的立場,於96年度著手建置國家圖書館網站典藏先導系統。系統將對網站進行定期擷取內容,並根據擷取時間建立個別的典藏版本,存放於伺服器中,除建構完備之模擬、封裝、更新、轉置等永久典藏機制外,可進一步提供讀者進行資料查詢與其他加值應用。
|
|
|
| |
美洲
|
| . |
LCWA
|
| |
The Library of Congress Web Archives (LCWA)是美國國會圖書館數位典藏計劃中的一個分項計畫,其有主題性的深入蒐集美國網站資料,在完整蒐集主題相關的網站後,並進行細緻的分類。以選舉主題的網站為例,又細分為候選人、政府、政黨、民意等等,目前還正在蒐集911事件網站、2002 年冬季奧林匹克運動會、伊拉克戰爭。對於網站內容,MINERVA盡可能複製一份存檔,使用的網頁蒐集工具為Heritrix(Library of Congress, n.d.),包含網站上的HTML網頁、圖片、PDF、Flash、聲音、影像檔皆完整收錄,截至2007年5月,已蒐集了超過70TB的資料(Library of Congress, 2007),也已經收錄超過36,000個網站。目前已經提供針為單一與跨計劃的檢索功能。有關MINERVA的詳細介紹可以參考 “Collecting and Preserving the Web: The Minerva Prototype”一文。(Arms, Adkin, Ammen, & Hayes, 2001)。
|
|
| . |
Wayback Machine
|
| |
Wayback Machine 附屬於Internet Archive計畫的一部分,廣泛地蒐集網際網路上各種類型的網站,其目標是想成為獨一無二的網站圖書館。然而,系統功能比較陽春,目前只提供介於兩個日期間的網址檢索功能,不支援關鍵字檢索或是全文檢索功能。Wayback Machine從1996年開始已蒐集了將近850億頁,200TB的資料,但蒐集與審核似乎較不嚴謹,有些網站也不見得可以瀏覽。
|
|
| . |
GCWA
|
| |
2004年4月22日,加拿大圖書館暨檔案法正式立法。而從2005年12月開始,為了保存的目的,加拿大圖書暨檔案館(Library and Archives Canada, LAC)開始搜集具代表性的加拿大網站,並將所搜集的資料存放在一個名為加拿大政府網站典藏庫(the Government of Canada Web Archive, GCWA)中。而在加拿大政府網站典藏庫裡,使用者除了可以透過關鍵字、政府部門名稱、網址列來檢索外,也可以透過以PDF等檔案存放格式的方式來檢索。
|
|
|
| |
歐洲
|
| . |
European Archive
|
| |
歐州檔案組織(European Archive)是一個設立於阿姆斯特丹與巴黎的非營利組織,透過與圖書館、博物館、政黨與政府等機構合作,來蒐集並保存在網路上的資源。網站是其中一項典藏,除此之外,還包括影像、聲音等數位影像檔案的典藏。不過,目前的檢索功能只提供影像與聲音檔案的檢索,網站的部份只提供瀏覽的功能。
|
|
| . |
UKWAC
|
| |
UKWAC(UK Web archiving consortium)於2004年6月成立,由British Library (Lead partner)、The National Archives、National Library of Wales、National Library of Scotland、JISC、Wellcome Trust等六個機構,一起投入經費共同合作,研發相關的網站典藏技術。並由2005年開始有選擇性的收錄英國相關的網站,每個機構可以訂定自己的典藏政策,各有其收藏的主題。像Wellcome Library專著於醫學的網站,British Library專注於文化歷史或重大政治議題,National Library of Wales則蒐集能夠反應現代Wales生活的相關網站。UKWAC使用澳洲國家圖書館PANDORA計畫的開發工具PANDAS,因此其系統架構與澳洲PANDORA相似。此外,UKWAC在收錄網站前會先經過該網站的擁有者同意才收錄。目前,UKWAC在首頁中有預告改版的訊息。有關UKWAC計畫的細節可以參閱“UKWAC: Building the UK's First Public Web Archive”一文(Bailey & Thompson, 2006)。
|
|
| . |
Netarchive.dk
|
| |
Netarchive是丹麥阿爾路斯(Aarhus)大學圖書館與丹麥皇家圖書館(The Royal Library)於2005年開始合作的計劃,主要是為了蒐集以保存與丹麥相關的網站。此一計劃現階段,並不打算對外開放讓公眾搜尋,主要是專注在保存的工作上。
|
|
| . |
Tomba
|
| |
Tomba (Portuguese web archive)是由葡萄牙里斯本大學資訊科學系(the Departmento de Informática da Faculdadade de Ciências da Universidade de Lisboa)所研發而來的系統,主要目的是為了典藏與保存葡萄牙的網站,入口頁面類似著名的搜尋網站Google,但系統功能比較陽春,目前只提供網址檢索功能。
|
|
|
| |
大洋洲
|
| . |
PANDORA
|
| |
1996年成立,最初由澳洲國家圖書館投入發展,目前則是與澳洲九所大學院校共同開發系統功能,並建立一套名為PANDAS的管理系統。該計畫主要蒐集澳洲的網站,包含社會、政治、文化、宗教、科學、經濟等議題相關的網站,共分成十五大類典藏主題,清楚的分門別類,並依照英文字母予以排序,提供使用者檢索。使用的網頁擷取工具(Internet Robots,Web Crawlers)為HTTRACK,有關PANDORA計畫的技術細節,可以參考 “PANDORA: Technical Details”一文(McPhillips, 2004)。
|
|