アーカイブチームロゴアーカイブチームは、 2009年にジェイソン・スコットによって共同設立された、デジタル保存とウェブアーカイブに特化したグループです。[ 1 ] [ 2 ]
主な活動は、危険にさらされているオンラインサービスに保管されているコンテンツのコピーと保存です。プロジェクトには、GeoCities、[ 3 ] [ 4 ] Yahoo! Video、Google Video、Friendster、FortuneCity、[ a ] TwitPic、[ 5 ] SoundCloud、[ 6 ]、「Aaron Swartz Memorial JSTOR Liberator」などのサービスの部分的または完全な保存が含まれます。[ 7 ]アーカイブチームは、URL短縮サービス[ 8 ]やWiki [ 9 ]も定期的にアーカイブしています。アーカイブチームによってアーカイブされたコンテンツは通常、Wayback Machineで公開されており、アクセス方法としてはWayback Machineが推奨されています。[ 10 ]
ジェイソン・スコットによると、「アーカイブチームは怒りと無力感から始まりました。何が生き残り、何が消滅するかを企業に決めさせているという感覚です。」[ 11 ]スコットは続けて、「何が価値があり、何が意味があるのかを見極めるのは私たちの仕事ではありません。私たちは3つの美徳、つまり怒り、偏執、窃盗癖に基づいて仕事をしています。」[ 12 ]
ウォリアー/トラッカーシステム
Telegramスクレイピングアーカイブチームは、独立した貢献者/ユーザーによる緩やかなコミュニティで構成されています。[ 13 ] [ 14 ] [ 15 ]アーカイブプロセスでは、仮想マシン環境である「ウォリアー」が使用されています。ユーザーはデスクトップ環境でウォリアーを使用して、技術的な専門知識を必要とせずにコンテンツをダウンロードできます。タスクは、ウォリアーとネットワークを構築し、アイテムを割り当てる、集中管理されたトラッカーによって割り当てられます。トラッカーはユーザーのアップロードアクティビティも監視し、リーダーボードを表示します。[ 16 ]
ウォリアー・プロジェクト
長期にわたるウォリアー・プロジェクトがいくつかあります
2024年12月12日現在、ArchiveTeamの最大のプロジェクトはURLsであり、10ペタバイト以上がアーカイブされています。[ 29 ] [ b ]
アーカイブボット
アーカイブボットは、アーカイブチームが運営するウェブアーカイブシステムで、ウェブサイトの厳選されたクロールを実施します。IRCチャンネルを介して制御されるアーカイブボットは、通常、サイトのシャットダウン、ポリシーの変更、またはオンラインデータを脅かすその他のイベントに応じて、ボランティアがアーカイブ用のURLを送信できるようにします
ジョブはパイプラインと呼ばれるワーカーシステムのネットワークによって処理され、コンテンツをクロールしてWARC(Web ARChive)形式で保存します。ボランティアは公開ダッシュボードを通じてアクティブなクロール(ジョブ)を監視し、カレンダー、無限スクロール、再帰クロールを妨げる可能性のあるセッションベースのコンテンツなど、ウェブサイトの問題のある領域に対処するために無視ルールを適用する場合があります。[ 30 ]
ArchiveBotのクロール結果はインターネットアーカイブにアップロードされ、通常はWayback Machineを通じてアクセスでき、一般の人が閲覧できる。[ 31 ] ArchiveBotは、ユーザー生成プラットフォーム、ニュースメディア、政府のウェブサイトなど、幅広いコンテンツを保存するために使用されている。[ 32 ]
参照
注記
参考文献
- ^スコット、ジェイソン(2009年1月6日)「Team Archive is GO」 ASCII、ジェイソン・スコット著。2016年11月2日時点のオリジナルよりアーカイブ。2016年12月30日閲覧
- ^ 「メインページ」の改訂履歴.アーカイブチーム. 2016年12月31日時点のオリジナルよりアーカイブ。2016年12月30日閲覧。
- ^ Gilbertson, Scott (2010年11月1日). 「Geocities、大規模Torrentダウンロードとして存続」 . Wired . 2012年4月25日時点のオリジナルよりアーカイブ。
- ^ Modine, Austin (2009年4月28日). 「Web 0.2アーキビストがジオシティーズの削除を阻止」 The Register . 2012年5月3日時点のオリジナルよりアーカイブ。
- ^ “TwitPic - Archiveteam” . 2014年9月9日時点のオリジナルよりアーカイブ。2014年9月17日閲覧。
- ^ Deahl, Dani (2017年7月18日). 「Archive Team、SoundCloudの閉鎖懸念の中、バックアップを約束」オリジナルより2018年10月21日アーカイブ。2018年11月28日閲覧。
- ^ Farivar, Cyrus (2013年1月15日). 「Aaron Swartz Memorial JSTOR Liberator がパブリックドメインの学術論文を解放」 . 2018年3月23日時点のオリジナルよりアーカイブ。 2018年11月28日閲覧。
- ^ 「URL短縮はひどいアイデアだった」。URLTE.AM 。 2011年6月11日時点のオリジナルよりアーカイブ。
- ^ WikiTeam 2016年2月10日アーカイブ( Wayback Machine)
- ^ 「よくある質問 - Archiveteam」 . wiki.archiveteam.org . 2025年5月26日閲覧。
- ^ 「Open Source Bridge 2012 Keynote - Jason Scott」YouTube 2012年6月28日. 2017年9月14日時点のオリジナルよりアーカイブ。 2018年11月28日閲覧。
- ^ 「Open Source Bridge 2012 Keynote - Jason Scott」YouTube 2012年6月28日. 2017年9月14日時点のオリジナルよりアーカイブ。 2018年11月28日閲覧。
- ^ Wodinsky, Shoshana; Mehrotra, Dhruv (2021年4月9日). 「Yahoo!知恵袋をアーカイブ化しているので、赤ちゃんの誕生の仕組みをいつでも知ることができます」 . Gizmodo . 2025年1月24日時点のオリジナルよりアーカイブ。 2025年4月13日閲覧。
- ^ Hill, Mark (2021年5月12日). 「インターネットをデジタルゴミ箱から救う活動家アーキビストたち」 . Discover Magazine . 2024年12月13日時点のオリジナルよりアーカイブ。 2025年4月13日閲覧。
- ^ Mühlenmeier, Lennart (2023年7月26日). 「週末も閉鎖は止まらない」 . netzpolitik.org . 2025年3月29日時点のオリジナルよりアーカイブ。2025年4月13日閲覧。
- ^オグデン、ジェシカ(2021年10月21日)。「インターネット上のあらゆるものは保存可能」:アーカイブチーム、Tumblr、そしてウェブアーカイブの文化的意義。インターネット歴史誌。6 ( 1– 2 ) : 113– 132。doi : 10.1080/24701475.2021.1985835。hdl : 1983 / daef55ca-1fb1-4d91- a820-244bf24fe2b7。S2CID 239510759。
- ^ 「Imgur 利用規約の更新」 . Imgur ヘルプ. 2023年5月31日時点のオリジナルよりアーカイブ。 2023年6月9日閲覧。
- ^ "Blogger - Archiveteam" . wiki.archiveteam.org . 2024年1月2日閲覧。
- ^ Slowe, Christopher (2023年4月18日). 「RedditのAPIに関する最新情報」reddit.com . 2024年6月18日時点のオリジナルよりアーカイブ。2023年6月9日閲覧。
- ^ “.ua - Archiveteam” . wiki.archiveteam.org . 2023年3月23日時点のオリジナルよりアーカイブ。2023年6月9日閲覧。
- ^ “Telegram - Archiveteam” . wiki.archiveteam.org . 2023年5月29日時点のオリジナルよりアーカイブ。2023年6月9日閲覧。
- ^ “GitHub - Archiveteam” . wiki.archiveteam.org . 2023年5月27日時点のオリジナルよりアーカイブ。2023年6月9日閲覧。
- ^ "MediaFire - Archiveteam" . wiki.archiveteam.org . 2024年1月2日閲覧。
- ^ “Coronavirus - Archiveteam” . wiki.archiveteam.org . 2023年6月9日時点のオリジナルよりアーカイブ。 2023年6月9日閲覧。
- ^ 「YouTube - Archiveteam」 . wiki.archiveteam.org . 2024年1月2日閲覧。
- ^ "ウィキチーム - アーカイブチーム" . wiki.archiveteam.org 。2024-01-02に取得。
- ^ "URLTeam - Archiveteam" . wiki.archiveteam.org . 2024年1月2日閲覧。
- ^ "URLs - Archiveteam" . wiki.archiveteam.org . 2024年1月2日閲覧。
- ^ 「URLs tracker Dashboard」 . tracker.archiveteam.org . 2024年12月9日時点のオリジナルよりアーカイブ。2024年12月12日閲覧。
- ^ "ArchiveBot - Archiveteam" . wiki.archiveteam.org . 2025年5月27日閲覧。
- ^ 「ArchiveBot: The Archive Team Crowdsourced Crawler」 . archive.org . 2025年5月27日閲覧。
- ^ 「ドメイン - ArchiveBotビューア」 . archive.fart.website . 2025年5月27日閲覧。
- ^ Sullivan, Mark (2012年4月13日). 「『アーカイブチーム』が閉鎖されたサイトからユーザーコンテンツを救出」 . PC World . 2012年4月20日時点のオリジナルよりアーカイブ。
- ^シュワルツ、マット(2012年1月)「図書館の火災」テクノロジーレビュー。2012年1月24日時点のオリジナルよりアーカイブ。
- ^ガーフィールド、ボブ、スコット、ジェイソン (2012年3月23日). 「アーカイブチーム」 . OnTheMedia . 2012年4月27日時点のオリジナルよりアーカイブ。2012年4月19日閲覧。
- ^ Masnick, Mike (2012年4月12日). 「1月18日のSOPAブラックアウトにおけるウェブサイトの歴史的アーカイブ」 Techdirt . 2012年4月15日時点のオリジナルよりアーカイブ。
- ^スコット、ジェイソン (2012年3月6日). 「クリック:アーカイブチーム - ジェイソン・スコットがデジタル遺産を救う使命について語る」 BBC.オリジナルより2015年4月3日時点のアーカイブ。
- ^モートン、サイモン、スコット、ジェイソン (2012年3月3日). 「アーカイブチーム」 . RadioNZ . 2012年4月21日時点のオリジナルよりアーカイブ。
- ^ミセナー、ダン (2011年4月29日). 「Full Interview: Jason Scott on online video and digital heritage」 . CBC. 2012年10月26日時点のオリジナルよりアーカイブ。
- ^ Paul-Choudhury, Sumit (2011年5月6日). 「オンライン遺産のアマチュアヒーロー」 . New Scientist . 2015年4月2日時点のオリジナルよりアーカイブ。 2015年3月9日閲覧。
外部リンク