Internet Archiveのサイト削除方法 -真があって運の尽き-

百科事典全26巻読破のビブリオマニア・麻理の心の琴線に触れたセンス・オブ・ワンダー(コラム&日記)
表紙 最近の記事 記事の内容別 過去の記事
真があって運の尽き

Internet Archiveのサイト削除方法

【カテゴリ:ネット一般のこと】 | |
2005-10-27.jpg

Internet Archiveをご存じですか? 1996年からネット上に存在するサイトのHTMLファイルをごっそり保存している団体です。閲覧は半年から1年経過したものしかできませんが、2005年現在、なんと400億ページも保管されています。

先日「幻想画廊」のアドレスを入力して調べてみました。2004年のトップページが8回分保管されていたんですが、そしたら、あなた、びっくり仰天(死語)。

「真があって運の尽き」は、もともと「幻想画廊」のトップページに書いていたミニ日記「Small Talk」だったんですが、Internet Archiveに保管されている幻想画廊のSmall Talkが全然知らない人の日記になっているんですよ。フレームの中に入ってるので、偶然見た方は「これ麻理さんの日記なんだ」と勘違いしちゃいますよ。

当時私は、自分でCGI日記を作るのが面倒で「ロケットBBS」というレンタルサービスの掲示板を改造し、日記として利用していました。

しばらくして使い勝手の良い自前のCGI日記に変えたので、ロケットBBSは解約しました。しかしその後契約された方がたまたま私の使っていたものと全く同じナンバーと同じIDだったのでこんな事態に。こんなことってあるのねえ。

ネットをあちこち見て回ると、Internet Archiveに反対している人が結構います。使いようによっては便利で意義あるサイトなんだけど、頼んだわけでもないのに勝手にページをコピーしていくのって、いろんな法律にひっかかりそうな気がします。過去のサイトなんて恥ずかしくて見たくない人もいるでしょうし。

困ってる方のために、こちらに記載されているInternet Archiveから自分のサイトを削除する方法を書いておきます。

自分のサイトの一番上のディレクトリ(index.htmlがあるところ)に「robots.txt」というファイルを作ります。そこに

User-agent: ia_archiver
Disallow: /


と記入して、robots.txtをサーバにアップ。しばらくしてクロールされればサイトが削除されます。robots.txtをアップできない人は、info@archive.orgにメールを送ればよいそうです。(サイトの管理者であることが条件)

もしだめだったら私もメールを出してみますが、すぐに対応してくれるのかヒジョーに疑問。だって400億ページでしょ。削除依頼メールだってどっさり来るだろうし。だいたい全世界的にページを集めているのに、削除依頼ページが英語って。英語が分からない人はどうすりゃいいのよ。Internet Archiveって不親切ねえ。

とりあえず待つだけ待ってみますが、不幸中の幸いとしては、表示されている別人の日記がエッチ系やグロ系でなかったこと。それだけでも良かった。「それ、私じゃないですから。本当に違いますから!」と必死で説明しなくちゃいけないところでしたよ。ま、見る人はほとんどいないでしょうが、やっぱり、ねえ。【麻理】

追記


……この記事をアップしてすぐにクローラーが来て、すんなりサイトが削除されました。うはーびっくり。早業。(2005/10/27)

今日のサイト


「■だまし絵■(面白画像 オヤジーデハウス)」(リンク切れ)

だまし絵がたくさん。有名なものから、初めて見るものまで。

初出:2005年 10月 27日/h4>

再掲載:2013年11月23日

スポンサードリンク
過去の記事をランダム表示
Related Posts Plugin for WordPress, Blogger...
関係あるかもしれない本
ツイッターなど
×

この広告は1年以上新しい記事の投稿がないブログに表示されております。