インターネット考古学 InternetArchiveを使った情報の調べ方

2024年現在、1990年~2010年ごろの情報をインターネットで調べるための手順を自分なりにまとめました。

 

この記事では具体的に現在自分が収集している「健康ひろば加古川」という1986年~2008年まで兵庫県加古川市で営業していた健康ランドについての情報を調べるための手順を紹介します。健康ひろば加古川は実家がその近くにあって子供の頃よく家族に連れて行ってもらった思い出の場所です。

(もし興味がある方いれば連絡頂ければ情報をまとめたGoogleDocumentを共有します。)

 

*1

 

 

インターネット上の情報は日々更新されるとともに古いウェブサイトは更新されずドメインが失効し消失・検索不能になります。そのような情報を調べるために有用なのがGoogle検索、GoogleBooks、国会図書館デジタルコレクション、X(twitter)検索、InternetArchiveが運営しているwayback machineというサービスです。

 

今回は特に、InternetArchiveで情報を調べるための手順を紹介します。

 

まずGoogle検索します。""で囲うと正確に検索されます。

"健康ひろば加古川" - Google 検索

基本的にはすべての検索結果を見て情報を集めます。

日付指定検索も有効です。

"健康ひろば加古川" - Google 検索

 

https://bunshun.jp/articles/-/37772?page=2

 この健康ひろば加古川を“原点”として、米田はウェルビー各店の要職を任されるようになる。しかし1995年、突如、中国行きを父から命ぜられる。

健康ひろば加古川はウェルビーという会社が運営していたということがわかりました。

公式サイトを見つけInternetArchiveで過去のキャプチャされたページを確認します。

https://www.wellbe.co.jp/

現行ページ。現在、健康ひろば加古川のページは存在しません。

InternetArchiveで上記URLを検索します。440個のwebキャプチャが見つかり当時のウェブサイトが保存されていることがわかります。

https://web.archive.org/web/20240000000000*/https://www.wellbe.co.jp/

 

2006年のページに飛ぶと健康ひろば加古川リンクが存在し、画像なども確認できました。

https://web.archive.org/web/20060213065225/https://www.wellbe.co.jp/

https://web.archive.org/web/20060211010945/http://www.wellbe.co.jp/kakogawa/kakogawa.html

 

 

2001年のキャプチャ。同URLで別の情報が保存されています。

https://web.archive.org/web/20010202064700/https://www.wellbe.co.jp/

https://web.archive.org/web/20010412074335fw_/http://wellbe.co.jp/shop/kakogawa/kakogawa.html

画像がイメージマップ要素になっていてクリックできます。

大広間をクリックすると詳細ページに飛べましたが、画像のリンクが切れています。

当時のwaybackmachineの仕様なのかリンク先の画像は保存されていないことが多いです。

しかし、検証から画像のURLを取得し他の日に保存された画像がないか調べることができます。

 

画像のURLは

http://wellbe.co.jp/shop/kakogawa/hiroma/hiroma.jpg

だということがわかりました。

WaybackMachineでトップページを検索しURLsというタブに行きます。

https://web.archive.org/web/*/http://web.wellbe.co.jp/*

このページではこのドメイン上のすべての保存されたコンテンツがURLで確認できます。

右のFilter results by URL or MINE Type(i.e. '.txt')という検索ボックスに

kakogawa/hiroma/hiroma.jpgを入れると見つけることができました。

20

2002年9月13日の1キャプチャにのみ保存されていたみたいです。

 

「健康ひろば加古川」の大広間の写真を見つけることができました。

大抵の健康ひろば加古川のページは/kakogawaというサブディレクトリにあるようなので検索すると30のエンティティが見つかりました。

 

 

(InternetArchiveは保存されたウェブページの内容に対する検索もあるにはあるのですが、日本語での検索精度が低いためこのような手順で地道に見つける必要があります。)

以上がInternetArchiveでの検索方法でした。

このようにして既に存在しないウェブサイトを見つけページや画像を探すことができます。

 

 

 

2000年代初期の情報を見つける作業はまるで古代の遺物を発掘し断片情報をつなぎ合わせて解釈する考古学のようなものだと感じました。

日々インターネット上の情報は失われ、InternetArchiveの重要性は今後さらに増すと思われます。

Internet Archiveはカリフォルニア州の非営利慈善団体が運営しているサービスで寄付で成り立っています。ぜひ寄付しましょう。

https://archive.org/donate