「既存」タグアーカイブ

2008-10
17
00:48:00
Opera「MAMA」はセマンティックWEBを加速させるかも


今までこういう発想を既存の検索エンジン屋が持ってこなかったのが不思議。
Opera、Web開発者向け検索エンジン「MAMA」を開発

MAMAはマークアップ、スタイル、スクリプトなどのWebページに使われる技術など、Webページの構造に関する情報をインデックス化する。

純粋に学術目的みたいですが、タグ構造をサーチできるのなら、例えばマイクロフォーマットも判別可能になりますね。
仮に一般公開されてAPIとかに対応すると、簡単に世界中のイベント情報をかき集めるポータルサイトとか作れそう。
多分既存のインデックスが多すぎて再構築などはやりきれてないからかも知れませんが、意外にセマンティックがGoogleを王座から転げ落とすのかも知れませんよ。

2004-09
01
00:12:00
P2P + CDN = CORAL


元ネタはINTERNET Watchから

分散P2P技術を使ってWebサーバーへの極端な負荷を軽減できる無料のコンテンツ配信ネットワーク(CDN)をニューヨーク大学が開発し、30日に正式公開した。無料で利用でき、日本語サイトでも問題なく使用可能だ。

このCORALはP2PをベースにCDN(Contents Distribution Network)のためのキャッシュを配信し、DynamicDNS(ていうか、単なるIP差し替え)との連携で最も近くのキャッシュを参照させる研究プロジェクト、ということらしい。
簡単な発想には見えますが、別に奇をてらわなくても、既存技術を論理的に組み合わせ直すことでも、全く新しい可能性は広げられると言う点で評価できます。個人的には、こういう考え方は大好きです。
こんな風に手軽に使える、というのも既存基盤をそのまま素直に使うからこそですね。
ただ、では現実的に浸透しうる技術基盤かというと、そもそもインストールベースを確保できるかどうかが問題でしょう。
サイト側として負荷を分散して欲しいに過ぎない訳で、それだけではユーザーとして積極的な導入理由にはならないでしょう。そこまでして見たいサイトなんて、あまり思いつきませんし。
またCookieが使えなかったり(これはキャッシュサーバーである以上、RFC2616的に正しい)、当然ではあるのですがリアルタイム性も(少なくとも現時点では)無い模様です。
つまり完全にシーズから発想したプロジェクトに過ぎず(だからこそ研究なんでしょうが)、どこにユーザー側ニーズを織り込んでいくかが、今後の発展へのポイントになることでしょう。
ということで、CDNは必ずしもメインのゴールとはせず、せっかく溜まり行くキャッシュですからこれを使ってInternet Archiveのような時間軸で指定できるキャッシュアクセス機能とか、アクセスするサイトの傾向から趣味趣向の似ているノードどうしで自動的にクラスターが組まれてアクセスランキングやより精密な検索が可能になるとか、結構いろいろアイデアは出せそうです。
ちょっとだけ要注目ですかね。