現在地 HOME > 掲示板 > IT4 > 861.html ★阿修羅♪ |
|
Tweet |
http://pcweb.mycom.co.jp/news/2004/02/02/003.html
米MetaCartaは、膨大なテキストデータから人物の移動などに関する重要情報を把握し、地図上に検索結果を表示して詳細な分析が進められる「MetaCarta Geographic Text Search(GTS)」サーチエンジンの開発を行っている。
同社は、1999年にマサチューセッツ工科大学(MIT)の研究者が集まって立ち上げられ、サーチエンジンを利用しながら地理情報を示す重要なデータを抽出して、地図のグラフィック画面に順序だてて表示する検索技術の研究開発を進めてきた。2002年に初代MetaCarta GTSを発表し、米国防総省国防高等研究事業局(DARPA)の支援を受けて技術精度の向上に努めている。
例えば、ある人物の所在を突きとめるための分析を行っているとする。MetaCarta GTSにはその人物名と関連する事柄を入力し、登録された膨大なメールデータに検索をかけると、自動的にその人物の所在地や移動に関わる情報が解析されて、世界地図にヒットした情報がアイコンで表示される。気になるアイコンをクリックすると、その根拠になる情報へのハイパーリンクから原文へと瞬時にジャンプできるようになっている。検索結果を時間指定で絞り込んだり、地図の縮尺を変更して、より対象エリアを限定した検索なども行えるという。
MetaCarta GTSの根幹を成す分析技術として「MetaCarta GeoTagger」が挙げられ、自然言語処理(NLP: Natural Language Processing)に基づく地理情報の抽出に大きな役割を果たしている。例えば、ピンポイントで地名が指定されていなくても、「同郷の北西10km」といった表現でも、世界の地理情報をデータベース化した「MetaCarta GTS Gazetteer」内の情報と照らし合わせて、的確に検索結果が表示できるようになっている。また、同じ「ロンドン」という言葉でも、地名の「London」なのか、人名の「John London」なのかなど、前後の文章を参照して分析が行われる。
かなり複雑な処理が関係するため、インターネットのサーチエンジンのように短時間で検索結果を表示することは難しいようだ。OSにLinuxを採用し、Intel Xeon 2.8GHzのデュアルプロセッサを搭載した「Dell PowerEdge 2650」上でのテスト結果を紹介すると、約200万ページのHTMLドキュメントの解析に丸1日を要し、250ページのPDFドキュメントなら、丸1日で約10,000個を解析できるという。しかしながら、人間の頭脳のみで、これだけ膨大な量の文字データを読み進めて同じ処理を行おうとすれば、もっと長い時間がかかってしまうことを考えると、MetaCarta GTSの導入意義は大きいと、同社は説明している。
DARPAの援助を受けた研究開発が示すように、主にMetaCarta GTSは、米政府が国家安全保障を中心に利用を進め、電子メールなどを用いたコミュニケーションを諜報機関で監視し、テロリストの活動を捕捉して対策を練るといった分野で威力を発揮することが期待されているようだ。
関連記事
PDAでGPSナビを実現 - アイ・オー・データ、GPS内蔵SDIOカードを発表 http://pcweb.mycom.co.jp/news/2003/11/25/17.html
本文も検索して本を探せる - Amazonが新検索サービスを開始http://pcweb.mycom.co.jp/news/2003/10/24/20.html
NTT-XとGoogleが戦略提携 - Google検索機能にgooの日本語技術を投入http://pcweb.mycom.co.jp/news/2003/10/02/11.html
Google、検索技術開発会社のKaltixを買収 - 検索技術の強化を狙うhttp://pcweb.mycom.co.jp/news/2003/10/01/24.html
MetaCarta
http://www.metacarta.com/