作成者別アーカイブ: admin

LODチャレンジ2013で基盤技術部門最優秀賞を受賞しました

2014年3月7日に、Linked Open Data チャレンジ Japan 2013 受賞結果発表がありました。そして、厳正な審査の結果、GeoNLPは基盤技術部門の最優秀賞を受賞しました。

これで、昨年のGeoアクティビティフェスタに次ぎ、GeoNLPとしては2回目の受賞となります。

また、授賞式の前に行われたデモにも、多くの方にご来場いただき、GeoNLPに対する関心と期待の大きさを感じました。期待に応えるには不十分な面も多々ありますが、逆に言えばGeoNLPは我々のような小さなグループだけで完成させるのは難しいプロジェクトでもあり、みんなで作り上げるオープンなプラットフォームに成長させていきたいという思いを強くしました。

さて、GeoNLPは、2010年前半に研究を開始して以来4年ほど続けているプロジェクトですが、この期間中に発生した最大のイベントといえば、何といっても東日本大震災です。この地震が発生したのは、研究を開始して1年ほど、最初のバージョンが動いていた時期でした。そもそもGeoNLPは、デジタル台風TVという構想の中で、緊急時にテキスト情報を自動的に整理するための要素技術として開始したプロジェクトなので、東日本大震災はまさにGeoNLPの「出番」といえる状況でした。ところが、当時のバージョンは実戦で使えるほどには洗練されておらず、結局のところ出番を作ることはできませんでした。このことが悔しさとして後に残りました。

東日本大震災の直後(2011年3月28日)に書いたブログ記事では、実戦で使えなかったGeoNLPの開発を「今後の課題」と書きました。それ以来、震災のような状況でも使えるレベルのツールにする、というのが目標の一つの目安となっています。またブログ記事では、GeoNLPを「予定を前倒しして早急にリリースしたい」とも書きましたが、実際にリリースできたのは2013年9月。予定よりもずいぶん長くかかりましたが、目標に向けて着実に前進中であるとは感じています。

そして、今日2014年3月11日、東日本大震災3周年の日を迎えました。いま、あのような震災が起きたら、今度こそGeoNLPに出番はあるのでしょうか。少なくとも、3年前よりずっと実用性は向上したと言えます。しかしながら、信頼できる結果を出す(専門用語で言えばprecisionを上げる)にはまだまだ工夫が必要で、自信を持って「任せとけ」と断言できるレベルにはまだ達していません。

ただ、GeoNLPはそもそも基盤技術ですので、このツールだけで処理が完結することはありません。震災のような混乱した状況では、機械と人間が協調しながら情報を整理するためのツール群、およびそれらを連携させるプラットフォームこそが重要です。例えばGeoNLPでフィルタリングした結果を、Ushahidi上で情報ボランティアがチェックし、さらにそれを行政や報道が精査するなど、多くの機関が即興的に役割分担を形成していく仕組みを作っていかねばなりません。もちろん、その仕組みの一部としては、LODチャレンジの主題でもあるLinked Open Dataの活用も有力な候補です。

次の災害はいずれやってきます。その時に備えて、GeoNLPと他のツールが協調するための仕組みを作っておくことも重要な課題だと、LODチャレンジ2013に参加することで改めて痛感しました。

Geoアクティビティフェスタで奨励賞を受賞しました

2013年11月14日から16日まで、GeoNLPはGeoアクティビティフェスタに出展しました。

そして、審査委員および来場者の投票結果を踏まえた審議の結果、GeoNLPは「奨励賞」を受賞することになりました。ありがとうございます。その他の作品も含め、受賞作品一覧をご覧ください。

3日間の長丁場でしたが、多くの人にブースにお越し頂き有益な意見交換ができました。また多くの指摘や要望を受け、改善の余地がまだまだ大きいことを痛感しました。特に多く受けた質問は「GeoNLPは何に使えるのでしょうか?」という質問でした。確かに今回の展示は技術(シーズ)寄りでしたので、活用(ニーズ)はイメージしにくかったかもしれません。今後は活用についても想像できるようにプレゼンする必要がありますね。

さて、フェスタでも繰り返し説明した点ですが、GeoNLPの特徴は「オープンなプラットフォーム」です。そしてオープンなプラットフォームの活用により、GeoNLPが担う「地名情報処理」というレイヤを競争領域から協調領域に変えていきたいと考えています。

地名情報処理は、過去にも多くのプロジェクトが挑んでは実用化(商用化)に至らないという歴史を繰り返してきた複雑度の高い問題です。また地名情報処理の基盤となる地名データベースの構築も、維持と更新に多大なコストを要するという厄介な問題です。このように苦労が多い領域では、同じような作業を多くのグループが重複して進めるよりは、多くのグループが協力し合って成果物を共有する方が良いのではないでしょうか?そうした協調領域の上にサービスを競い合う競争領域を設定し、そこでサービスの優位性を競い合えるような世界になればいい。

GeoNLPのオープンソースとオープンデータは、そんな世界のエコシステムを実現する基盤になると思います。まだリリース後の初期段階ではありますが、ひとまず使ってみてフィードバックをお寄せ下さい。そして可能であれば、ぜひオープンソースとオープンデータの改善にもご協力をお願いします。

GeoNLP を公開しました

地名情報処理システムGeoNLPが本日、ようやく公開となりました!

GeoNLPの目的は、文章から地名を抜き出して自動的に地図化することです。ニュース記事やソーシャルメディアなど、緯度経度がついていない文章を解析し、地図上に地名を表示できるようなソフトウェアを実現するために、3種類のソフトウェアを開発しました。

まず、GeoNLPソフトウェア、これが文章を解析するソフトウェア本体です。これはオープンソースとして配布しますので、これをダウンロード&インストールすれば、誰でも地名解析を簡単に実行できます。ただし、このソフトウェアは地名辞書を使って解析するタイプのソフトウェアです。充実した地名辞書がなければ、いろいろな地名を抜き出すことができません。

そこで、GeoNLPデータ、すなわち地名辞書をみんなで作って共有するサイトを用意しました。ここに地名辞書をアップロードすると、地名辞書をみんなで共有できるだけでなく、ここからダウンロードした辞書をGeoNLPソフトウェアで使えるようにすれば、より多くの地名を解析できるようになります。つまり、地名に関するオープンデータを増やしていけば、GeoNLPの性能も向上していくことになります。

最後に、GeoNLPサービスは、システムインストールなどの高いハードルを越えなくても済むように、GeoNLPの機能をお手軽に試すためのサービスとして用意したものです。まずはこちらでお試しして、気に入ったらダウンロード&インストールして下さい。

このようにGeoNLPのコンセプトは「オープンな地名情報処理基盤」、つまりオープンソースとオープンデータに基づく地名情報処理の発展を目指すものです。オープンソールの面からソフトウェアの改良に取り組むのも、オープンデータの面からデータの充実に取り組むのも、どちらも歓迎です。

ご興味のある方はぜひお問い合わせをお使いください。また、メーリングリストとして、Google GroupsにGeoNLPを用意しています。ぜひご利用ください。

最後に、GeoNLPをLinked Open Dataとして利用するためのエンドポイントとなるGeoLODも同時公開です。こちらは日本語DBpediaとのリンクもしていますので、ご興味のある方はご利用ください。

GeoNLPは公開したと言っても、まだまだ成熟レベルには達していないソフトウェアです。これを成熟レベルにまで持っていくため、ぜひ皆様のご協力をよろしくお願いします!