GeoNLP プロジェクトは、自然言語文に含まれる地名や住所といった場所記述を抽出し、その文がどこに関する記述であるかというメタデータを付与するジオタギング(geo-tagging)システムの構築を目指した研究プロジェクトです。
GeoNLP は地理情報科学(Geographic Information Science:GIS)と自然言語処理技術(Natural Language Processing)を組み合わせることにより、次のような処理を可能にします。
これらの処理により、従来のGISでは扱うことができなかった、ウェブ上のニュースやブログといったテキストを、機械的に地図にすることができるようになります。
GeoNLP を利用するには、 JSON-RPC による公開 WebAPI サービスを利用するのが簡単です。より複雑な処理を行いたい、非公開文書を扱うためイントラネット内で利用したいといった場合には、オープンソースソフトウェアとして公開されているソースコードをダウンロードして、 Linux サーバ上にシステムを構築することもできます。
また、ジオタギングを行うシステムの持続的な成長のためには、それを支えるエコシステムを確立する必要があります。そのため、システムで利用可能な「地名解析辞書」を参加型で整備する 辞書サービス の開発と運営も行います。
地名辞書の作成、共有に関心があるユーザは「 辞書製作者向け資料 」を、 GeoNLP の WebAPI を利用した地名解析アプリケーション開発に関心があるユーザは「 システム開発者向け資料 」を参照してください。
これらのリファレンスでは、地名語や辞書の項目についての情報が必要になる場合があるので、必要に応じて「 用語・フォーマット 」も参照してください。