GeoNLP

テキストを自動的に地図化する地名情報処理ソフトウェア

GeoNLP地名語辞書のライセンス

地名語辞書のライセンスとは?

GeoNLPで辞書を公開するには「ライセンス」を設定する必要があります。ライセンス(利用許諾)は、データをどのように利用できるかを制作者自身が指定するもので、これによって利用者は自分の使い方が制作者の意図に沿っているかを確認することができます。ライセンスは制限が緩いものから厳しいものまで、制作者が自由に決めることができます。しかし、制作者が専門的な内容の文章を一つ一つ書くのは大変ですし、利用者も長文を一つ一つ読んで理解するのは大変なので、お互いの利便性を高めるために標準的な内容のライセンスが考案されました。その代表的なものが「クリエイティブ・コモンズ」です。また最近では「オープンデータ・コモンズ」も同様の試みを始めています。

クリエイティブ・コモンズをライセンスに使えば、制作者は簡単にライセンスを設定でき、利用者はライセンスを簡単に理解できるだけでなく、コンピュータプログラムもライセンスの内容を自動的に判定できるようになりました。そこでGeoNLPでもこうした標準的なライセンスを用意し、その中から簡単にライセンスを選べるようにしました。

オープンデータのライセンス

ただしここで考えるべきもう一つの側面が「オープンデータ」です。GeoNLPの地名語辞書はみんなで共有してたくさん利用されることで価値が出てくるデータですので、利用制限を厳しくすることは本来の目的とは合いません。実は上記の「クリエイティブ・コモンズ」にも、オープンデータ的なライセンスとそうでないライセンスとがあり、GeoNLPではオープンデータ的なライセンスを可能な限り使っていきたいと考えています。

それではオープンデータ的なライセンスとはどんなものでしょうか。まず、最もオープンデータ的なライセンスとは、「利用の制限がない」ものです。これはどんな目的にも利用していいし、利用していることも特に明示しなくてもいいというライセンスがあります。CC0PDDLがこれに相当し、これが最も制限が緩いものです。次にどんな目的にも利用していいけれども、利用していることは明示してほしいというライセンスがあります。CC-BYODC-BYがこれに相当します。最後に、どんな目的にも利用していいけれども、利用していることは明示してほしいし、さらにそのデータから派生したデータは同じライセンスで公開してほしい、というライセンスがあります。CC-BY-SAODbLがこれに相当します。これらがGeoNLPで提供する標準ライセンスです。

それではオープンデータ的ではないライセンスとはどんなものでしょうか。最も代表的なのは「利用目的に制限を加える」ものです。例えば、「非営利目的」ならいいけれども「営利目的」はだめ、というライセンスはオープンデータ的ではありません。また「利用形態に制限を加える」ものもオープンデータ的ではありません。データをそのまま使うのはいいけれども改変してはならない、というライセンスもオープンデータ的ではありません。したがって、GeoNLPではこうした選択は標準ライセンスでは選べないようになっています。これらをどうしても設定したい場合があれば、独自のライセンスを設定することもできなくはないですが、可能な限りそれは避けて下さい。

「クリエイティブ・コモンズ」と「オープンデータ・コモンズ」

なおGeoNLPでは クリエイティブ・コモンズオープンデータ・コモンズの2種類のライセンスを提供しています。クリエイティブ・コモンズのそもそもの目的は著作物のライセンスを定めることにあったのに対し、オープンデータ・コモンズは最初からデータのライセンスを定めることにあり、法律上の条文としては両者に違いが出てくると考えられます。ただし実際には、クリエイティブ・コモンズもデータのライセンスとして「流用」されることが多く、クリエイティブ・コモンズの方が圧倒的に知名度も高いです。したがって「クリエイティブ・コモンズ」を指定することで、実質的にデータのライセンスを指定しているとみなしても差し支えないと(個人的には)考えています。そのため、GeoNLPで最も推奨するライセンスはCC0ということになります。

利用制限なし +原著作者表示 +同一ライセンス継承
クリエイティブ・コモンズ CC0 CC-BY CC-BY-SA
オープンデータ・コモンズ PDDL ODC-BY ODbL

CC0

CC0 (Creative Commons)

パブリック・ドメインのライセンス。いかなる権利も保有しません。

PDDL

PDDL (Open Data Commons)

パブリック・ドメインのライセンス。いかなる権利も保有しません。

CC-BY

CC-BY (Creative Comons)

原著作者のクレジットを表示する必要があります。

ODC-BY

ODC-BY (Open Data Commons)

データのクレジットを表示する必要があります。

CC-BY-SA

CC-BY-SA (Creative Commons)

原著作者のクレジットを表示する必要があります。また、もしこの作品を改変、変形または加工した場合、その結果生じた作品をこの作品と同一の許諾条件の下でのみ頒布することができます。

ODbL

ODbL (Open Data Commons)

データのクレジットを表示する必要があります。また、もしこのデータを改変、変形または加工した場合、その結果生じた作品をこの作品と同一の許諾条件の下でのみ頒布することができます。また、データに読み出し制限をかける場合は、必ず読み出し制限のないデータも頒布しなければなりません。

原著作者の表示(BY)について

GeoNLPのAPIでは多くの地名語辞書を組合せて利用します。このAPIのレスポンスに原著作者の表示をすべて埋め込むことは現実的ではありません。したがってGeoNLPでは以下の方法を用いて、原著作者の表示にアクセスできるようにします。

まずGeoNLPのレスポンスには地名語のユニークなIDであるgeonlp_idが含まれます。このgeonlp_idを使って、この単語が由来する地名語辞書のユニークなIDであるdictionary_idを検索できます。このdictionary_idを使って、この地名語辞書のメタデータを検索でき、そこに制作者やライセンスなどに関する情報を表示できます。