固有名クラスとは

GeoNLPでは 地名語 に対して、 その地名語が何に対する名称なのかを示すため、たとえば「山」や「川」、 「都道府県」、「駅」といった情報を与えます。この情報が「クラス」です。

また GeoNLP では、文章中に出てくる「東京」が「東京都」のことなのか 「東京駅」のことなのか、といった判別を行うためにもクラスを利用します。

クラス名は一覧から選ぶ

山の辞書が2つあったとして、一つの辞書ではクラス名として「山」を、 もう一つの辞書ではクラス名として「峰」「丘」「山頂」などを使ってしまうと、 どちらも同じテーマに関する辞書であることがシステムには分かりません。 これは地名を検索する場合などに問題になりますので、利用するクラス名は クラス一覧 から選んでください。

クラス名だけでは十分に表現できない場合は、 拡張クラス を利用することができます。

どのクラスを使うべきか

どのクラスを利用すべきか判断に迷った場合は、それぞれのクラスに含まれる 対象の例が記載されていますので、参照してください。どれにも該当しない、 あるいはクラスを定義したくない場合には、空欄("")としてください。

拡張クラス

それぞれのクラスには、「/(スラッシュ)」を続けて拡張クラスを定義する こともできます。たとえば「山地」というクラスを拡張して「山地/峰」とすることで、 この地名が山地に関するさまざまな自然地形のうちで「峰」の名前であることを 表現できます。

このように、クラスだけでは十分に細かい分類ができないという場合には、 拡張クラスを利用してください。

なお、拡張クラスは基本的に自由に定義できますが、同じ意味のものは 同じ表記になっていた方が便利ですので、クラスの説明にある拡張クラスの例を参考に、 なるべく既存の拡張クラスを利用してください。

参考

なぜ「固有名クラス」か

地名にクラスを定義しようとすると、さまざまな分類方法が考えられます。 たとえば「山」は「連峰/単独峰」「火山/褶曲山地」で分類すべきか、 海底火山や高原は山に含むのか、といった議論が起こりかねません。 そもそも「駅」などの施設名は地名に含むべきではないという議論もあります。

GeoNLPでクラスを利用する目的は、地名を分類することではありません。 上述したように、たとえば「富士山」という地名を検索した時に、 駅の位置が知りたいのか山の位置が知りたいのかを指定するためです。

あるいは、文章中に出現した「東京」が「東京都」なのか「東京駅」なのか 判別するためです。それには地名の分類よりも、文法上の固有名詞としての分類の方が 適しています。

そこでGeoNLPでは、地名語に付与するクラスを「地名クラス」とは呼ばずに 「固有名クラス」と呼びます。また、文章中によく一緒に出現する地名が 同じ固有名クラスになるように分類しています。辞書を制作する場合には、 クラスの目的をご理解の上、適切な固有名クラスを付与して頂きますよう お願いいたします。

固有名クラスの分類体系

GeoNLPの固有名クラスの分類体系は、幅広い範囲を網羅しており、 必要以上に細かすぎず、なおかつ辞書製作者にも分かりやすいという観点から、 主に以下の2つを参考にしています(そのままではありません)。

国土地理院「 数値地図25000(地名・公共施設) 」の「 注記テーブル・分類コード

主に「自然地名」で利用しています。

総務省統計局「 平成18年事業所・企業統計調査 」の「 産業分類一覧

主に「交通施設名」「施設名」で利用しています。