地名解析辞書メタデータフォーマット¶
地名解析辞書を Web 上で公開する場合、および pygeonlp の テキスト解析の辞書として利用する場合、 地名解析辞書の名称などの情報を記載したメタデータが必要です。
メタデータのサンプル¶
地名解析辞書のメタデータは次のような JSON フォーマットで記載します。
{
"@context": "https://schema.org/",
"@type": "Dataset",
"name": "歴史的行政区域データセットβ版地名辞書",
"keywords": ["GeoNLP", "地名辞書"],
"alternateName": "",
"description": "歴史的行政区域データセットβ版で構築した地名辞書です。1920年から2020年までの国土数値情報「行政区域データ」に出現する市区町村をリスト化し、独自の固有IDを付与して公開しています。データセット構築の詳しい手法については、「歴史的行政区域データセットβ版」のウェブサイトをご覧ください。",
"url": "https://geonlp.ex.nii.ac.jp/dictionary/geoshape-city/",
"distribution": [{
"@type": "DataDownload",
"contentUrl": "http://agora.ex.nii.ac.jp/GeoNLP/dict/geoshape-city.csv",
"encodingFormat": "text/csv"
}],
"identifier": ["geonlp:geoshape-city"],
"dateModified": "2021-01-04T22:03:51+09:00",
"license": "https://creativecommons.org/licenses/by/4.0/",
"size": "16421",
"temporalCoverage": "../..",
"creator": [{
"name": "ROIS-DS人文学オープンデータ共同利用センター",
"@type": "Organization",
"sameAs": "http://codh.rois.ac.jp/"
}],
"isBasedOn": {
"@type": "CreativeWork",
"name": "歴史的行政区域データセットβ版",
"url": "https://geoshape.ex.nii.ac.jp/city/"
},
"spatialCoverage": {
"@type": "Place",
"geo": {
"@type": "GeoShape",
"box": "24.06092 123.004496 45.5566280626738 148.772556996888"
}
}
}
必須項目¶
以下の項目は pygeonlp で利用する際に必須です。
name : 辞書名として利用します
distribution.contentUrl : CSV 地名解析辞書をダウンロードする URL として 利用します
identifier :
geonlp::
から始まるものをこの辞書の identifier として 利用します
その他の項目はこの地名解析辞書が Google Dataset Search で検索できるようにするために利用します。
非公開の地名解析辞書を pygeonlp で利用したいだけの場合、 最小のメタデータは次のようになります。
{
"name": "日本の鉄道駅(2019年)",
"url": "https://www.info-proto.com/static/ksj-station-N02-2019.html",
"distribution": [
{
"@type": "DataDownload",
"contentUrl": "https://www.info-proto.com/static/ksj-station-N02-2019.csv",
"encodingFormat": "text/csv"
}
],
"identifier": [
"geonlp:ksj-station-N02-2019"
]
}