5. PIDINSTメタデータスキーマ利用における推奨事項

装置に紐づくメタデータは、再利用を可能にするため、共通言語、特にUS英語で公開することを推奨します。次のセクションでは、PIDINSTメタデータスキーマの推奨事項の先進的な事例としてPIDINSTメタデータの値の指定方法を紹介し、特殊なケースについて説明します。

5.1. 共通用語の利用

統制された語彙、分類法、オントロジーなどの標準化された共通用語のセットは、メタデータマークアップに関連する曖昧さの課題を解決し、コンピュータによる情報共有と意味的解釈を可能にします。多くの用語集が存在しており、広範な分野とそのベストプラクティスを包括してます。PIDINSTスキーマは、プロパティ値に関する多分野のベストプラクティスを補うように設計されています。多くのプロパティはソフトタイピングを可能にし( ownerName など)、ユーザーがフリーテキストやドメイン固有の専門用語など、好みの値を利用できるようにしています。プロパティ属性は、人と機械による値のコンテキストの理解を可能にし(ownerIdentifierownerIdentifierType など)、これもフリーテキストや標準化された用語を利用しています。フリーテキストが許容される一方、機関はPID記録の(セマンティックな)相互運用性を高めるため、ドメイン固有のベストプラクティスの一部を形成し実用的な場合においては、特に共通用語の利用を検討すべきです。例えば地球科学の海洋分野では、instrumentType ( instrumentTypeIdentifier より) や Model ( modelIdentifier より)を記述する包括的な用語集が広く使われています(http://vocab.nerc.ac.uk/collection/L22/current/, http://vocab.nerc.ac.uk/collection/L05/current/) 。ePIC レコードにおける一般的な用語集の利用例を Table 5.1 に示します。

Table 5.1 装置識別子のハンドルレコード http://hdl.handle.net/21.T11998/0000-001A-3905-F ePICによって実装されたPIDINSTスキーマに準拠した装置のメタデータを識別するための共通用語の利用を示しています。利用されている用語集は NERC Vocabulary Server (NVS) で公開されています。各メタデータのプロパティのデータフォーマットはJSON形式になっています。ハンドルレコードは http://hdl.handle.net/21.T11998/0000-001A-3905-F?noredirect より閲覧できます。

タイプ

データ

URL

"https://linkedsystems.uk/system/instance/TOOL0022_2490/current/"
21.T11148/8eb858ee0b12e8e463a5
(Identifier)
{
  "identifierValue":"http://hdl.handle.net/21.T11998/0000-001A-3905-F",
  "identifierType":"Handle"
}
21.T11148/f5e68cc7718a6af2a96c
(SchemaVersion)
"1.0"
21.T11148/9a15a4735d4bda329d80
(LandingPage)
"https://linkedsystems.uk/system/instance/TOOL0022_2490/current/"
21.T11148/709a23220f2c3d64d1e1
(Name)
"Sea-Bird SBE 37-IM MicroCAT C-T Sensor"
21.T11148/4eaec4bc0f1df68ab2a7
(Owners)
[{
  "owner": {
    "ownerName":"National Oceanography Centre",
    "ownerContact":"louise.darroch@bodc.ac.uk",
    "ownerIdentifier":{
      "ownerIdentifierValue":
        "http://vocab.nerc.ac.uk/collection/B75/current/ORG00009/",
      "ownerIdentifierType":"URL"
    }
  }
}]
21.T11148/1f3e82ddf0697a497432
(Manufacturers)
[{
  "manufacturer":{
    "manufacturerName":"Sea-Bird Scientific",
    "manufacturerIdentifier":{
      "manufacturerIdentifierValue":
        "http://vocab.nerc.ac.uk/collection/L35/current/MAN0013/",
      "manufacturerIdentifierType":"URL"
    }
  }
}]
21.T11148/c1a0ec5ad347427f25d6
(Model)
[{
  "modelName":"Sea-Bird SBE 37 MicroCat IM-CT with optional pressure (submersible) CTD sensor series",
  "modelIdentifier":{
    "modelIdentifierValue":
      "http://vocab.nerc.ac.uk/collection/L22/current/TOOL0022/",
    "modelIdentifierType":"URL"
  }
}]
21.T11148/55f8ebc805e65b5b71dd
(Description)
"A high accuracy conductivity and temperature recorder with an optional
pressure sensor designed for deployment on moorings. The IM model has an
inductive modem for real-time data transmission plus internal flash memory
data storage."
21.T11148/f76ad9d0324302fc47dd
(InstrumentType)
[{
  "instrumentTypeName":"water temperature sensor",
  "instrumentTypeIdentifier":{
    "instrumentTypeIdentifierValue":
      "http://vocab.nerc.ac.uk/collection/L05/current/134/",
    "instrumentTypeIdentifierType":"URL"
  }
},{
  "instrumentTypeName":"salinity sensor",
  "instrumentTypeIdentifier":{
    "instrumentTypeIdentifierValue":
      "http://vocab.nerc.ac.uk/collection/L05/current/350/",
    "instrumentTypeIdentifierType":"URL"
  }
}]
21.T11148/72928b84e060d491ee41
(MeasuredVariables)
[{
  "measuredVariable":{
    "variableMeasured":
      "http://vocab.nerc.ac.uk/collection/P01/current/CNDCPR01/"
  }
},{
  "measuredVariable":{
    "variableMeasured":
      "http://vocab.nerc.ac.uk/collection/P01/current/PSALPR01/"
  }
},{
  "measuredVariable":{
    "variableMeasured":
      "http://vocab.nerc.ac.uk/collection/P01/current/TEMPPR01/"
  }
},{
  "measuredVariable":{
    "variableMeasured":
      "http://vocab.nerc.ac.uk/collection/P01/current/PREXMCAT/"
  }
}]
21.T11148/22c62082a4d2d9ae2602
(Dates)
[{
  "date":{
    "dateValue":"1999-11-01",
    "dateType":"Commissioned"
  }
}]
21.T11148/eb3c713572f681e6c4c3
(AlternateIdentifiers)
[{
  "alternateIdentifier":{
    "alternateIdentifierValue":"2490",
    "alternateIdentifierType":"serialNumber"
  }
}]
21.T11148/178fb558abc755ca7046
(RelatedIdentifiers)
[{
  "relatedIdentifier":{
    "relatedIdentifierValue":
      "https://www.bodc.ac.uk/data/documents/nodb/pdf/37imbrochurejul08.pdf",
    "relatedIdentifierType": "URL",
    "relationType":"IsDescribedBy "
  }
}]

5.2. 他のPIDの利用

PIDINSTメタデータは様々な場所での関連する実体への参照を含むことができます。 明らかに、これら参照では可能な限り永続的識別子を利用することが望まれます。 参照される実体の性質により異なるタイプのPIDが推奨されます。 最も一般的なケースを以下に示します。

  • いくつかの場合で他の装置を参照することがあります。この場合における最も一般的なPIDタイプは、HandleとDOIです。

  • owner または manufacturer として表示される可能性のある組織は、ROR を利用して参照することができます。

  • owner または manufacturer として表示される可能性のある個人のPIDは、ORCID iDが最も一般的です。

  • RRID は生物科学分野では一般的であり、装置のクラスを参照するために利用されることがあります。次のサブセクションを参照ください。

5.2.1. RRID

一般的な用語と同様、永続的識別子は、ユーザーが物理オブジェクトを分類し、正確に記述するのを補助するため、発行されてきました。 Research resouce identifier (RRID、研究資源識別子)は、装置( Model )のクラスを識別するために使用することができます。したがって、装置のインスタンスを識別するPIDINSTと関連しています[1] 。このタスクは、UsedIT グループが請け負っており、Model プロパティ(modelIdentifier 経由)の記述ができるようRRIDの装置クラスを拡張しています(Table 5.2 )。ここではRRIDについて詳しく説明しませんが、先に詳しく説明したRRIDメタデータスキーマ(及び UserITによって拡張されたもの) [2] では、装置のインスタンス(PIDINST)のPIDと相互運用することが想定されています。この相互運用性により、どのプロジェクトにおいてもモデルに関するデータをすぐにダウンロードし、マッピングされたフィールドを矛盾なく埋めることができるようになるはずです。

なぜRRIDを利用するのでしょうか?RRIDは研究資源のクラスをタグ付けするため、現在約1000の雑誌において利用されています。例として抗体やプラスミドなどの試薬、生物、細胞株、そしてソフトウェアツールや大学の中核施設などのサービスを含む比較的広いカテゴリーの「ツール」、さらに最近ではシーケンサーやマイクロスコープのモデルなどの物理ツールにもRRID利用が拡張されています。RRIDは生物学雑誌のグループと国立衛生研究所の間の合意として作成されたため、生物科学分野の文献(Cell、eLifeなど)で最もよく見られ、リンクされています。これらはJATS NISO standard、STAR Methods、MDAR pan-publisher reproducibility checklistの一部にも組み込まれています。identifiers.orgとn2t resolverによってPIDの解決がなされ、主要な試薬提供者(例えば、Thermo Fisher、Addgene、MMRRC mouse repository)にも利用されています。

Table 5.2 PIDINST メタデータスキーマにおける RRID の利用例。

ID

プロパティ

義務

要素数

定義

許容値、制約条件、備考

6

Model

R

0-1

manufacturerによって割り当てられた装置のモデル名またはタイプ名

要素

6.1

modelName

R

1

model名 (フルネーム)

RRIDでのNameフィールド

例:

‘Illumina HiSeq 3000/HiSeq 4000 System’

6.2

modelIdentifier

O

0-1

model の永続的識別子

RRID識別子

例:

‘RRID:SCR_016386’

6.2.1

modelIdentifierType

O

1

識別子のタイプ

フリーテキスト (識別子タイプである必要があります)

例: ‘RRID’

5.3. 不明な情報への対応

本来メタデータに含まれるべき情報を提供できない、あるいは提供することが適切でない場合があります。 例えば、情報が単に不明である場合、プロパティに値が設定されていない場合、あるいは情報を公開することが適切でない場合などがあります。 後者の例として、シチズンサイエンスのプロジェクトに測定値を提供し、プライバシー上の理由から匿名を希望する人物を考えてみましょう。 その人は、データを取得する装置の所有者として名前を知られたくないのかもしれません。

このようなすべての場合において、この情報が不注意で省略されたものではないことを少なくとも明示し、また情報が欠落している理由を示すことが有用であることに変わりはありません。 この目的のため、PIDINSTではDataCiteにおける 不明な情報の標準値 を採用しています。詳しくはDataCite Metadata Schema Documentation の Appendix 3 を参照してください [3]

Snippet 5.1 測定器のPIDメタデータに含まれる不明な値をXMLでエンコードする例。
  <name>:tba</name>
  <owners>
     <owner>
        <ownerName>:unal</ownerName>
     </owner>
  </owners>
  <manufacturers>
     <manufacturer>
        <manufacturerName>:unav</manufacturerName>
     </manufacturer>
  </manufacturers>

Snippet 5.1 は、装置PIDのメタデータにおける不明な情報に対する標準的な値の利用例を示しています。この装置の所有者の開示は拒否されており、製造元も不明ですが、メタデータレコードが後の時点において名前を含んで更新されることが想定されています。