13. 実現した、計画中、または検討中の適用事例

13.1. Helmholtz-Zentrum Berlin für Materialien und Energie (HZB)

HZB では DataCite 上で4つのDOIをHZBの実験装置に付番しています: 2つの中性子ビームライン BER II[1],[2]、シンクロトロン放射光ビームライン BESSY II[3] に一つ、そして一つの実験ステーション BESSY II[4] です。これらの DOI は HZB の実験装置データベース --これらは事前に作成されたものでこの目的にの為に作られたものではないですが-- からそれぞれの実験装置のページを参照するようになっています。これらの実験装置の特徴としては、これらは HZB により独自に構築されたことがあります。したがって、HZB は作成者(Creator)であるとともに、contriburotType プロパティにおいて HostingInstitution を持つ事で貢献者(Contributer)としても、メタデータ内に記載されています。DOIの一つでは、DataCite スキーマから fundingReference プロパティを追加することで、当該装置の更新時にHZBが受けた外部からの研究費を明らかにしている、ということも特筆すべき点です。このプロパティはPIDINSTスキーマでは考慮されておらず、DataCite とのマッピングを実施するときに検討されました。HZBでは運用中のすべてのビームライン、実験ステーションにメタデータを適用し、またDOIを付番することを計画しています。

13.2. British Oceanographic Data Centre (BODC)

英国海洋データセンター (British Oceanographic Data Centre, BODC) は海洋学及び海洋研究データの保存と配布を目的とした国立の研究施設です。BODCは webで公開済みであり、実世界のセンサーを概念化し統合するための Open Geospatial Consortium (OCGC) SensorML のオープンな標準に沿った、センサー技術に関するメタデータのエンコードを対象とし、ePICの実装をテストしました。最初のテストケースとして、北大西洋にある Porcupine Abyssal Plain Sustained Observatory (PAP-SO) の定点係留に定期的に配置されている Sea-Bird Scientific SBE37 Microcat に対して PID を作成しました。詳細については センサーWebイネーブルメント標準(SWE) を参照してください。BODCは、Natural Environment Research Council (NERC)が所有し、National Oceanography Centre (NOC)と British Antarctic Survey (BAS)が管理する大型研究船に搭載されるセンサーの識別にこのメタデータの適用を続ける計画です。PIDは、英国のイニシアチブであるI/Oceanの一環として、「デッキからデスクトップ」までのセンサーデータとメタデータのワークフローを管理するために使用される予定です。

13.3. EISCAT3D

EISCAT3D は、フェンノスカンジア地方の北極圏上空の大気および地球近傍宇宙環境の研究、ならびに太陽系科学および電波天文学の支援を目的として、レーダー観測と非干渉性散乱技術を用いた国際研究基盤となる予定です。EISCAT3Dは、PIDINSTの勧告に従って、観測装置のための永続的識別子の実装を予定しています。このレーダーは複雑で、これまでのレーダーよりもデジタル化されており、大きく分けていくつかの別々のユニットに分かれています。これらのユニットではソフトウェアも重要な重要な構成要素ですが、ハードウェアのユニットとみなすことで、それぞれを永続的に識別することになります。ユニットの更新は主にソフトウェアに対して行われ、その結果、独自のPIDを持つ新バージョンのユニットが誕生します。レーダー自体も永続的に識別され、HasComponent という関係タイプを使用して永続的に識別されたユニットに関係づけることができます。

13.4. SENSOR.awi.de 及び PANGAEA

アルフレート・ヴェーゲナー研究所ー(Alfred Wegener Institute, AWI)ヘルムホルツ極地海洋研究センタ(Helmholtsz Centre for Polar and Marine Research)は、極地や海洋における科学データや関連情報の発見、閲覧、普及、保存のためのeResearchインフラの開発と維持に継続的に取り組んできました。研究プラットフォームとそれぞれのデバイスやセンサーの増加する異質性とプロジェクト駆動の様々な要件に対処するために、センサー観測からアーカイブへの流れ(observations to archives, O2A)をサポートすることを意図した汎用的かつモジュール式のフレームワークが構築されています[5] 。この中で、ENSOR.awi.deはOGC SensorML標準を使用して構築されており、現在までに4000を超える個々のレコードには、レコード引用の自動生成とともに、handle URI のUUIDを使用して永続的な識別子が割り当てられています。センサーのカテゴリ(NERC L05)、センサーのタイプやモデル(NERC L22)を定義するために用語(統制された語彙など)が使用されています。SENSOR.awi.deのデータモデルはPIDINSTスキーマに準拠しており、センサーのためのDatacite DOIの追加実装は現在評価中である。 SENSOR.awi.deの最終目標は、データ取得プロセスに使用された装置やセンサーの完全なメタデータと永続的な識別子を提供することにより、PANGAEAの公開データやアーカイブデータの品質を高めることです (Figure 12.2)。プラットフォームやセンサーは時間とともに進化するため(センサーの校正、機器のペイロードの変更など)、SENSOR.awi.deはXMLレコードの変更点の監査証跡を維持することによりレコードのバージョニングもサポートしています。

PANGAEAは環境研究データのデジタルリポジトリであり、AWIとMARUM(University Bremen)が共同で運営するO2Aフレームワーク内の長期保存専用アーカイブです。各データセットは、研究資源(例: 論文、研究助成機関、装置、標本など)との関係を含む記述的なメタデータとともに利用可能です。PANGAEAはデータ提供者として、デバイスの名称、識別子、タイプなどの限られた情報のみをキュレーションしています。装置の種類と名称を標準化するために、現在では外部の用語、特にNERC L05 device category vocabularyとL22 device catalogueを適用しています。リポジトリは、これらの用語集を定期的かつ段階的にインポートするために、カスタムメイドのクライアントアプリケーションを開発しました。装置の識別と詳細な説明のために、PANGAEAはSENSOR.awi.deのような装置登録機関に依存し、PANGAEAに保存されたデータの取得に使われた装置を一意に識別するためにその発行するPIDを使用しています。AWIとPANGAEAは同じボキャブラリー/用語とPIDを使用して装置を表現するため、特にO2Aの生データステージングエリアからデータ品質管理サービスなどを経て、最終目的地であるPANGAEAデータアーカイブにほぼリアルタイムでデータを転送する際にデータセットを容易に統合することが可能です。[5]

13.5. ICOS

炭素統合観測システム(Integrated Carbon Observation System, ICOS)は、ヨーロッパ大陸の温室効果ガス収支を定量的に把握するための汎欧州的な研究インフラです。ICOSでは、ガス濃度、風速・風向、湿度、温度など、多くの連続的なその場測定を行っています。ICOSでは、高品質の測定データを提供するために、データの出所を記録し、校正履歴を追跡するための永続的な識別子を装置に採用することが必須であると考えています。

13.6. B2INST

B2INST は永続性識別子と装置に関する記述を登録するサービスです。B2INSTのサービスは、特に研究グループや小規模なコミュニティーなど、レジストリサービスの運営能力が不十分な組織のギャップを埋めるものです。

このサービスを利用し、コミュニティや組織は、メタデータを登録し装置にPIDを割り当てることで、彼らの装置をFAIR化することができます。そして、この装置PIDは学術論文やデータセット等の研究成果に追加することができます。

B2INST は、メタデータへのPIDやDOIの割り当て、登録されたメタデータに基づく装置情報のランディングページの表示、といったいくつか汎用的な機能を提供します。また、登録された装置に対するデータアップロード(ほとんどすべての装置でサポートされるべき追加的な記述、例えばキャリブレーションプロトコルや装置図面、テクニカルマニュアルなど、になります)、のような追加機能も期待されます。B2INST では、登録された情報は全員に公開されます。情報の作成や編集には認証が必要です - そのため B2INST は認証連携をサポートし、これにより利用者は自身の組織のアカウントでシステムにログインすることができます。

いくつかのユースケースより、コミュニティは異なった要求を装置メタデータに求めることが明らかになりました。PIDINST スキーマは、装置を記述する最小限のメタデータセットにすぎません。その一方 B2INST はコミュニティによる拡張機能を提供します; これにより、装置記述内容の拡大や異なるコミュニティへの要求に応えることができます。PIDINST を基本とすることで、それぞれのコミュニティはメタデータ拡張を追加し、コミュニティ内からの要求に対するより良いサポートを実現できます。

直近の計画に、 B2INST は EUDATによる公開サービスとなることを要請されています。最初の実証実験は SURF プロジェクトに進められました。その後 GWDG によりプロダクションレベルでのサービスになるよう更なる開発が進められています。

13.7. アメリカ国立標準技術研究所(National Institute of Standards and Technology, NIST)

ある研究グループは、NISTのOffice of Data and Informatics と協力し、装置データベースに関する初期的な実装の提供を始めました。 このデータベースはNISTからの装置に関する生きた記録となることが望まれています。 実験機器への永続的識別子が、高品質かつ再現可能な科学の成果創出を行う者にとって不可欠な属性であると考えています。

我々は、 内部向けのWebインターフェイス構築の容易さから、 SharePoint プラットフォームを評価用ポータルとして選択しています。 RDA PIDINST schema v1.0 リリースを元にSharePoint リストオブジェクトを作成しました。 続いて二つのデータソースを使って項目にデータを投入していきました。 一つめは、NISTの電子顕微鏡である、 Nexus microsope の装置群です。 二つ目はNIST Sunflower property データベースです。 Sunflower property データベースでは、 NIST内の単独部署の配下としてリストアップされている装置のみに結果を制限したため、この検証実験でも管理可能な状態が保たれています。 結果、 この初期実装のデータベースでは、 600台以上の装置が登録されています。

この二つのデータソースから、 必要とされている項目の多くを埋めることができましたが、すべてではありませんでした。 LandingPage に関する要求では、 我々のほぼすべての装置ではランディングページを持っていないため、 Sunflower property データから、 Pelican static site generator により、プログラムでこれらを生成することにしました。 組織内で解決可能なIPアドレスが付されたWebページはNISTの裁量で一部を公開可能であることを踏まえて、ローカルのWebホスト上にサイトデータを登録しています。 Identifier に対する要求については、Handle番号を振り出し、SharePoint にインポートしています。 OwnerownerName のフィールドについては、 NIST が最上位のオーナーであるとしています。 しかしながら、装置PIDの運用が根付くに従い、装置のカストディアンが自主的に2番目又は3番目のオーナーとして申告されることを期待しています。 SharePoint List のオブジェクトはネストされた (1対n) オブジェクトを持つことができないことに触れておく必要があります。 したがって、我々の装置データベースは適切なデータベースシステムが決定するまで、プロトタイプ状態にとどまっています。この取り組みは現在も継続中です。