14

研究データ出版の動向

学術界では、科学研究の成果や関連するデータや情報を共有する「オープンサイエンス」の動きが強まっています。そこで登場したのが、データジャーナル。研究データについて詳細に記述し、公開することで他の研究者が再利用することを助けます。研究データを広く公開することで社会貢献するとともに、価値あるデータを他の研究者に再利用してもらうことで次の科学的発見につなげることができるのです。しかし、ほとんどの研究者は自身の研究成果を論文として発表することが学術界にとっても自身のキャリアにとっても良いと認識していながら、すべての研究データを論文と共に発表することに合意しているとは言えません。長年、研究当事者はデータを所有物と考え、他の研究者は方法と結論さえ明確に書かれていればデータを見る必要はないと考えていました。この考え方が変わりつつあります。再現性の危機が問題視され、オンラインアクセスが増加するに従ってデータの検索や閲覧が簡単にできるようになると、科学者や研究者たちの間でデータを共有する新しい動きが出てきたのです。データ・レポジトリ(またはデータリポジトリ)が構築されると、新たな論文の出版先としてデータジャーナルが浮上してきました。データジャーナルの動向を探ります。

データジャーナルと研究データ

まず、日本学術会議情報学委員会から出された報告書によれば、データジャーナルとは「データ生産者が分野を超えて連携して、オリジナル論文に埋め込んだデータや論文投稿時に棄却した高品質のデータを学術の成果として集積するための新たな場」と記されています。データジャーナルは、データ自体を研究成果として発表する場です。多くのデータジャーナルはオープンアクセス(OA)誌の形で刊行されており、分野を超えて利用されています。ところが「データ」自体は特に定義されていないため、簡単に言えば、観察の結果および研究を進める間に研究題材に関連付けて研究者が集めた情報全般となります。ここには生データだけでなく、処理・較正された値、発表内容まで研究の過程で生じたすべての情報(未処理のデータファイル、ソフトウェア、ソースコード、プロトコル、方法、インタビュー記録、モデルなど)も含まれます。

従来の学術論文は、主な発見や興味深い結果を重視し、そこに至るデータにはあまり注意を払ってきませんでした。その理由としては、研究者が集めたデータが論文に書き込むには膨大だった、一般的に論文の中のデータの位置づけが研究の結論を補完するものだったなどが挙げられます。では、今まで発表してこなかったデータを発表することに、意味があるのでしょうか。

研究データは公開すべき?

研究成果たる論文の根拠となる情報である研究データの公開を検討すべき理由は複数ありますが、最初に挙げるべきは、再現性の危機(reproducibility crisis)対策でしょう。データを共有すれば、学術界(科学コミュニティ)は再現性の検証ができます。次に、データを公開すれば、他の研究者がデータだけでなく実験・分析方法などの詳細を確認し、新しい課題に取り込むことも可能です。もちろん、著者が新たな共同研究を立ち上げるにも、学術界で研究者として評価を高めることにも役立ちます。また、データを公開することは学術界のみならず、政策決定の際に参照されたり学術関係以外の研究者が入手できるようになったりするなどの便益が図られます。最後は、自分にとってのメリットです。データを公開することで論文の被引用数を増やすことができます。データを、データジャーナルやデータ・レポジトリに公開することによって、他者に適正に研究データを引用する機会を提供し、それによってデータ提供者はその功績を認められることになるのです。

データをどこに公開するか

データの公開する方法としては、データジャーナルに出版するか、データ・レポジトリに保存するかの2通りがあります。データ・レポジトリは、研究データ(画像データや数値データなど)や研究に付随するプログラム等を収集・保管しておくことを目的としています。データ・レポジトリは研究者にとって既になじみのあるものですが、その利用は個々の大学や研究機関などに限られており、部外者が簡単に利用することはできない上、多くのデータ・レポジトリへのアクセスは有料です。とはいえ、European Open Science Cloud(EOSC) ポータルのように無料のデータ・レポジトリもあるので、参考にしてみましょう。

もうひとつの方法が、データジャーナルです。ほとんどの研究者は論文を出版し、原稿とは別にデータをデータ・レポジトリに保存していましたが、この方法では特定のデータを探し出すのが簡単とは言い難い状況でした。データジャーナルは、データセットを探しやすくするのと同時に、普及・引用しやすくすることを目的としています。データジャーナルには、データセットを説明する簡潔な文章とレポジトリに収納された全データへのリンクが示されるので、データの保存や再利用を促すために有効な手法と考えられています。ほとんどのデータジャーナルに書式があり、著者はこの書式に入力してデータ情報を提出するだけで投稿できるようになっています。データジャーナルはMEDLINE のように主要な医薬文献検索に収録されるので、従来の学術雑誌(ジャーナル)同様にインパクト・ファクター(IF)を取ることができます。

データジャーナルとして普及しているものには、Data in BriefGenomics Data (エルゼビア)、Open Health Data (Ubiquity Press)、Scientific Data (Nature)、GigaScience (BMC)などがあります。従来の学術出版社や学会出版社に加え、オープンアクセス専門の出版社などがデータジャーナルを創刊しており、数の増加に伴い認知度も上がってきています。トムソン・ロイター社が発表している、データセットの書誌・引用情報を収録したデータベースData Citation Indexは、研究者が投稿するデータジャーナルを選択する際、有用な情報を提供してくれます。どのデータジャーナルが適しているかは、研究分野や共有したいと考えるデータの種類にもよりますが、データを共有することは、論文の被引用回数の増加につながるだけでなく、成果が公に信頼される知識として共有資産化されることにより、データ作成者/投稿者にメリットをもたらすでしょう。

データジャーナルがデータの入手可能性を向上

一般的に、データジャーナルは研究者がデータを公開しやすく、かつ入手しやすいようになっています。データジャーナルの登場により、従来の「データは所有物」として共有せず、引用されることも少なかった学術界の常識が変わってきています。進行中の研究に携わっているのであれば、データ共有を検討してみてください。データを共有することで、その分野においてあなたの研究の認知度が上がり、さらにデータ共有の試みの後押しとなるでしょう。そのことが、結果的に世界の科学研究を推し進めることになるのです。

X

今すぐメールニュースに登録して無制限のアクセスを

エナゴ学術英語アカデミーのコンテンツに無制限でアクセスできます。

  • ブログ 560記事以上
  • オンラインセミナー 50講座以上
  • インフォグラフィック 50以上
  • Q&Aフォーラム
  • eBook 10タイトル以上
  • 使えて便利なチェックリスト 10以上

* ご入力いただくメールアドレスは個人情報保護方針に則り厳重に取り扱い、お客様の同意がない限り第三者に開示いたしません。

研究者の投票に参加する

研究・論文執筆におけるAIツールの使用について、大学はどのようなスタンスをとるべきだと考えますか?