学術文献グラフデータベース IR支援


 統計数理研究所(以下、統数研)では平成28年度より、公募型共同利用重点型研究において「学術文献データ分析の新たな統計科学的アプローチ」をテーマとして活動しています。この重点テーマの目的は、大規模な学術文献データを用いた多様な価値観、評価軸に基づく研究成果の分析手法や、大学・研究機関の研究活動の効果・進展を客観的に評価するための指標及び“Institutional Research”(IR)に関する方法論等について、統計科学的見地からの研究を推進していくことにあります。
 このような研究には、大規模な学術文献データを用いた検証実験が必要になりますが、本重点テーマではクラリベイト・アナリティクス社(旧トムソン・ロイター社)の協力により、学術文献データベースの一つである Web of Science™のデータが利用できます。統数研ではこのデータをグラフデータベースに登録し、研究グループにサービスとして提供しています。


学術文献グラフデータベースとは

統数研では学術文献データ分析のためのデータベースシステムを開発しています。本重点テーマの課題向けに統数研の共用クラウド計算システム上で、書誌データベース分析システムを構築しました。書誌データのオリジナルデータは、Web of Science Core Collection™で、現在のデータベースには2005年から2014年の10年間のデータが登録されています。データベースには、グラフデータベースの1つであるNeo4jを採用しました。グラフデータベースではすべてのデータをノードとして表現し、ノード間の様々な関係性をエッジで表します。 学術文献の分析では、論文や研究者の関係を視覚化するために論文の共著関係や引用-被引用関係をグラフ(ネットワーク)構造として扱うことが重要です。 我々が開発しているシステムでは膨大なWeb of Science™のデータに含まれる書誌情報ネットワークから分析に必要なデータをグラフ構造のまま直接取り出すことが できます。


データベースの使い方

 重点テーマ「学術文献データ分析の新たな統計科学的アプローチ」採択課題の研究者向けに作成した、学術文献データベースのユーザーガイドです。


関連情報のご紹介

統計数理研究所が取り組むInstitutional Research

カレントアウェアネス-Eに寄稿した、統計数理研究所が取り組むIRに関する記事です

統計数理研究所共同利用案内

統計数理研究所共同利用のトップページです