実験的熱電特性のデータベース化に向けた論文データ収集WebシステムStarry dataの開発

  • 桂 ゆかり
    東京大学大学院新領域創成科学研究科物質系専攻 物質・材料研究機構 情報統合型物質・材料研究拠点
  • 熊谷 将也
    大阪大学大学院工学研究科 環境・エネルギー工学専攻
  • 郡司 咲子
    物質・材料研究機構 情報統合型物質・材料研究拠点
  • 今井 庸二
    物質・材料研究機構 情報統合型物質・材料研究拠点
  • 木村 薫
    東京大学大学院新領域創成科学研究科物質系専攻

書誌事項

タイトル別名
  • Development of “Starry data” Web System for Data Curation of Published Experimental Thermoelectric Properties
  • ジッケンテキ ネツデントクセイ ノ データベースカ ニ ムケタ ロンブン データ シュウシュウ Web システム Starry data ノ カイハツ

この論文をさがす

抄録

<p>Although numerous papers are published each year, most of the experimental data reported in those papers are only available as two-dimensional plot images. Data-driven materials science using the machine learning technologies will be accelerated by gathering those published experimental data into a database. By taking thermoelectric materials as a test case, we attempted to optimize the processes of collection of papers, extraction of numeric data from plot images, and sample-based data storage into a database. By searching with a keyword “thermoelectric”, we obtained a list of 47,936 papers. Among these papers, we selected 18,471 papers as possible papers with thermoelectric properties, and succeeded to download 14,835 full-text PDF files. We developed a web system named “Starry data”, to assist the sequential data extraction from the images contained in those PDF files. This system also assists materials scientists to annotate experimental samples efficiently, to develop a descriptive database that can be used for machine-learning of the complex, sample-dependent materials properties.</p>

収録刊行物

被引用文献 (2)*注記

もっと見る

参考文献 (3)*注記

もっと見る

関連プロジェクト

もっと見る

詳細情報 詳細情報について

問題の指摘

ページトップへ