産総研と東大 深層学習で未知化合物物性を高速外挿予測

, , ,

2020年12月15日

 産業技術総合研究所(産総研)と東京大学はこのほど、量子物理学の密度汎関数理論(分子や結晶などの物性は電子密度のみで計算可能)に基づく深層学習技術を開発したと発表した。化合物の原子配置を電子の確率分布を表す波動関数に変換し、深層学習により電子密度やエネルギーなどの物性値を高速・高精度に外挿予測する。

 材料開発や創薬の分野では化合物のエネルギー、触媒の反応収率、発電材料の効率、薬剤の活性など様々な物性値の計算・予測が必要だが、理論計算・シミュレーションの計算コストは膨大である。深層学習技術により計算量は減るが、ブラックボックス性の計算であり解釈性・信頼性が低い上、学習データ範囲外のデータを推測する外挿予測は精度が低い。

 今回、産総研の最先端の機械学習技術の理論・アルゴリズムの開発と実データへの応用技術と、東京大学の機械学習技術を材料開発に利用するマテリアルズ・インフォマティクスに関する研究を統合。化合物の原子配置をまず原子の波動関数、そして分子の波動関数に変換。これに分子波動関数から得られる電子密度と原子配置から計算できるポテンシャルが一対一対応するような物理制約を課した上で、原子配置と物性値の大規模データベースを学習し、物性値を予測する。量子物理の基本情報を深層学習モデルの内部で表現・経由した上で化合物の物性値を予測するため、深層学習モデルのブラックボックス性がなく、予測結果の解釈性・信頼性が得られ、学習データから外れた未知の化合物の物性も外挿予測できる。

 理論計算予測値と実験値の誤差が1~2kcal/molであるのに対し、誤差2~5kcal/molと実用に耐える精度で外挿予測が可能。また20原子以上の複雑な構造でも、外挿予測誤差は小さいことを確認した。さらに理論計算では1分子に数十分から数時間かかるところを、数分で1万種類の分子予測が可能。これにより、実用に耐える外挿精度と10万倍以上の高速化を実現した。

 今後は材料開発や創薬の実応用に適用し、有用な触媒や薬剤の大規模な探索を行う。また物理学者・化学者と協力して物理学・化学関係の知識をより多く取り入れ、より高精度の予測ができる深層学習技術の開発を目指す。