日立と積水化学、材料特性予測AIの精度を量子アニーリングで向上、材料開発期間を2割短縮

日立製作所(以下、日立)は2022年12月16日、積水化学工業と取り組んでいる材料開発において、材料の特性を予測するAIモデルの精度を量子アニーニングで高められることを実証したと発表した。量子アニーニングを適用することで、材料開発に要する期間を約20%削減できる見通し。開発した手法は、材料開発だけでなく、決定木アルゴリズムを用いるマシンラーニング(機械学習)の予測モデルに対して広範に適用可能だとしている。なお、量子アニーニングは、量子コンピュータの一種で、組み合わせ最適化問題を高速に解く仕組みの1つ。日立は、CMOS半導体の上に疑似的に量子アニーニングを再現した技術「CMOSアニーリング」のサービスを提供している。

 日立は、積水化学工業と取り組んでいる材料開発において、材料の特性を予測するAIモデルの精度を、量子アニーニングで高められることを実証した(図1)。量子アニーニングを適用することで、材料開発に要する期間を約20%削減できる見通し。開発した手法は、材料開発だけでなく、決定木アルゴリズムを用いるマシンラーニング(機械学習)の予測モデルに対して広範に適用可能だとしている。


図1:材料の特性を予測するAIモデルの精度を量子アニーニングで高めた(出典:日立製作所)

今回適用した量子アニーニングは、量子コンピュータの一種で、組み合わせ最適化問題を高速に解く仕組みの1つである。日立は、CMOS半導体の上に疑似的に量子アニーニングを再現した技術「CMOSアニーリング」のサービスを提供している(関連記事日立、疑似量子コンピュータ「CMOSアニーリング」のクラウドサービスを提供)。

日立と積水化学工業は、マテリアルズ・インフォマティクス(MI、AIやデータ解析によって新材料や代替材料を効率的に探索する手法)を進めている。開発期間を短縮する策として、あらかじめマシンラーニングによって材料の特性を予測したうえで、有望な材料に絞って開発を進めるというやり方を検討している。具体的には、材料に関する既存のデータを学習して、材料の特性を予測する予測モデルを構築する。作成した予測モデルを使って、材料の作成に適した条件を探索する。

少ない実験で有用な材料の候補を見つけるためには、材料の特性を高い精度で予測するAIモデルが求められる。予測精度を高めるためには、複数の変数を組み合わせた複合条件で学習することが有効だが、材料の作成に関わる各種の条件を考慮すると、組み合わせは膨大になってしまう。従来は、データサイエンティストが経験や勘に基づいて、組み合わせる条件を選んでいた。しかし、条件を網羅的に検討できていないため、精度の向上には限界があった。

今回、AI習モデルの構築において、MIでも一般的に用いられる決定木アルゴリズムに、疑似量子コンピュータ技術であるCMOSアニーリングを導入した。これにより、材料の作成に関わる条件を網羅的に考慮できるようになった。これにより、予測精度が向上する。

CMOSアニーリングを適用して構築した予測モデルを、既存の有機材料の分子構造から特性を予測する問題に適用した結果、従来技術(LightGBMおよびXGBoost)単独での予測を上回る精度を達成した(図2)。さらに、同技術を使って材料を開発した場合、従来方式と比べて、開発に要する期間を約20%削減できる見通しを得た。


図2:量子アニーニングを適用した場合の予測精度の改善結果(出典:日立製作所)

決定木アルゴリズムは、入力データを、条件に基づき次々分類していく手法である。予測精度は、分類に用いる条件や、条件の組み合わせによって決まる。一般の計算機の場合、計算が膨大にならないように、1つの変数を条件としてデータを分類していた。ところが、材料開発のように、各種の変数が材料の特性に影響する問題を予測するケースにおいては、扱う条件が単純過ぎるという問題があった。

これに対して日立は、複数の変数を組み合わせた複合条件を論理積で表現することで、多数の変数から自動かつ直接的に生成する技術を開発した(図3)。例えば、アイスクリームの売上を予測する場合、従来は「晴れか否か」で分類したうえで「午後か否か」で分類するなど、1つの変数で分類していた。同技術では「晴れて気温25度以上で湿度40%以上か否か」で分類したうえで「土曜日の午後か否か」で分類する、といったように、複数の変数を複合した条件を使ってデータを分類できるようになった。


図3:複合条件を用いてデータを分類する決定木アルゴリズムと、複合条件を最適化するCMOSアニーリング技術の概要(出典:日立製作所)
拡大画像表示

決定木アルゴリズムでは、例えば100個の変数の中から3つを組み合わせてデータを分類する。この場合の組み合わせ総数は10万通り以上になる。予測精度が最高になる組み合わせを求めるために、すべての組み合わせに対して計算すると、膨大な時間を必要とする。

多くの組み合わせの中から最適なものを短時間で選び出す問題には、量子アニーニングが適している。そこで、決定木アルゴリズムで最適な複合条件を選び出す問題を、CMOSアニーリングが扱えるQUBO形式の問題に変換して計算した。この結果、現実的な時間内で、予測精度が最も高まる複合条件を見いだせるようになった。

Original Post>