原子の動きを計算機で模擬。それが『機械学習分子動力学法』。
Q.島村先生の研究テーマを教えてください。
主に「機械学習分子動力学法の開発及び物性研究への応用」を研究しています。ひとことで言うと「計算システムの開発」です。例えば地球などの惑星の公転やその軌道を予測することは宇宙を知る上でも重要です。その軌道の予測を“原子レベル”で計算するシステムを研究・開発しています。
Q.「原子レベルでの計算システム」について、詳しく教えてください。
身の回りの物質は多数の原子から作られており、物質の性質(例:熱を通しやすい・固いなど)を支配しているのはこの原子の振る舞いです。非常に小さい原子の動きを計算機の中で模擬する代表的な方法を『分子動力学法』と言います。これは自然科学の各分野の現象を原子レベルの視点から解明するために、古くから用いられてきた手法です。
手法としては、宇宙の惑星の軌道予測に使われているものと実は同じであったりします。惑星などの天体間に働く力と原子間に働く力は異なりますが、用いられる物理学の方程式が同じであるためです。ただ、精度良く扱える原子数はそれほど多くはありませんでした。とても計算時間がかかるからです。しかし「機械学習」、いわゆる計算機システムとの融合により飛躍的に改善され、特に材料学においては目覚ましい成果を挙げています。機械学習はどんなに複雑でも“パターン”を修得することが得意です。原子の動きは複雑がゆえに、扱える原子数に制限を与えていましたが、機械学習がそれを解決しました。私はこの『機械学習分子動力学法』の改良を行いながらも物性の解明のために適用し、現在は特に物質の熱の伝わりやすさに関する研究に携わっています。


Q.専門が「計算物性物理学・計算生物学・機械学習」とあります。物理と生物はそれぞれ別ジャンルのように思えてしまうのですが、それらに共通する「計算式がある」という解釈であっていますか?
はい。物性物理学が扱う材料(金属や半導体など)も、生物学が扱う生体物質(タンパク質など)も原子から作られているため、先述した「分子動力学法」の活躍の場です。目的物質が「材料か生体物質か」で物理学の研究なのか生物学なのかに分かれている…といったほうがわかりやすいでしょうか。
機械学習はこれらの研究の補助的な要素で活用しています。例えば、扱える原子数を増やすために、物性物理学・生物学の両分野で機械学習分子動力学法は用いられています。
物理や生物に関わらず、言語処理にも広く応用されているのが機械学習の手法です。例えば『Google翻訳』などもこの機械学習の手法で翻訳されています。機械学習の手法自体は、割と私たちの身近なところに存在しているんですよ。
原子の動きを計算・予測することで、何がわかる?
Q.島村先生の研究が進むと、どのようなことがわかるようになるのでしょうか。
私の感覚でわかりやすいと思われる例をいくつか挙げます。物理学で言うと「固さ」といった物性は、原子の間に作られる「結合」の強度が支配しています。従って、どのような結合が作られているかを調査することで「なぜ固いのか」という疑問に答えることができます。
また生物学では、創薬を例に挙げることができます。病気の原因は体内の特定のタンパク質であることが多く、薬はそのタンパク質の特定の位置に結合することでタンパク質の機能を抑制することが目的です。薬もタンパク質も原子から作られているので、分子動力学法でどのように結合するか調べることができ、より良い薬の設計に役立てられています。
Q. 島村先生の研究の中で、最も大きな課題はなんでしょうか。
機械学習の利点に頼り過ぎていることです。パラメータと非線形変換の多用が手法の適用範囲を狭めてしまい、応用の進展を滞らせている例もあります。例えば、化学反応過程にこの機械学習分子動力学法を適用することは難しい状況です。
機械学習の方法はいろんな表現能力を獲得させるために、背景にあるパターンや複雑な方程式の裏側にあるパターンなどを数学的に抽出します。しかし、それを行うとどうしても「機械学習が何をやっているかが把握できなくなってしまう」という弱点が出てくるのです。いわゆる「ブラックボックス化」です。非常に難しいパターンの習得はできるのだけれど、それがなぜ習得できたのかわからない状況になってしまうんです。機械学習を用いて結果として高精度が出たのだけれど、「なぜ上手く行ったのか」その説明ができないという点があります。
機械学習は複雑なパターンが抽出できるので、2012年あたりは「すごいものが出てきたぞ」とみんな思ったのですが、特に私たちのように物理学を志す者としては、逆に中が解釈不能になってきているという状況が出てきています。機械学習の性能に頼れば頼るほど結果としての精度は高くなっていき、いろんな計算が早くなっていくし、今まで辿り着けなかったような領域の物性の解明までできるようになったのですが、もっと複雑な材料を用いた場合はブラックボックス化していて「なぜそうなったか」が見えない。現在はそういう問題に直面しているところです。
原点回帰をしつつ、ニューラルネットワークを適材適所に活用。
Q.では、ブラックボックス化の解決策も模索されているのですね。
そうですね。「今までの物理学を大切にし、要所要所で機械学習の機能を追加していこうじゃないか」という流れがあります。私の研究室もそうですし、2019年頃から世界的にその方向に行きつつありますね。
今のニューラルネットワーク(パターンを認識するための一連のアルゴリズムのこと)は全体を一気に考えてしまおうという概念です。その一方で途端に私たち人間がわかりにくくなる面もある。それが今の機械学習の解釈性の問題となっています。
例えば、原子じゃなくて地球の公転を考えてみます。機械学習を使って地球の公転軌道を精度良く予測できるようにはなるはずです。しかし「では何がどのように影響してその公転軌道を形成するに至ったのか」についてはわからないのです。天体の物理学によると距離が近くて重いものほど強く引っ張られる力を受けますので、太陽系では地球は太陽から最も影響を受けます。また、太陽だけではなく他の惑星や月などの天体からも影響も受けているだろうし、もしかすると年々増加傾向にある宇宙ゴミのような人工物の影響を受けているかもしれない。しかしそれらの影響の程度を教えてはくれません。だったら、影響を知りたい部分については既存の物理法則でしっかりと記述して、残りの部分はニューラルネットワークを使って記述しようと言うのが最近の流れです。先の例を踏まえると宇宙ゴミについては物理法則で記述し、太陽を含めて他の天体・人工物の影響の記述はすべてニューラルネットワークに任せるといった感じです。大雑把に言うと、もしニューラルネットワークだけで地球の軌道予測が行えるのであれば、宇宙ゴミの影響は無視できるほど小さいということを知ることができます。
解釈性を保ちながら、機械学習のニューラルネットワークの手法を適材適所に活用していこうという流れが現在できつつありますね。
「ブラックボックス化」が解決されると、より現実的な現象に原子レベルの視点からの知見を得て、次の開発などの進展に貢献できます。最近の最先端の研究の場、例えば脱炭素社会実現に関連するプロジェクトなどでは、非常に複雑な化学反応などが取り扱われている一方で、「原子レベルで何が起こっているか分からない」といった状況に遭遇することが多いのです。原子レベルの知見はより良い次の戦略を立てるために必須であると考えています。その糸口となるような研究を進めています。


脱炭素社会への実現にも貢献。
Q.脱炭素社会実現に関するプロジェクトでも、島村先生の研究が求められているのですね。
はい。私自身ももともと興味があったテーマなので、参加させてもらっています。
そのプロジェクトで私たちが何をやっているかというと、「排熱を、エネルギーや電気として利用できないか」という取り組みの一環で、熱電変換材料の探求を行なっているところです。これが実現できれば、熱を効率的に電気に変えることができるようになります。
Q.排熱をエネルギーに変換するためのシステムや計算法を開発するということでしょうか?
熱電変換材料の性能を測る指標はいくつかあるのですが、その一つが物質内部の熱の伝わりやすさ、つまり熱伝導度です。例えば金属類は触ると冷たいですよね。加熱してもすぐ熱が逃げてしまう。このように金属は非常に熱伝導度が高い状態です。一方、木材のような素材は熱伝導が低いと言われています。
なぜ熱伝導度と熱電変換という話がつながるというと、せっかく蓄えた電力を、再び熱として逃してしまうと意味がないですよね。そこで熱伝導度が低い、いわゆる熱を逃さない物質が必要になってくる。その熱をどう逃さないようにするかの機構が、私たちが研究している“原子”と密接に関わっているんです。
原子が作る構造には結晶構造や液体構造などがあります。原子が規則正しく並んだ結晶状態だと熱は非常に逃しやすく、逆に液体状態だと原子が非常にランダムに動くため熱を逃しにくくなります。そこで私たちの研究を生かして「熱伝導度が低いものを提供する際、どのような原子構造がいいのか」を調べているところです。
昔の研究は古い!? いいえ、先人の研究を見直しましょう!
Q.「研究の道に進みたい」と考えている学生たちに、何かアドバイスをお願いします。
「よく調べること」でしょうか。実は「100年、50年も前に答えが出ていた」ということもよくあるのです。それには色々な理由があるんですよね。以前は研究過程や論文は紙で残すことが主体だったため、効率的に共有できるデータベースがなかった。だからみんな図書館などに行き、時間をかけて手作業で必死に探していました。
昔の文献がデータベースに掲載され始め、情報の共有が始まったのはつい最近のことなんです。だから「調べてみたら、過去にすでに答えが出ていた」ということもわかり始めるようになりました。「昔の研究が古い」と思い込んでいると、そういう状況になってしまうので気をつけたいですよね。計算機もない時代によく考えたなというのは結構あります。先人のデータをきちんと調べた上で自分の研究に反映していくことは、とても重要なことだと思います。
