01 fitpot introduction

fitpot — FIT machine-learning POTential parameters

MD シミュレーションの妥当性は，シミュレーションで使用する原子間ポテンシャルの精度に大きく依存する．したがって，特定のシステムのシミュレーションを行う場合は，想定する現象を再現できる原子間ポテンシャルを準備する必要がある．

ここでは，nap パッケージに含まれる fitpot プログラムを用いた機械学習ポテンシャルのパラメータ・フィッティング方法を紹介する．

NOTE

現在，fitpot プログラムはニューラルネットワークポテンシャルと uf3 ポテンシャルにのみ対応している．その他の古典的なポテンシャルについては，optzer を使用すること．

fitpot では，次の損失関数を最小化するように，ポテンシャルパラメータ $β$ を最適化する．

L ({β}) = \frac{w _{E}}{σ _{E}^{2} N _{s}} s \sum N_{s} Δ E^{2} + \frac{w _{F}}{3 σ _{F}^{2} N _{s} N ^{(s)}} s \sum N_{s} i \sum N ∣ Δ F_{i} ∣^{2} + \frac{w _{S}}{6 σ _{S}^{2} N _{s}} s \sum N_{s} ∣ Δ σ ∣^{2}

ここで，エネルギーと力，応力を参照データとする場合を考えている．

上記の損失関数を最小化するために，fitpot では以下の勾配法が利用可能である．

GitHubのnapパッケージに同梱されている．サイトからzipをダウンロードするか次のコマンドを実行する．

git clone https://github.com/ryokbys/nap.git ./nap

fitpot をコンパイルする前に，pmd のいくつかのモジュールが必要となるため，先に pmd をコンパイルすること．

$ cd /path/to/nap/
$ ./configure --prefix=$(pwd)
$ cd pmd/
$ make pmd lib     #<-- lib must be made in addition to pmd
$ cd ../fitpot/
$ make fitpot

fitpot の動作を確認するための最小限のデータセットを用いたサンプルがある．
examples/fitpot_DNN_SiO/ ディレクトリに移動し，README.md を読んだ後，fitpot を実行し，いくつかの出力ファイルを確認する．

以下では，参照データが ab-initio 計算プログラム VASP を使用して取得されたものと仮定する．ポテンシャルパラメータのフィッティングは，次の手順で行う．

fitpot を実行するためには，以下のファイルが必要である．

また，一部のケースでは，追加のファイルが必要になることがある．

また，in.fitpot 内の記述で，dataset/ ディレクトリ内のサンプルの数（num_samples）を指定する必要がある．

次のコマンドでサンプルファイル（smpl_）の数をカウントすることができる．

$ ls /path/to/dataset/smpl_* | wc -l