論文紹介: Neural Fourier Energy Disaggregation

2023年に読んだNILM(Non-Intrusive Load Monitoring)論文の1つ、Neural Fourier Energy Disaggregation の簡単な紹介をします。

法名は NFED (Neural Fourier Energy Disaggregation) と命名されています。

www.mdpi.com

2行で説明

簡単に言えば、

  • 電力分離(NILM、Energy Disaggregation)の分野で FNet を使ったよ
  • エッジデバイスでも使えそうな計算量、メモリ量になり性能も良かったよ

という論文です。

FNet

コアとなるのがFNetです。 Google Researchの研究者によって提案されたモデルとなります。

arxiv.org

ポイントは

  • トークン混合の手段としてAttention層の代わりにFFTを使った。学習パラメータなしで高速かつ学習も安定しやすい
  • BERTにやや劣るがそれに迫る精度を達成

アーキテクチャは以下のようになっています。

AttentionレイヤーがFourierレイヤーに置き換えられているだけです。

FFTしたあとにその実部だけを使うのが最も性能が出たとされていて、オフィシャルのコードでもそうなっています。

Ablation studyもされており、

トークン混合手段として

  • 通常self-attention
  • 線形モデル
  • FFT
  • ランダム行列
  • トークン混合なし

を比較することによってトークン混合が大事であることを示しています。

この結果は トークン混合手段は何でもよい という[2111.11418] MetaFormer Is Actually What You Need for Vision にも合致しており、納得のいく結果です。

NFEDモデルアーキテクチャ

基本的にFNetと同じです。 ただ、FNetとの違いとしてNFEDでは FFT結果のRealとImagを結合しています。(コードだと51行目)

https://github.com/ChristoferNal/Neural-Fourier-Energy-Disaggregation/blob/main/nfed.py#L51

ここの意図は論文中に特に記載されておらず、気になるところではあります。

性能評価

評価データセット

UK-DALE と REFIT、REDD が使われています。 基本的には UK-DALEでの評価で 異なるデータセットをテストデータとしたときにREFITとREDDが使われています。

Category1 Category2 Category3 Category4
Train UK-DALE 1家庭
UK-DALE 1家庭
UK-DALE 2~3家庭 UK-DALE 2~3家庭
Test UK-DALE 1家庭(trainと同じ) UK-DALE 1家庭(trainと別) UK-DALE 1家庭(trainと別) REFIT or REDDの1家庭

Category3, 4が最もハードな条件、ただ現実世界に近い条件になっています。

リファレンスモデル(ベースラインモデル)

  • S2P (Sequence-to-Point)
  • WGRU (Window GRU)
  • SAED (Self-attentive energy disaggregator)

の3つがリファレンスモデルとして使われています。

SAEDは同じ著者による提案手法ですが S2P、WGRUは他のNILM論文でもベースラインとしてよく登場する馴染みの手法です。

それぞれのアーキテクチャは次の通り。

S2P

WGRU

SAED

結果

今回はモデルの軽量化というのが狙いでもあり、F値やMAEと言った精度評価以外に メモリ容量、推論速度も評価対象に含まれています。

以下、5家電の結果です。

食洗機

洗濯機

冷蔵庫

電子レンジ

ケトル

提案手法であるNFED(青線)が4カテゴリにおける精度面でもシステム面(メモリ、処理速度)でもtopレベルであり良いという主張でした。

ただ、個人的にはオレンジ線のSAEDのほうが良さそうに見えてしまいます。。

所感

どんなに精度が高いモデルであってもシステム要求が厳しいのでは現実世界で使うことが難しいので実用性に目を向けた検討は(特にNILMの世界では)非常に良い方向性だと思いました。

性能比較結果からはリファレンス手法の1つであるSAEDのほうがどうしても良さそうに見えてしまうので、モヤモヤは残ります。

うがった見方をすれば、SAEDも同じ著者の提案手法なので引き立て役だったりするのかもしれませんw

論文の引用数もあまり多くないですし(本日時点で17件。ベースラインモデルのS2Pは505件、WGRUは147件)、今後、他の著者論文でも本論文が引用されるか注目していきたい所です。