2024-05-02

日能研のスケジュールをOCRで抜き出しGoogleカレンダーに登録する

塾（日能研）の予定表が毎月、印刷物で配られます。あるいは、マイページからpdf形式でダウンロードできます。

いずれにせよ、それらをカレンダーに手動で登録するのが面倒臭い

もう一つ言うと、高学年の予定の日付を確認するためには視線をいちいち左右に振らないといけないので辛い

ということで、OCRを使ってイベントを抽出し、Googleカレンダーに登録するということをやってみました。

OCRの認識精度（テキスト区切りの安定さも含めて）が完璧ではないので、全自動ではなく半自動のシステムになりますが一応やりたいことはできるようになりました。

github.com

全体の構成

OCRで抽出したテキストから必要な情報を取り出し整形し、LINE Notifyにてスマホに通知します。

Googleカレンダー登録用のURLを作成して通知するだけなので自動でスケジュール登録はできません。

ただ、イベント情報の抽出が一部間違っていたとしても、カレンダー登録時に修正が手動で可能なので正確性は担保できるし、手間は十分に省けます。また、手動登録にすることで自分のクラスに関係ないイベントもフィルタリングできます。

OCR

GCPのDocument AIを使いました。 Cloud Vision APIでもOCRでテキスト抽出できるのですが Document AIは情報をテーブル構造で抽出できるForm Parserというのがあり、Document AIを選択しました。

ただ、今回対象としている予定表は部分的な入れ子構造があったり、複数セルに覆いかぶせる形でのテキスト重畳があったり、複雑な表になっているので実際にはテーブル構造での情報抽出はうまくいきませんでした

ということで、Document AI を使ってますが通常のOCRプロセッサによる処理です。

Document AIではローカルのpdfファイルも扱えますがCloud Vision APIでは（現時点では）Cloud Storage上のpdfファイルしか扱えないようで、システム面ではダウンロードしたpdfファイルをダイレクトに処理できるDocument AIのほうが地味に好ましいです。（Cloud Vision APIの場合、pdfを画像化すればローカルのファイルでも問題ないです）

公式ページでは以下のようにDocument AIとCloud Vision APIのユースケースについて記述されています。

https://cloud.google.com/document-ai/docs/enterprise-document-ocr より

Document AIのコスト

Cloud Vision APIは最初の1000オペレーション/月は無料です。一方、Document AI は無料枠がありません。。

公式ページの料金表によると 1,000 ページあたり $1.50 となっています。

1ドル155円として、1ページあたり 1.5 / 1000 * 1 * 155 = 0.2325円

大量の枚数を処理しない限りはそこまで気にする料金ではないと思ってますが無料でできるのに越したことはないのでCloud Vision APIのOCRに乗り換えられるか、今後試してみようと思います。

ちなみに、テーブル構造で抽出できるFormパーサーだと1,000ページあたり $30 となり、通常のOCRプロセッサの20倍するのでコストにはある程度気を配る必要があります。

抽出アルゴリズム

抽出アルゴリズムの概要は以下の通りです。

日付に相当するテキスト群を抽出し、そのおおよそのx座標を計算する
対象学年のテキストを抽出し、その学年のイベントに相当するx座標を計算する
学年のイベントと思われるテキストを抽出する
イベントテキストのy座標にマッチする日付を抽出する

ゴリゴリと日能研の予定表に特化したルールベースでやっているので残念ながら他のフォーマット（スケジュール表）には対応できず、拡張性がありません..。日能研にしても、他校の予定表に対して適応できるかはわかりません。。

当初の目論見通りにFormプロセッサを使ってテーブル構造でばっちり情報抽出できればカラム定義表のカスタマイズ程度で他の予定表にも対応できるはずなのですが残念です。

使ってみて

スマホでさくっと塾の予定確認できる状態になったのは非常に便利です。

OCR＆予定抽出のアルゴリズムの精度が十分であればLINEに通知するだけでも十分有用かなと感じました。（現状だと間違った日付になってしまったり、イベントの漏れがある可能性があるので若干危険）

参考記事

2024-04-13

pog_horse_selector

過去に作ったPOGドラフト会議での指名馬入力ツールをオープンソースにしてなかったことに気付いたので今更ながらgithubにあげました。

このツールは過去の記事で紹介しています

sanshonoki.hatenablog.com

リリース当時は簡素な画面デザインでしたが vuetify を導入して少しだけ洗練されてます。

さて、肝心なコードはこちらです。

github.com

2024年度用のサンプルのデータも含めているので、すぐにでも自分のFirebaseホストにデプロイ可能です。

デプロイするのが面倒な方はこちらからご利用できます。

2019年の秋に開発開始して2020年のPOGドラフトに合わせてリリース。今年度用に再デプロイしようとしたら4年前からメンテナンスを全くしてないせいもあり、エラーでビルドできなくなっていました..。（昨年はビルドできた）

yarn install から動かなくなっていたので node.js のバージョンを上げたりいろいろと手当てして、いちおうビルドしてデプロイできる最低限の状態には復旧できました。

ただ、npmパッケージ関係のバージョンは維持したこともありビルドで大量のWarningがでます..（汗）

年度ごとのデータカタログの作り方

README に horse_catalogue.json の作成方法までは記載してないのでこちらに書きます。

ステップ1

netkeiba_data_collector をgit cloneし、仮想環境を作って必要なパッケージをインストール

その後、2歳馬データのリストを取得する

$ python get_horse_data.py --age 2 --include_no_debut -o 2024_horse_data.csv

ステップ2

pog_horse_selector の toolディレクトリにあるスクリプトでcsvをjsonに変換する

$ python csv2json.py -o horse_catalogue.json 2024_horse_data.csv

あとは作成した horse_catalogue.json を src/assets/ に配置すればそのデータがアプリケーションのビルドに使われます。

つぶやき

1年は早いですね。商用ベースではない個人開発サービスのメンテナンスの難しさを身にしみて感じます..

が、いちおうまだ動くのでPOG愛好家の方々にとって少しでもお役に立てれば幸いです

昨年のPOGドラフトでメンバーから改善要望をもらってたので時間があれば反映させたい。。

2024-04-06

NILMTKのdockerイメージ

MacがIntelからApple Siliconに変わったこともあり、nilmtkを新しいマシンでも使えるようにしてみました。ただ、毎度、新規に環境構築をするのも面倒なのでdockerイメージを作ることにしました。

出来上がったものはこちら

github.com

NILMの代表的なデータセット（REDD, UKDALE, REFIT）を導入するためのスクリプトも入れてあるので素早く実験を開始することができます。

苦労した点

過去の記事のときもうまくいかなかったように今回も公式手順にある以下の conda install の方法はうまくいきませんでした 😞

$ conda config --add channels conda-forge
$ conda install -c nilmtk nilmtk

IntelマシンではなくMac M1でビルドしていることもありますが、約15000秒（約4.2時間）かかったあとに無情のエラーでビルド失敗..

ERROR: failed to solve: process "/bin/sh -c conda install -c nilmtk nilmtk -y" did not complete successfully: exit code: 1

過去の手順でやるしかないのかな..と思っていたところ pip install でインストールできる方法が偶然見つかりました

Unable to download nilmtk · Issue #953 · nilmtk/nilmtk · GitHub

In summary, for the most up-to-date installation instructions, here're the steps

Create environment for python=3.8

pip install git+https://github.com/nilmtk/nilmtk@0.4.3 Ref from here

pip install git+https://github.com/nilmtk/nilm_metadata@0.2.4 Verify installation

startup python console environment and enter import nilmtk

これの通りやるとnilmtkを問題なくインストールできました✨

ただ、DNN系のアルゴリズムを使えるnilmtk-contribを合わせてインストールしようとするとパッケージの依存関係が解決できずエラーになってしまいます..

解決方法としては、依存パッケージをインストールせずに本体のみをまずpipインストールし、そのあとに依存パッケージを別途インストールすることにしました。

Dockerfileでの該当箇所は以下

COPY files/requirements.nilmtk_contrib.txt /tmp
RUN conda init bash && . ~/.bashrc && conda activate nilmtk-env \
  && pip install git+https://github.com/nilmtk/nilmtk@0.4.3 \
  && pip install git+https://github.com/nilmtk/nilm_metadata@0.2.4 \
  && pip install --no-deps git+https://github.com/nilmtk/nilmtk-contrib \
  && pip install -r /tmp/requirements.nilmtk_contrib.txt

あと、試しにPython3.8ではなくPython3.9に変えてみたところインスールNGだったので、Python3.8を使う必要があります

NILMデータセット

datasetディレクトリ以下に redd、refit、ukdaleのディレクトリがあり、各サブディレクトリに入って download.sh と convert.py を実行すれば nilmtkで使えるh5形式のファイルが生成されます

ただ、REDDは配布サイトであるhttps://redd.csail.mit.edu/にアクセスしても応答が返ってこなくダウンロードできません（場所が変わったのだろうか? 🤔）

以前にダウンロードしたファイルが手元にあったのでconvertできることは確認しています。

あと、UKDALEも一部のファイルがでかいので（house_1のmains.datで4.1Gある）、Dockerのメモリが16GBぐらい必要です。足りないとconvert中に Killed されます

Python3.11版のdockerイメージ

pipの方法だとPython3.8でしか動かせないので Python3.11版のdockerイメージも作りました。

github.com

こちらは過去の記事の方法に沿ってやらないといけませんが、無事イメージ作成 & インストールすることができました。

こちらも依存関係が難しくオリジナルのsetup.py を改修したファイルをコピーしてインストールするようにしました。

また、nilmtk-contribが古いKerasベースのコードになっており新しいKerasのバージョンではライブラリのロード時にエラーになってしまい、こちらに関しても修正したファイルを別途用意しておき上書きコピーしてインストールするようにしました。

2024-03-23

論文紹介：DiffNILM: A Novel Framework for Non-Intrusive Load Monitoring Based on the Conditional Diffusion Model

NILM(Non-Intrusive Load Monitoring)の論文紹介 3回目です。今回は2023年に発表された論文の1つを紹介します。

www.mdpi.com

3行で説明する

NILMの分野で初めてDiffusion modelを使った
全体電力と埋込み時間情報を入力とする条件付きDiffusionモデル
計算量には目をつぶるが既存手法を上回る結果を達成した

アプローチ

拡散モデル（Diffusion model）は以下の図のように拡散過程と逆拡散過程から成り、逆拡散過程によってランダムノイズからデータを生成します。

NILMは分離のタスクなので

入力：家全体の消費電力の系列
出力：（そのうちの）ある家電の消費電力系列

となります。

単純に拡散モデルを適用してもランダムに電力データが出力されるだけとなり目的には合いません

条件付き拡散モデル

そこで条件付きの拡散モデルの出番です。 DALL・Eなどの画像生成AIではプロンプトがそれ（条件）に当たり、条件に応じた生成データを出力してくれます。

図中のConditional inputsとなるところが条件入力となり、

Aggregated power data: 家の全体電力の系列
Embedded temporal features: 時間系列の埋め込み情報

が入力されます。

これにより、家全体の消費電力情報と時間情報に応じて各家電の消費電力データ（Diffused appliance-level power data）を生成できるようになります

（拡散モデルなのでモデル自体は真の家電消費電力データに近づくように取り除くべきノイズ成分 $ \epsilon_{\theta} $ を出力します）

時間情報埋め込み

家電は季節や時間帯によって使われやすい/使われにくいが変わってくるので時間情報を埋め込みとして入力するのは Make sense です

Month of year：何月
Hour of day：何時
Day of week：何曜日

の3次元情報を ~0.5~+0.5 の範囲で埋め込みます

アーキテクチャ

推定ノイズ成分 $ \epsilon_{\theta} $ を出力するネットワークです

$ X_\overline{a} $：ノイズ含む家電消費電力系列
$ \sqrt{\overline{a}} $：ノイズレベル
$ X_{aggre} $ : 家全体の消費電力系列
$ X_{time} $：時間埋め込み情報

実験情報では残差レイヤーは10個とのことで大きいネットワークです。

活性化関数としては SiLu （Sigmoid Linear Unit）が使われています。

学習とサンプリングの手順

学習フェーズ

実験情報では T = 1000 となっています

開始
学習データセットから家電正解電力 $ x_0 $ を取り出す
1~1000の一様分布から $ t $ をサンプリング
時刻 $ t $ でのノイズ率 $ \sqrt{\overline{\alpha}_{t}} $ 〜 $ \sqrt{\overline{\alpha}_{t-1}} $ の一様分布からノイズ率 $ \sqrt{\overline{\alpha}} $ をサンプリング
標準正規分布からノイズ $ \epsilon $ をサンプリング
モデルで予測したノイズ成分 $ \epsilon_{\theta} $ と $ \epsilon $ の L1対数誤差を損失関数として逆伝搬させる
- $ \sqrt{\overline{\alpha}} $ ：ステップ4のノイズ率
- $ x_{\overline{\alpha}} $ ：正解電力 $ x_0 $ にノイズ率 $ \sqrt{\overline{\alpha}} $ に応じてノイズを付加したデータ
- $ x_d $ ：全体電力データと時刻情報埋め込みデータ
収束するまで続ける

L1損失ではなく対数L1損失を使うほうが収束も速く、結果も良かったとのことです。

サンプリングフェーズ

標準正規分布からランダムノイズ $ x_T $ をサンプリング
$ T_{infer} $ ステップ分、以降の処理（3. ~ 6.）を繰り返す
標準正規分布からランダムノイズ $ z $ をサンプリング
ノイズスケジューラから時刻 $ t $ における $ \overline{\beta}_{t} （= 分散）$ を計算
モデルにノイズ成分 $ \epsilon_{\theta} $ を予測させ、$ x_t $ から引き算する（→時刻 $ t $ での $ x_t $ の平均値 $ \mu_{\theta} $）
時刻 $ t $ での平均値 $ \mu_{\theta} $ にステップ3のランダムノイズ $ z $ に分散をかけたものを加算し、$ x_{t-1} $ とする
$ t = 0 $ になるまで繰り返す
$ t = 0 $ 時点での生成電力データ $ x_0 $ （=家電の予測電力データ）を返す

実験情報からは $ T_{infer} = 8 $ ということでたった8ステップで生成できるのは驚きました

fast sampling（[2106.00132] On Fast Sampling of Diffusion Probabilistic Models）という手法らしいです。

評価

データセット

データセットはデファクトとも言える

REDD
- 6家庭、約4ヶ月分のデータ
UKDALE
- House1：3年分のデータ
- House2~5：数ヶ月分のデータ

が使われています

評価指標

分類
- Accuracy
- F1-score
回帰
- MAE
- MRE (Mean Relative Error)

MRE は分母が正解値と予測値のmaxとなっており、正解値を分母とするMAPEとは若干違っています

MAPEでは正解値が小さいときに大きく外すと分母が小さいため大きなペナルティが課されますが、MREではそれが緩和されています。

正解値	予測値	誤差	MAPE	MRE
100	1000	900	9.0	0.9
1000	100	900	0.9	0.9

リファレンスモデル

リファレンスモデルは以下の4つです

Bi-LSTM
- https://www.sciencedirect.com/science/article/abs/pii/S0957417420304930
CNN (Seq2Point)
- [1612.09106] Sequence-to-point learning with neural networks for nonintrusive load monitoring
BERT4NILM
- http://nilmworkshop.org/2020/proceedings/nilm20-final88.pdf
cGAN (Seq2Subseq)
- https://ieeexplore.ieee.org/document/9053947

cGANの論文はIEEEの有料論文となっていて購入しない限り読めないですが ICASSPでの発表スライド（SEQUENCE-TO-SUBSEQUENCE LEARNING WITH CONDITIONAL GAN FOR POWER DISAGGREGATION | SigPort）は閲覧可能です

評価結果

＜REDDでの評価結果＞

提案手法であるDiffNILMが分類タスク（F1スコア）でも回帰タスク（MAE、MRE）でも全体を通して良い結果になっています。

特に、電力パターンが複雑なWasher（洗濯機）、Dish washer（食洗機）において良いスコアを示しています。

＜UKDALEでの評価結果＞

REDDでの結果よりもDiffNILMの優勢さが目立つ結果になっています。

もう1つの生成モデルであるcGANもスコアがREDDに比べて改善しており、学習データ量が増えたことにより性能を発揮するようになったと考えられます。（REDDの4ヶ月に対してUKDALEは3年）

学習データが十分にないときに生成モデルを使うことは不適当であることを示唆しています

所感

計算量は膨大だと思われますが分離性能は有望そうであり、今後、計算コストの改善を期待したいです。（すぐに思いつくのは潜在拡散モデルの導入ですがどうなんだろう）

以下のような色々な細かい工夫がなされているので

ReLuではなく、SiLu
L1損失ではなく、対数L1損失
fastサンプリング

安定的に学習&予測させるのは大変なんだろうなぁと思いつつ、サンプル実装が公開されたら追試してみたいところです。

2024-03-17

GCEインスタンスに急にsshログインできなくなったときの対応

ローカルマシンを新調したら今までsshでログイン出来ていたリモートホストに突然ログインできなくなりました。

$ gcloud compute ssh REMOTE_HOST

USER@IP_ADDRESS: Permission denied (publickey).

sshに関してよくあるエラーメッセージです。

ただ、新旧マシンで .ssh のディレクトリやファイルの権限、鍵の中身を確認しても同一であり問題なさそうでした。

原因

no mutual signature algorithm という署名アルゴリズムのミスマッチが原因でした

調べ方

ssh時にvTオプションをつけることで原因が分かりました

$ ssh -vT -i ~/.ssh/google_compute_engine USER@REMOTE_HOST
...
...
debug1: send_pubkey_test: no mutual signature algorithm
debug1: No more authentication methods to try.
...

と、出力メッセージの中にエラーの原因が出力されてます

コマンドヘルプによると

     -T      Disable pseudo-terminal allocation.
     -v      Verbose mode.  Causes ssh to print debugging messages about its progress.  This is helpful in debugging connection, authentication, and configuration
             problems.  Multiple -v options increase the verbosity.  The maximum is 3.

とのことです。

対処方法

参考記事そのままになりますが

PubkeyAcceptedKeyTypesのオプションをつけて接続する

$ ssh -o 'PubkeyAcceptedKeyTypes +ssh-rsa' -i ~/.ssh/google_compute_engine USER@REMOTE_HOST

あるいは、 ~/.ssh/config に以下を記述

Host {REMOTE_HOST}
  HostKeyAlgorithms ssh-rsa
  PubkeyAcceptedKeyTypes ssh-rsa
  IdentityFile ~/.ssh/google_compute_engine

これで問題なく今まで通りログインできるようになりました

（参考）各マシンのsshのバージョン

# Remote Host (GCEのVM）
OpenSSH_6.7p1 Debian-5+deb8u1, OpenSSL 1.0.1k 8 Jan 2015

# Old Mac (Remote HostへのSSH OK)
OpenSSH_8.1p1, LibreSSL 2.7.3

# New Mac (Remote HostへのSSH NG)
OpenSSH_9.0p1, LibreSSL 3.3.6

バージョン乖離が大きいときは要注意ということですね

追記

後で見つけた記事、これやこれによると OpenSSH 8.8 から RSA方式が使えなくなったようです。

自分の場合は同じ鍵をそのまま使いたかったので暫定的な対処をしましたが、本来は強度の強い暗号化形式で鍵を新規作成すべきでしょう

$ ssh-keygen -t ed25519

参考記事

2024-03-09

論文紹介： SAED: self-attentive energy disaggregation

今回もNILM（Non-Intrusive Load Monitoring）論文紹介です。前回のNeural Fourier Energy Disaggregationの論文紹介でリファレンス手法として挙げられていた論文です。

link.springer.com

2行で説明すると

BidirectionalGRUの代わりにシンプルなAttention機構を組み込んでみたよ
軽量かつ特に汎化性能に関して良い性能を示したよ

モデルアーキテクチャ

モデルアーキテクチャは以下のようになっています

基本的には、WGRU手法の最初のBidirectional GRU層がAttention層に置き換わっただけですが後半のBidirectional GRU層のサイズやDense層のサイズも 128 -> 64 と減少しています

＜WGRUのアーキテクチャ＞（NFED論文より引用）

軽量を謳っているように、モデルのパラメータサイズは圧倒的にリファレンスモデルと比べて小さくなっています。

Attention層を導入することにより性能を落とさず全結合層のサイズを小さくできたためと解釈するのが良さそうです。

Additive or Dot

Attention層は論文の図中にもあるようにシンプルなもので Additive と Dot の2種類のAttentionが使われています

それぞれ

Additive: Bahdanauのアテンション（https://arxiv.org/abs/1409.0473）
Dot: Luongのアテンション (https://arxiv.org/abs/1508.04025)

に対応しています。

それぞれのkeras実装はこちらになります

Luongの論文ではconcat含む以下の3種類のやり方が示されているのですがこのうちの dot が Luongスタイルということみたいです。

(https://arxiv.org/pdf/1508.04025.pdf より)

dot手法のSAED-dotのほうが高速であり、以下の表を見ると性能としてもSAED-dotのほうがadditive手法のSAED-addのほうより若干優勢と読み取れます。

性能評価

データセット

データセットは UK-DALEと REDD、REFITが使われています。

DW（食洗機）、FZ（冷蔵庫）、KT（ケトル）、MW（電子レンジ）、WM（洗濯機）については、

	Category1	Category2	Category3	Category4
Train	UK-DALE 1家庭	UK-DALE 1家庭	UK-DALE 2~4家庭	UK-DALE 2~3家庭
Test	UK-DALE 1家庭（trainと同じ）	UK-DALE 2~4家庭（trainと別）	UK-DALE 1家庭（trainと別）	REDDの4~5家庭

TVとPCに関しては、

	Category1	Category2	Category3	Category4
Train	REFIT 1家庭	REFIT 1家庭	REFIT 2家庭	REFIT 2家庭
Test	REFIT 1家庭（trainと同じ）	REFIT 1家庭（trainと別）	REFIT 2家庭（trainと別）	UK-DALEの1~2家庭

という学習/テスト条件になっています

Category1は汎化性能を確認するための比較条件となり、基本的にはCategory2~4の結果に注目すべきでしょう

評価指標

F1スコア、MAEといった馴染みのある指標に加えて汎化性能を示すための指標としてAUH、EUH、MGLが使われています。

AUH: Accuracy on Unseen Houses
EUH: Error on Unseen Houses
MGL: Mean Generalization Loss

AUHとEUHの定義はこちら

学習に使ってない家庭の平均F1スコア、平均MAEということであり、素直に理解できます。AccuracyとなってますがF1スコアの平均です。

MGLの定義はこちら

F1スコアベースでもMAEベースでも直感的には、

seen家庭スコア > unseen家庭スコア：正の値
seen家庭スコア = unseen家庭スコア： 0
seen家庭スコア < unseen家庭スコア：負の値（あり得る??）

となります

つまり、0や負の値に近づくなどマイナスも含めて数値が小さくなればなるほど汎化性能が良いということを表します。

リファレンスモデル

WGRU (Window GRU)
Seq2Point (Sequence-to-Point)

Seq2Point （NFED論文より引用）

色々なNILM論文で引用されるSeq2PointやWGRUが比較対象となっており、基本的には信頼できそうです

定量評価結果

論文中はすべて表ベースになっていて比較がやりにくく分かりにくいのでグラフにしてみました

Time/ep

まず、一番わかり易い Time/ep（1エポックあたりの学習時間）から

WGRUが断トツに遅くなっており、Seq2PointはSAED-dotはほぼ同等レベル（若干SAED-dotのほうがより速い）、SAED-addはこれら2つに比べるとやや遅いという結果になっています。

F1スコア

category1~2ではWGRUであったりSeq2Pointが若干良さそうですが category3~4ではSAEDの2手法がやや良さそうに見えます。

MAE

F1スコアと同様の結果（優劣）になってます

（参考）家電別 F1スコア

（参考）家電別 MAE

感想

実験結果からは SAEDはcategory3~4といったところで相対的に成績が良く、汎化性能について優れているという主張でした。

アテンション機構の強力さだったりやパラメータ数の少なさから良い汎化性能を示すという流れは理解できますが同じ家庭の学習/評価のcategory1より学習家庭と異なる家庭を評価したcategory2のほうがスコアが良かったりする箇所が至るところであり（家電別 F1スコアのグラフでよく分かる）、結果に関して??な所が残ります。

単にリファレンス手法が過学習気味になっている可能性も頭に入れておきたいです。

引用数も17件と多くなく、他の著者の論文で本手法がリファレンスとして登場するのか注目したい所です

2024-03-03

Mac (Apple Silicon) で gcsfuse を使う方法

意外と参考記事がなかったのでメモを残します。インストールまではスムーズですがその後のセキュリティ絡みのところが面倒でした。

前提

Google Cloud SDK（gcloud CLI）のインストール済み
- 参考記事：gcloud CLI をインストールする | Google Cloud CLI のドキュメント
GCSのバケットを作成してある

手順

1. Macfuseのインストール

$ brew install --cask macfuse

過去記事では macfuse ではなくosxfuse をインストールするものもありますが osxfuse has been succeeded by macfuse as of version 4.0.0. ということのようなので macfuseをインストールします

2. Goのインストール

$ brew install gcsfuse では、

gcsfuse: Linux is required for this software. libfuse: Linux is required for this software. Error: gcsfuse: Unsatisfied requirements failed this build.

となり、Apple SiliconのMacへは直接インストールできないのでGoをインストールしてビルドします。

$ brew install go

インストールできたらバージョン確認できるはずです

$  go version
go version go1.22.0 darwin/arm64

3. gcsfuseのインストール

$ go install github.com/googlecloudplatform/gcsfuse@master

でインストールはすんなり完了

インストールできたら .zshrc でパスを追加します

export PATH=$HOME/go/bin:$PATH

参考記事に書かれている

GO111MODULE=auto go get -u github.com/googlecloudplatform/gcsfuse

だと、

go: go.mod file not found in current directory or any parent directory.
    'go get' is no longer supported outside a module.
    To build and install a command, use 'go install' with a version,
    like 'go install example.com/cmd@latest'

となっちゃいます。古い情報になってしまっています

ちなみに、Go関連の環境変数は以下で確認できます。インストール後のデフォルト設定を変更する必要はありませんでした

$ go env
GOPATH='/Users/xxx/go'
GOROOT='/opt/homebrew/Cellar/go/1.22.0/libexec'
GOTOOLDIR='/opt/homebrew/Cellar/go/1.22.0/libexec/pkg/tool/darwin_arm64'

4. Cloud Storage への Cloud Storage FUSE リクエストを認証する

Cloud Storage FUSE を使用して Cloud Storage バケットをマウントする | Google Cloud に書かれている通り、

$ gcloud auth application-default login
$ gcloud auth login

でok

5. Macのシステム機能拡張を有効にする

ここがかなり面倒です。

この状態で次の6.のステップでマウントしようとすると

となり、機能拡張を有効にする必要があることがわかります。

システム設定 > プライバシーとセキュリティ

から システム機能拡張を有効にする… をクリックします

すると、

となり、起動セキュリティユーティリティを起動することになります。

起動セキュリティユーティリティの起動

メッセージの通り、システム終了させて電源ボタン押したままで起動させます。

手順はオフィシャルのページに書かれています

Appleシリコンを搭載したMacの起動ディスクのセキュリティ設定を変更する - Apple サポート (日本)

「起動オプションを読み込み中..」と表示されるまで電源ボタンを押し続けます。表示されたら電源ボタンは離してokです

「オプション」をクリック
「続ける」をクリック
パスワードが分かっているユーザーを選択
選択して、「次へ」をクリック
上部メニューの「ユーティリティ」から「起動セキュリティユーティリティを起動」をクリック
「セキュリティポリシーの設定に使用したいシステムを選択してください」と出るのでディスクを選択して「ロック解除」をクリック
セキュリティポリシーで「低セキュリティ」を選択し、「確認済みの開発元から提供されたカーネル機能拡張のユーザ管理を強化」をチェック
OKをクリック
起動ディスクのメニューから「システム終了」をクリック

再起動後、

再び、システム設定 > プライバシーとセキュリティを開き、

「App Storeと確認済みの開発元からのアプリケーションを許可」を選び、「開発元”Benjamin Fleischer”のシステムソフトウェアの読み込みがブロックされました」を「許可」します

新しいシステム機能拡張を使用するには再起動が必要ですとなるので再度、Mac再起動させます。

6. バケットのマウント

お疲れさまでした。ここまでできたらあとはバケットをマウントするだけです

# マウント
$ gcsfuse バケット名 マウント先ディレクトリ

# アンマウント
$ umount マウント先ディレクトリ