じつは粗忽者

富士通のワープロOASYSから親指シフトが大好きです

NASのデータをamazon S3 Glacierにバックアップする(その1)

この記事について

 日々増えていくデジタルデータ、その中には決して失いたくない、失ってはならないデータがあります。それは、

  1. 法令によって一定期間保存することが定められているデータ
  2. 二度と手に入れることができないデータ

この2種類でしょうか。

 「1.法令によって…」のデータは一般人にはあまり縁がないデータで、あえて言えば、クレジットカードの利用明細*1、法令とは全く関係ないけれど昔の暮らしぶりを振り返るための家計簿のデータくらいが思いつきます。

 「2.二度手に入れることができない…」データは主に写真等の画像データでしょう。デジタルカメラが発達している今は、家族あるいは親しい友人と撮った写真は簡単に共有ができる反面、扱いを誤ると一瞬で消えてしまいます。個人にとってはこのデータが最も重要。

その他、Macのさまざまな操作を自動化しているシェルスクリプトAppleScriptソースコードも失うと途方に暮れるデータです。

 このような重要なデータを事故あるいは過失によって消失させた場合に復元するためにバックアップは重要な備えのはず。

 この記事では写真データなどをamazonが提供しているクラウドストレージに保存する手順をまとめました。なぜそんなことを思い至ったのかから書くと、だらだらと長くなりそうなので何回かに分けて書くことにします。

 

はじめに

 まず、「『AWS初心者』という言葉を勘違いしない」と申しあげておきます。

 Web上の記事、ブログ等で『「AWS初心者向け」○□×』というタイトルの記事を散見しますが、恐らくこれらの記事が対象としている「AWS初心者」とは、AWSを初めて使うUNIX系OSについてのスキルを保有していてそれらの上でソフトウェアシステムの構築作業、運用作業に携わったことのある人を指しているのでしょう。

 macOSWindowsubuntu等のデスクトップOSをGUIでしか扱ったことがないという方は手を出してはなりません。それは次の理由からです。

  • 何気ないあるいは不用意な操作*2で相当金額の使用料を請求される可能性がある
  • AWSが提供しているS3に代表されるサービス上でファイル等のデータを扱うためにターミナルで操作することが必要になることがあり、併せて、UNIX系OSの知識、プログラミング言語の知識も要求される

大きなお世話かもしれません(..;)。

バックアップとは

 バックアップとは*3どんな操作のことでしょう。富士フイルムさんのサイトに簡潔明瞭な説明がありました。

www.fujifilm.com

 この説明の中で重要な箇所は「データのコピーを別の保存先にも保存しておくことをいいます」という部分でしょう。PCユーザのデータの保存先として考えられるのは、

  • USB等のPCのインターフェースに接続できるハードディスク(以下ポータブルディスクとします)
  • NAS等のネットワークドライブ
  • AWSに代表されるクラウドコンピューティングサービスが提供するストレージ(以下Amazon S3と略します)

でしょうか。

何から保護しようとしているのか

 おかしな言い方ですがデータを保護するのは、データを消失、破壊(意味を成さないものにしてしまう)させてしまう何かに備えると言うことです。原因として考えられることは3点、

  • ハードウェアの故障による消失
  • 誤操作による消失
  • 論理的な誤りによる破壊

 ハードウェアの故障による消失は、2台のMacが同時に故障するという最悪の事態が起きたとしても、家計簿はiCloudに、ソースコード等のデータはDropboxに置いてあるので全てを失う可能性はほぼあり得ないでしょう。対して、画像データはローカルディスクとポータブルディスクが保存先なので備えがやや弱い状態です。

 誤操作による消失でmacOSユーザが最もやりがちなのが、command+deleteキーでのファイルの削除でしょうか。Finderで削除したとはいっても、いったんはゴミ箱に入っていますから落ち着いて復元操作をすれば大事には至りませんが、慌てると思わずゴミ箱まで空にしてしまう人間の性の悲しさ。そうなると、TimeMachineで過去にさかのぼって復旧するしかありません。証券会社などからの報告書は半年から年に1回のものもあるので2年程度はさかのぼることができるようにしておきたいものです。

 論理的な誤りによる破壊は、スプレッドシートに埋め込んでいた計算式が誤っていて計算結果が単なる数字の羅列になってしまうこと。へそくりの計算誤りは顔色を変える結果になっているのでは。この場合もやはり、TimeMachineで過去にさかのぼって復旧するしかありません。

保存先に何を選ぶか

 結論から申しあげますと、前に挙げた3種類のすべてを使っています。個人使用のデータでそこまでする必要があるかと問われると。Amazon S3は必要ないでしょう。ただ画像データをこの先5年から10年保持しようとしたときの選択としてありと判断しました。

ツールと頻度

 バックアップは以下のアプリを使ってそれぞれの頻度で行っています。

TimeMachine
  • NASの共有ドライブ(TimeMachineのスケジュールにおまかせ)*4
  • MacBook Pro/Airに接続するポータブルディスク(1回(手動)/週)
NASのアプリ(HBS 3 Hybrid Backup Sync)
  • NASのUSBに接続するポータブルディスク(1回/月程度)
  • AWS S3のS3 Glacier Deep Archive(3ヶ月から半年に1回程度)

 ポータブルディスクが2種類、MacBook Pro/Airに接続するものと、NASに接続するものがあるのはスプレッドシートなど書類データはMacBook(iCloud)に、音楽と画像データ、さまざまなPDFのデータがNASに置いてあるからです。

 MacBookにあるデータは、TimeMachineのスケジュールにまかせてNASにバックアップするとともに週に1回程度ポータブルディスクにもバックアップを行います。2つのバックアップディスクを使用するのは、かつては時折「信頼性を向上するために、新規バックアップを作成する必要があります」という目を疑うメッセージが表示され、新規にバックアップを作成し直すことを強要されることがあったことからの教訓からです。

見たことがある方もいらっしゃるかと( ̄Д ̄;;

 なお、NASにあるTimeMachineのデータはバックアップしていません。NASのドライブが故障したとしても別のハードディスクがあるからです。

保存期間・保存領域の大きさ

保存期間

 スプレッドシートなど書類データは2年間、音楽と画像データは無期限としています。

大きさの目安

 バックアップに使用するディスク、とりわけTimeMachineの出力先となるディスクの容量は如何ほどが良いか。データの更新頻度と追加する量によって変わるはずです。これまでMacを使ってきた教訓から決めています。それは

  • ポータブルディスクはTimeMachine専用としておく
  • 大きければ良いというものでもない

バイト単価が安く、財布が許す限り大きなディスクを使いたいと思いがち。ただ、大きくなればなるほどいざデータを復元しようとしたときに検索する時間が指数関数的にかかるようになります。数キロバイトスプレッドシートを復元するために数時間をかけることは楽しいことではありません。

 ポータブルディスクには相当な空きがあるはずですが、他のデータと共用をするとなんらかの理由でTimeMachineのバックアップデータを消去しなければならなくなったときに数日から週単位の時間が必要となります。バイト単価が少し高くなることには目をつむって必要最低限の大きさの機種を選ぶことにしています。現在は2TBの機種を使っています。

www.amazon.co.jp

また、NASのTimeMachineのデータは容量の上限を2台のMac合計で768GBにクオータで設定しています。

Amazon S3を使うわけ

長時間放置するのでハードディスクでは不安

 個人のデータとしてはバックアップを2個のハードディスクに取得しておけば十分だと思います。けれども、現役の時に何回もハードディスクの故障で夜明かしをしたことがある経験からバックアップをハードディスクのみにしておくことがどうにも不安です。なぜなら、

  • ディスクのアクチュエータは普段は寝ていてご機嫌は起きるまで分からない
  • ディスク表面のエラーはアクセスしてみるまで分からない

と思い込んでいます。もちろん、S.M.A.R.T.という故障検知・予測のための機能がありますし、サーバ機であれば定期的にディスク全体をスキャンする機能があるはずですが、なにせ年に数回程度使うだけディスクですからそこまでは求めることは無理というもの。となると替わりとなるものは、

  • USB、SDカード等ハードディスクの代替となるメモリーカード
  • ブルーレイ、DVD等の光ディスク

安心できそうなメーカーの1TB超のメモリーカードが安価になってきていますので選択肢に加えることができますが、メディアの収納場所を覚えておくことが面倒。光ディスクはまだまだ容量が足りませんし、書込に要する時間が馬鹿になりません。というほぼこじつけの消去法でインターネット上にあるストレージサービスを検討してみることにしました。

S.M.A.R.T.についてはこちら

e-words.jp

ハードディスクの構造はこちらの記事が参考になるはず

www.logitec.co.jp

ストレージサービスを比較してみる

インターネット上で提供されているストレージサービスにはいろいろありますが、Amazon S3以外のサービスについてはこちらの記事を参考にさせていただきました。すでに更新を停止したそうですが閲覧はできました。

blog.hisway306.jp

記事に書かれているとおり、残念なことにAmazonプライムフォト(2022年12月ではAmazon Photosです)の一択になりますがは2021年4月でQNAP Hybrid Backup Sync、HybridMount、Cloud Drive Syncからのアクセスが停止されています。NASで使用するバックアップのアプリを一つにしたかったのでAmazon S3を使ってみることにしました。Amazon S3については次回記載することにします。

続きます

*1:過払い金がありますなどという人の弱みにつけ込むような、主にラジオで氾濫するいかがわしいコマーシャルにはうんざりです。

*2:何度泣きを見たことか

*3:○□×とは、という言い方は好きではありませんが言葉の定義が必要ですのでやむを得ません。

*4:Bonjourサービス経由でアクセスするため同じネットワークアドレス上に設置しています