【実録】ハードディスクのデータが飛んじゃった 〜サルベージを考えた写真・動画のバックアップ

先週末、ハードディスクが飛びました。そして、復旧作業を1週間ほどやっていました。
復旧を終えたところで、HDDがマウントされなくなり、無事「終了」しました。HDD、最後までありがとう。
(といっても、フォーマットしたら使えそうな雰囲気。「チッチュイーン」みたいな異音を時々発するので保証期間内に交換する予定です)

今回は長いよ。

復旧に使用したアプリ

こちらを選びました。Mac用のハードディスクのデータ復旧としては、

  • EaseUS Data Recovery Wizard
  • Wondershare Recoverit
  • Disk Drill

いくつか出てくるのですが、それぞれのフリー版で復旧できるファイルリストを確認したときに、復旧できそうなファイルが実際にプレビューできて(動画は再生できる)わかりやすい形でリストされたので、こちらを選びました(個人の感想)。

Amazonで販売されている日本版パッケージ価格はWindows/Macで3ライセンス分で8,000円弱。

開発元のサイトで直接支払うよりもお安く、支払いもAmazonなので安心かと思いまして。
あとで調べたらJustMyshopでは優待価格で5,000円でしたが、たぶん届くスピードはAmazonが早いです。

なお、アプリ自体は開発元のCleverfilesのサイトのダウンロード版と同じもので、ダウンロード版も日本語表示対応。
ダウンロード版にパッケージ版のアクティベーションコードも通りました(2021年4月現在)

復旧の流れ(データ取り出し編)

  1. 復旧したいドライブを選んでスキャンをかけます。
    このスキャンが一番時間がかかる部分です。
    スキャン中に復旧できたファイルのプレビューはできるので、その点は「ああ、復旧進んでるな…」と思えるところ。CPUもガンガン回って、Mac miniは熱々です。
  2. スキャンの途中でファイルの復旧状況を確認できます。
  3. 大体1日弱でスキャンが終わり、ディープスキャンの結果がわかります。
  4. 復元したいものを選択して、別のハードディスクに書き出します。
    (新しいハードディスクが必要です。このHDDは4TBのうち1.5TBほど使っているディスクでしたが、重複して復旧されるファイルがあるため3TBになりましたので倍ぐらいになります。もし元のディスクが1TBでフルで使っている場合は2TB以上の新しいハードディスクが必要かと思います。)
  5. (ファイル整理編へ進む→)

スキャンが完了するといくつかのフォルダに分類されて表示されます。
(説明書にも詳しい説明がなかったので、ファイル内容を見た感想です)

  • 存在するファイル
    もともと見えているファイル+α。復旧しやすいデータ。ファイル名もフォルダ構造も完璧に残っている感じ
  • 再構築済み(ラベルつき)
    ファイル名やどのフォルダにあったファイルかの情報が失われている場合が多い。拡張子ごとにフォルダ分けされていて、ファイルが作成されたアプリ名、動画だと撮影機種などがラベル付けされる。「iPhoneで撮った動画だな」「Photoshopで作成したjpgだな」などがわかる。ファイル作成の日付が残っている場合も多い。
  • 再構築済み
    ファイル名、日付、ほとんど残っていない。拡張子だけがかろうじてある。exifもないので、写真は時期がわからない場合もある。
    それぞれのファイルの中身を目視でチェックする必要がある。写真の場合は後述のソフトで比較することなどで対応可能。
  • ディープスキャン
    処理の中で一番時間のかかっている部分で、すべてのスキャン完了後になって出てくる項目。

それぞれの復旧レベル内でも、それぞれのレベル間でも重複があるように感じました。
ただし、このディスクの使い方がTimeMachineのデータや時々手動バックアップした同じデータが混ざっているのも要因とも言えます。

復旧の流れ(データ整理編)

復旧したデータはそのままでは整理のついてない状態ですので、復旧できたように見えてデータが壊れているものは捨て、重複したものは片方を捨てなければなりません。さらに、これを機会に要らないものは捨てていく判断も必要かと思います。

先ほどの分類からすると、ファイル状態の良さを比較すると

存在しているファイル > ディープスキャン
——– ↑ちゃんとしたファイル VVV ↓かろうじて読める ——–
再構築済み(ラベルつき) >>>>> 再構築済み

の順番になりますので、「存在しているファイル」を軸にして、それ以外のデータ整理をすすめます。

⑤壊れているファイルの整理

文書などの小さいファイルは数も多く内容を目視するようなチェックは難しいので重複データを削除してからが楽ですが、写真や動画などデータが大きく、MacですとQuickLookでざっくり確認できるものは、さっとチェックしてしまいたいところです。

特に数百メガある動画データの中に4KBしかないくせに「わたし拡張子は動画です」とフリをしているデータがあります。
このサイズだと実体はないと考えてよいと思います。捨てても大丈夫です
(「存在しているファイル」から捨てたとしても、ディープスキャンや再構築済みに再生できるデータがある可能性があります)

⑥重複したデータの整理

なんども違う方法でHDDスキャンして出てくるファイルなので、どうしても重複したデータがあります。しかし、重複してないデータは、いろんな方法を試して、ようやく復旧できた大切なデータと考えられます。優先的に内容をチェックしたいところです。

私のデータで重複したのはTimeMachineや手動でのバックアップのほかにMac標準の写真アプリのライブラリです。
これは、大変難儀したポイントです。

Macの写真ライブラリは1ファイルのように見えて、パッケージの中にデータベースとバラバラの写真データが入っています。
写真データはプレビュー用に小さいデータが複製され、オリジナルとプレビュー用に同じ絵の写真が含まれます。オリジナルファイル名はIMG0283など、その複製はランダムなファイル名のものです。これが復旧作業で全部フラットに出てきてしまいます。

また自分の環境で多いのは、ウェブサイトのバックアップデータです。これも数日おきにとっているので、同じファイル・写真が複数出てきます。ウェブサイトのデータはディレクトリ構造が崩れると意味がないので、データ圧縮効果はなくてもzipなどでまとめておくのがベストだと思います。

「写真」とされているデータの小さいファイルサイズのものはこれがほとんどで、家族写真の中にAdobe製品の小さなアイコンデータがひょっこりまざっていたりします。

とりあえず、この大量のデータから復旧しておきたいのは家族の写真や動画。
探しやすくするために、まずは下記のアプリを使って重複データを取り除き、チェックが必要なファイル数を減らします。

重複したファイルを探す

Duplicate File Finder Remover…文書、動画などの重複したものをリスト化して、不要な方を自動選択(手動でも可)、まとめてゴミ箱に入れるアプリ(Mac App Store

AutoMarkでは、Preferenceから、「特定のフォルダのファイルにゴミ箱マークをつける」設定がありますので、「再構築済み」カテゴリのファイルのように、情報を失ったファイルの方を優先して削除できると思います。

私は、このアプリの処理を次のようにかけました。

  • 「存在しているファイル」の中だけでチェックして重複分削除
  • 「ディープスキャン」の中だけでチェックして重複分削除
  • 「再構築済み(ラベルつき)」の中だけでチェックして重複分削除
  • 「再構築済み」の中だけでチェックして重複分削除
  • 「再構築済み(ラベルつき)」と「再構築済み」の間でチェックして重複分削除して1つのフォルダ「再構築済み(統合)」に入れる
  • 「存在しているファイル」と「ディープスキャン」の間でチェックして重複分削除、「整理済み」に統合
  • 「整理済み」と「再構築済み(統合)」を比較して重複分削除

という感じでしょうか。最後の整理済みと再構築済みは統合しません。
これは再構築済みはファイル名などの見た目でわかる情報が残っていないため内容のチェックが必要だからです。
とはいえ、ほかとの重複を取っているので、数はかなり減らせているとは思います(まぁ…数千も残ってるんですが…)

重複した写真を探す
ゴミ箱マークを自動でつけて、ぽいっ

Duplicate Photos Finder…重複した写真に特化したアプリ。ファイルの作成日やサイズに加えて、写真の内容も比較して重複したものをリスト化(Mac App Store

写真同士を比較します。AutoMarkで捨てる方のデータを自動選択できます。
条件としては、画像サイズ、データサイズ、RAWデータかどうかで自動的に判断されますが、AutoMark > Show Preference で細かい設定もできます。写真アプリのパッケージデータも対応します(システムライブラリのみ)

今回のようなサルベージ向けに便利なのは以下の2つかと思います。

  1. Mark with longer name(長い名前の方をゴミ箱マークをつける)
    IMG0868などのファイルと、file 4576x3056_000891.jpgみたいなものを比較して、後者をゴミ箱に入れられます。
  2. Mark without Label(ラベルのついてない方にゴミ箱マークをつける)
    たとえば「こっちのフォルダの中身を保持したい」という場合は、ファイルをすべて選択してMacの赤や黄色のラベルをつけておくと「Color Label:Mark without Label(ラベルのついてない方にゴミ箱マークをつける)」を使って振り分けられます。

とりあえず、これで重複した写真もほとんどなくなったと思います…
と思ったら、判断つかないものも残っているみたいです。

上のスクリーンショットのように、アプリの表示用のリソースデータが外に出ちゃったものもあります。
写真の内容が同じで、色合いが違う程度だと削除対象になったりもしてますね。
ある程度以上は、手動で捨てていくしかないのかなというところです。

最後は人力、目視による整理なのです。

再構築済み(ラベルつき)の中のラベルが役立ちます。
写真はカメラ機種でまとめていくと、ミラーレスで撮ったのは、ほぼほぼ家族の写真データです。写真の縦横比率が極端なものはWebサイトの画像パーツかも知れません(かなり軽いgifデータとか)。そしてドキュメントデータの中に使ったこともないアプリの名前があれば、それは外部からもらったデータだったりします。

これからゆっくりと、仕分けて捨てたり保存用にしたりしていきます。長い長い道のりです。

ということで、突然ですが今回の結論

  • Macの写真アプリからは全ファイルを書き出したものを別にバックアップして、元データをCloudに保存できるとよい。
    写真アプリのライブラリをパッケージでバックアップしていても、きれいには復旧されず、複製された同じ写真で整理がつかなくなります。
    今回もGoogle Photosに大半の写真は残っていますし写真の画質は落ちてないので有効ですが、動画は元データでないと画質がひどい。
  • 写真アプリの中は、ぶれた写真とか、メモとか、スクリーンショットとかは捨てて、きれいにしておくべきだと思います。
    (写真アプリを最終的な管理場所としないのもよいとは思いますが、普段の使い勝手的にはありなので一時保管場所って感じでしょうか)
  • ウェブサイトのバックアップデータは、時間がかかってもzipでひとつにまとめる!(できればCloudにも置いておこう)
  • 動画データは元データをどこかに残そう。撮影ミスは捨てよう。H.265でできるだけ小さくしてCloudにおいておくのもよし。

とにかく、元データとして残っていれば整理もしやすい、ということです(´`)あたりまえー。

読まなくてもいい言い訳のコーナー

今回のHDDの故障、といってもハード的なものではないのです。
HDDにアクセスが集中するような作業がいくつも重なって、システム全体が緩慢になり強制終了→再起動。
その結果ファイルのディレクトリが見えなくなる現象という感じです。データとしては破壊されたものは少なかったように思います。

どういう作業が重なったか

  • 動画の編集後の書き出し…伴う素材データの読み出し
    普段はローカルのSSDに移しますが、今回は素材データをHDDに入れっぱなしでした。これだけならそれほど問題にはならないと思います。ただ処理はとても重くなるので、まったく書き出しが進みません…。
  • TimeMachineの定時バックアップ
    同じディスクに対して、1時間おきのバックアップが走りました。実はその数日前までは別のバックアップ用HDDがありましたが、同じドライブ上に切り替えました。これが間違いの始まり。
  • 不要データの削除
    編集の待ち時間がもったいないしなーと整理をしたりしてました。

HDDには大量の作業が積み重なるため、だんだんとMac自体の動作が重くなり、書き出しを強制終了、そしてMacも重くなったので通常終了して再起動。再起動の途中でブルースクリーンになり、強制的に電源断。再起動。

で、HDDを見てみると、10個ぐらいあったはずのディレクトリが4個に…。
このHDDちょいちょい変な音がしてたのも事実ですが、書き込み、読み出し、削除が重ねてシステムに不安定にしたのが敗因。

この動画の素材などを置いておく場所と、定期的にバックアップが走るバックアップディスクは同じにしてはいけないなぁと思いました。
今はハードディスク安いですので、いくつも買った方が安心。
8TBを1個買って、論理ドライブを2つにわけて用途を分けるよりは、4TBを2つ買った方が安心。TimeMachine用には2TBとかでもいいのでさらに別のものを買った方が安心。

心もストレージも入れ替えて、また頑張ります。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

CAPTCHA