WHSからデータ救出で一悶着

さて、前件から、問題なくリストアができて安心していた一方で、かつて事故で無くなったデータをWHSから復元していないのではないか、と焦りと共に思い出した。
幸いなことに、外したHDDはシステムと共にスレーブとしてネットワークPCに接続して、かつてのサーバフォルダ群をそのまま活用している。

各クライアントPCからコネクタソフトはアンインストールしてしまっているが、バックアップは削除せずにいる。
そこで再びコネクタソフトをインストールできる状況にしてやればレスキューできるのでは、と考えた。

当時の起動とデータのHDDをそのままネットワークPCに乗せていただけなので、現状のマスターストレージ(windows10)であるSSDとの起動順を入れ替えて、WHSを起動。
しかし、いくら待っても起動しない。
HDDアクセスランプは点灯し、たまに点滅しているのでアクセスはしている様子であるが、数時間そのままにしていても変化がない。
これはおかしい。
そこでセーフモードでスタートアップ修復できないかと目論むが、セーフモードで表示される読み込みで、classpnp.sysが表示されてから全く動く気配がない。
何度やっても同じ。
アクセスランプは似た動作なので、通常起動でもセーフモードでも同じところでこけている様子である。(推測)

この段階で止まってしまう現象はネット上にごろごろしている模様。
中の一つに(どこの情報か失念)classpnp.sysを削除すれば、再起動時にスタートアップ修復に移行するとの情報を発見。
早速試そうとするも、windows10からだとセキュリティの関係で簡単に削除できない。
アクセス許可などをして、削除ではなく名前変更にしてリスク回避。
.oldファイルにリネームしておいた。
しかし、それでもやっぱり起動できず。
お次はdisk.sysの段で止まってしまう。

こりゃわからん。
じゃぁ元に戻すのが最短ルートか。
そういやWHSの時に使っていたマザーは別のPCを組むのに使ってしまったなぁ。
仕方なく、かつて初期の頃にWHSを搭載していたatom525なマザーを拾い上げてくることにした。
もう使わないと思い、処分スペースに移動していたが、結果からしてデータもマザーも同時期の物は保存しておくのが一番の保険である。
ちなみに、そんなわけでslot1のころのものも一台ずつ確保してあるのは、余談。

するとあっけなくWHSが起動してくれた。
実はこの時点で管理コンソールが開けるのでデータの復元が可能になったと勘違いしていて、しかしてその実サーバからだとアクセスできないようになっている。
確か、別のクライアントからならいけたはず(薄く遠い記憶であるが)で、全PCからコネクタをアンインストールしたのでやる気が出ない。
どうせ復元するのはメインPCのデータなのだから、とメインPCにコネクタを入れてアクセス。

このようにセーフモードやハードの載せ替えなど、幾つもの困難を乗り越えながら、実はレスキューできたデータはなかったのである。
動画を入れていたHDDをまるごとバックアップ対象からはずしていたので、あの事件が起きたときにもう全ては消失していたことになる。

WHSの機能の良さ、そしてバックアップは大事だよなぁとつくづく思う。

ryzen3000へ交換

予定通り、ryzen1700から3000シリーズへ変更した。
これまた予定通り、マザーは交換せず、cpuのみの交換。

asrock Fatal1ty X370 Gaming K4
BIOSを当時の最新、5.40pにしてからの載せ替え。
買った当時のままのBIOSのバージョンで、3.1だったか、3.0だったか。
アップする順に上げていったのだが、ドライバーを当てる必要あり。
結構面倒くさい。
できればマザーを買い換えたいところである。
純正のクーラーは使用せず、前回搭載した簡易水冷cpuクーラーをそのまま使用。

予定と違うところは、予定していた3800Xではなく、3700Xとしたところ。
そして、一番困った予定外が、というか、想定外。

マザーが起動しない事案。
asrockのマザー上にあるエラーコード表示が作動する前にリセットがかかり、コレ一番基本的に駄目なやつ。
原因はメモリーだろうなと、3枚差しての計40GBを取り外し、一枚ずつ試す。
どれか、どこかに合うだろうとたかをくくっていたのに、どういう組み合わせでも起動しない。
焦る、ずんずん焦る。
マザーの買い換えが頭をよぎる。
やな感じ。
と、十数回試行錯誤を繰り返して、ようやくエラーコードが表示されてから止まる場所とメモリー本体の組み合わせを見つけ出す。
とはいえ、相変わらずのリセット作動。
ただ、しばらくその様子を見ていると、3回目くらいだろうか、リセット後にクーラーの回転数が最高に回り、それまでの挙動と異なる動作をし始めた。
数回ほど、1700Xに戻してBIOSの設定を変えて試してもいたが、結局はいずれも失敗で、失敗の場合は2回目以降初期設定になって回り始める(フェイルセーフになる)はずだが。
違うのか?
とにかく動作の予想が立たない。
そんなことはさておき、予想外な場面で、とうとう、やっとのことで、postが通りwindowsまで到着できたのだ。

小一時間近く消費したろうか、近年の換装作業では一番大変だった。
しかしまぁ、現在問題なく3700Xを回せているので良しとしよう。

ただ、重大な予想外が…。
メモリーが一枚差しなのである。
2枚以上だとどうやっても起動してくれない。
そんなわけで、DSな16GBを2枚と8GBを一枚の中から、16GBを一枚のみ使用している。
まさかそんなにメモリーを弾かれるとは予想外。

更に、BIOSでAUTO設定にしていると常時4.2GHzでcpuが回る。
消費電力と発熱がものすごいのだが…。

ともに、BIOS更新でなんとかならないだろうか。

<2019/10/11追記>

Ryzen 7 3700Xをレビュー:i7どころか格上のi9すら追い込む
こちらを参考に、電力消費をどこまで下げられるかチャレンジ。

4.2GHzで1.288Vとあるので試してみるものの、そこまで細かくは刻めないので1.275でチェック。
動作はするが、動画エンコード中に強制リセット。
アイドルが100W程度なのに対し、97Wと気持ちだけ下がる。

1.3Vならエンコもベンチも問題なし。
100Wちょいのアイドルで、ベンチでは170W程度で若干ピークも下がる。

しかしこれ、ほぼ誤差の範囲では??
まぁそれでも標準の1.4V台の時よりも消費が少ないのは間違いないので、現在はこれで動作中。

また、メモリスロットにより起動しない件。
メモリ1枚でないと起動しない

まさにこれと同一案件。
ただ、組み合わせは全種類やったので間違いないと思うが、2枚以上はうちでは無理だった。
マザーが違うので、そりゃね。

CDIの通知設定を使う

CrystalDiskInfo
HDDの保守で常駐しているCDI。
HDDの連続不具合で戦々恐々中なのである。
今回の件を振り返ってみれば、CDIを入れていれば安心、と言う感覚に陥ってしまったのが最大の問題かなぁ。
発見時に即対応しておけばデータは助かったかも知れないわけで。
ただ、現状ネットワークで常時稼働が2台、他に数台が通常稼働。
となると、もう一台一台見て回るなんて現実的でなく、管理しきれない。

そこでメール通知機能があれば、とようやくその機能に気付いたのである。
https://crystalmark.info/ja/software/crystaldiskinfo/crystaldiskinfo-alert-mail/

遠隔地のHDDを監視し異常を検知しメール通知する
参考にしたのは違うところだったが、似たような内容なので良しとしよう(忘れた…)。

しばらく様子を見てみたが、交換した7200rpmのHDDが常時50℃越え。
しょっちゅう通知が来て、これはオオカミ少年的内容に…。
ケース用ファンを設置して、現在40℃で安定動作。
これで更にしばらく様子を見る予定。

HDDがまた…

何故か不具合って重なってしまうようで、前件の直後の出来事。
WHS引退で新しく立てたサーバ、それで使っていたHDDが不良クラスタ大量生産で一切のI/Oができなくなった。
完全なる破損である。
HDDの発熱がものすごかったので、もしかしたら物理的な接触が内部で起きていた可能性がある。

このHDD、USBのHDDケースに入れて動画保存用にしていた。
なので希にしか動かすことのないものだった。
それを今回、半年くらい前にサーバに抜擢。
この時点ですでに6年前のHDD。

サーバには他に、WHSでずっっと使ってきたHDDが一緒に乗っていて、それが五万時間。(crystal disk infoのよる)
今回のHDDは五千時間と、1/10。
運用時間と故障率の相関関係は相似ではないというのは本当のようだ。(どっかで聞いた)

さて、今回のHDDは完全沈黙の約三日前からcrystaldiskinfoにて不良セクタ増加「注意」を目にしていた。
WHSで使っていたHDDにも不良クラスタはあるが、生の値で8。
それとは比較にならないほど(千の位まであった希ガス)の不良を生んでいた。
そしてそれは二日目にさらに大量に増加、置き換え不良も乗じて大量増加。
三日目にようやくデータのレスキューを試みたが時すでに遅し。
とうとうドライブレターの表示のみを残し、容量表示など、その他プロパティを開くこともできなくなった。

どのPCも基本的にcrystal disk infoを入れて常駐している。
それはこういう事態に際してデータをレスキューできるようにするためである。
にもかかわらず失敗してしまったのは完全に自分の落ち度。
あー、役に立たないですなぁ、痛い経験。
大量ストックの音楽データが丸ごと消えた、あーぁ。

で、代わりに新しくHDDを入れたわけだが、これもまた同じくUSBなHDDで使ってきたもの。
しかも一年先輩である。
回転数が7600なので、転送速度は確実に速くなっている。
だがしかし…。

思い起こしてみれば、これまでの経験では3.5inchより2.5inchの方が故障が少ない。
所有する絶対数が少ないので確信しているわけではないがまぁいい。
次回新調するときは2.5にしよう。

HDD故障率のメーカー・モデル別統計データ2018年版、故障率が最も高かったのは?

東芝製HDDの故障率はゼロ、2019年第1四半期Backblaze調査

<2016/10/02追記>
5400rpmだったとばかり思っていたが、どうやら新旧両方7200rpmだった。
転送速度の違いは使用済みデータ容量による外内周の違いと思われる。


故障前のCDI。
この数字を見た時点で、いの一番スクショを取るんじゃなくてバックアップを取っておく、これが教訓。

外付けHDDの不具合

さぁーてと、H265の動画データを整理するか、と。
以前の消失を例として内蔵HDDだと損害が大きいので、外付けHDDにデータを移動してある。
もちろん、それだって万全の行為ではなく、ミラーリング、あるいはさらなるバックアップで冗長性を付与しておくのが最善とは思う。
だがしかし、容量が大きすぎで物量の関係でそれもなかなかに難しい。
いや、HDDを一個買えば済む話だし、H264から再エンコしたおかげでミラーリング可能な外付けHDDが一台空いたのだから可能だが、要はバランス。
無くなっても良いという覚悟で運用していた。

そのように想定していたのだが…。
実際にアクセスが不能となったときは本気で焦った。

USBコネクタに接続し、最初の数分は内部データにアクセスできた。
ところが、ポートの変更をしたそのタイミングで、以降「フォーマットしますか?」なんて聞かれる。
推測でしかないが、アクセス中にプラグアウトしたのが原因だったろうか。
OSで遮断してからプラグアウトする、それをしなかったのである。(ハードウェアの安全な取り外し)

まぁ原因はともかく、こうなった以上なんとかしてサルベージできないか検討するほかない。
or Not なのだ。

しかし、アクセスそのものができない。
よって、ドライブからの「プロパティ」→「ツール」→「ドライブのエラーチェック」ができない。
どのPCでも同じ、あるいはと思い、windows7なPCでも試したが結果は同じ。
延々とディスクアクセスができず、HDDアクセスランプが点滅したまま。

ならばと、HDDを取り出してマザボのSATAで接続し、PCを起動。
次には、起動途中のchkdsk(たぶん)でエラーが修復された。
これ、もしかしたらUSB接続のままでもいけたのかもしれない。
ツールの使用はできなかったが、ドライブレターは割り振られていたし、それならコマンドラインからなら、ntfsの修正ができていたのかも知れない。

もうそれを試すことができないが、もし万が一にも同じ状況になったときのために記しておくか。
そうならないことを願いつつ…。

ryzen3000に変える前に検証

もう二年前になるのか。
何かがどこかへの接触により、SSD、HDD、マザー、電源等の主要なパーツが吹っ飛んだ(非物理)事件により、丸ごと一式更新する羽目になったのは…。
その数日後に新調したintelマザーの更新と失敗(物理的)で、珍しくメインPCをintelで数年過ごすという希有な出来事はそこで終焉を見た。
立て続けに壊れるのは精神的にやられる…。

あれは確か、まだ出たばかりでご祝儀価格だったのだが、メインだけに背に腹は代えられず導入したryzen 1700とx370マザー。
それから2年。
私は、どうしてもAMDでないと駄目なようだ…。
そして、もう壊れるのはまっぴらだと、UEFIなどデフォルトで全く触らず、それどころか確認することもせずにこれまで過ごしてきた。

そんな折、最近のryzen3000シリーズが好評で好調。
メインを1700 → 3800Xに変更したいと考えるようになってきた。
最近のソフトならマルチスレッドがかなり結果に反映されるようになってきているが、それでもシングルでの演算のみというのも僅かばかりある。
そうなるとやはりintel有利か、と思いはするのだが、3800Xもかなり良さそうな雰囲気ではある。

だが、まだ少々お高い。
それなら1700で遊んでからでも悪くないか、と。
当時の情報。
「Ryzen 7 1700」は高コスパな8コアCPUとなりえるか?

早速OCして3.4GHzにしてみた。
そこここにあふれるOC記事通り、確かに簡単に動きはする。
1700がOCに使えるというのは事実らしい。
しかし、温度(発熱)がものすごい。
添付の純正CPUクーラーでは負荷がかかると10秒ちょっとで80℃越えしてしまう。
デフォルトクロックなら継続負荷でも70℃安定なのだが。

ここでかつてphenom世代に導入し、ほとんど使用しなかった水冷クーラーのことを思い出す。
当時、その評価としては、発熱に対してオーバースペックで、導入効果は排熱をケースの外に導くことぐらいだと理解したのを覚えている。
その時のコアが3~4コアだったのに対し、現在の1700は8コア(物理)。
これなら充分な効果が確認できると考えた。

のだが…。
当時のものは、AM4に対応していないらしい。

そこで将来的にも有用だろうと、新しい水冷を導入することにした。
Mercury120 RGB

エンコソフトhandbrakeでソフトウェア265を使用してエンコする私的ベンチ。
標準クロック3GHzなのをOCして、3.2GHz駆動。

これはUEFIを変更する前の、デフォルト状態でのスクショ。
3.2GHzのはずだが、core tempでは3GHz動作の表示。
どっちが正しいのか、不明。

18:32という変換時間。

次は水冷。

(この時、実は3.4にクロックアップを試し、再び設定上デフォルトに戻したのに、何故か3.4で回り続けていたので、何度かOCとデフォルトを繰り返して、その後3.2GHzで動作させている。それが何かしら、変化をもたらした可能性がある)

温度は明確に差が出て、20℃もの違いがあった。
純正クーラーでも3GHzなら70℃強だったことから、充分な冷却と言えそう。

それにしても、同じ映像を同じ設定で、なおかつ同じ周波数でエンコしているはずなのにこれだけ時間が違うというのは、やはり純正クーラーでも雰囲気温度によっては動作クロックは低く制御されていたという実証にならないだろうか。
つまりこれは「もしかしたら」の推測であるが、温度を指針として純正CPUクーラーだと断続的に3GHzに低下され、水冷だとOCの3.2GHzで、という監視を行っているのかもしれない。
もちろん、初回で全く検証していない状況なので正しい情報とは断言できないが、CPUクーラーの性能如何によっては目標の能力が見た目とは裏腹にこれまでは出ていなかった…、のかもしれない。

ともかく、これでryzen 3000を迎え入れる準備は整った。
さぁ、いつでも来い。
(なお、下調べが不十分で、3800Xに純正クーラーが付属しているかどうかの確認を怠っていた、というのが今回のそもそものオチ、なのである)

2700も気になったので、ついでに下記も参照。
“Precision Boost Overdrive”を最新BIOSから読み解いてみる

<追記>


3.6GHz(ベースクロックを103にOCして、後は倍率変更)で駆動状態。
水冷で温度は73℃で安定。


平均FPSが27-29-34と格段にアップしているし、時間も約15分。
実時間17分が元の動画なのでそれよりも若干速いということか。

thunderbirdの詐欺メール判定

メールソフトの定番ってなんだろう?
やはりwindowsなら標準のメールソフトなんだろうか。
無料メーラーを調べるとGmailが出てきた。
なるほど。
タブレットではGmailを利用しているし、PCでもweb版を利用していることを考えると、確かにその通りである。

が、昔から利用しているアカウントでは簡易的にではなく、thunderbirdをインストールして利用している。
サンダーバードより以前はEDmaxを使っていたような、薄い記憶が残っている。
text主体の方が何かしら問題のあるメールに対してはとても見やすいから。

以上のような考えから選んできたメールソフトであるが、thunderbirdに変更してからは、もうメールソフトに任せている。
そして今回、詐欺メールの判定でちょっと気になった。
今までもサーバ段階で迷惑メール対策をしてもなお、たまに詐欺メールが届くことがある。
今回の比較用の例として、
1.amazon

2.ゆうちょ銀行
の詐欺メールを出す。


1.
amazon「プライムの更新設定を解除うんぬん」の表題で、メール内で唯一のリンク「お支払い方法を変更」。


2.
ゆうちょ「送金の取扱内容うんぬん」の表題で、テキスト主体のメール内にあるリンクアドレス「jp-bank.japanpostうんぬん」。

thunderbirdではamazonの方はリモートコンテンツのブロックのみ。
他方のゆうちょの方は詐欺メールとして警告が出た。

リンク先を見ればすぐに詐欺メールだとわかるのだが、何より、どうしてこのような違いが生まれるのだろうかと、ふと気になった。

「このメッセージは詐欺メールの可能性があります」を防ぐ方法。
thunderbirdにある設定項目、「表示中のメッセージに詐欺メールの疑いがあるときに知らせる」を日本語で検索すると上記がでてきた。
オフィシャル解説はおそらく英文なのだろうが、めんどいのでこれで良し。

推測であるが、明確にURLが不一致の検出で警告を出し、表題とURLでは正誤の検討ができないからスルーされるって話。
だからまぁ、結局はそういう挙動なのだということを理解した上で、リンク先アドレスを見る癖をつける(自助努力)のが一番の対策なのだな。
Gmailならタブレットやスマホではリンクの長押しでリンク先が表示されるようなので、それ以外のアプリではどうなのか、自身で確認しておくのが次善の策か。

プリンタドライバ削除の方法

すでに持っていないプリンタードライバーの更新が何故かwindows updateに表示され、しかもアップデートに失敗し続けている。
困るような事態には遭遇していないが、とても気持ち悪いので削除したい。

ところが、削除の方法がわからない。
おかしい…。

そのものの記事ではないが、汎用で使える方法だったので下記をリンク。

Windows でプリンタ ドライバを手動でアンインストールする方法

windows + R(ボタン)

printui /s /t2

該当プリンターを削除

という流れ。

昔からこんな変な作業必要だったっけ?
まぁ綺麗になくなったのだから良しとする。

BIOSの更新でまた問題

メインPCではasrock のマザーを使っている。
Fatal1ty X370 Gaming K4

intelマザーが二枚立て続けに没してしまったための、やはりintelとは個人的相性に問題ありか、と急遽AMDで揃えたもの。
かれこれもう二年目らしい。
私とintelがどうもなじみが薄いのは、ちょいちょいこういう事故に見舞われるためか。
そこにきて、今回のryzen3000台がなかなかに好評のようなので、だったらAMD愛好者としては現状の1700をリプレースしようかと画策。

で、このマザーボード。
何の変更もせず、初期状態でずっと使ってきた。
ここで、BIOSのバージョンを上げておかないと新しいCPUをお迎えできないのである。

P3.5からP5.4へ。
とはいえ、一旦P5.1にしてからの更新、しかもAMDドライバーを更新したり、radeonを止めておく必要もあるらしい。
Nvidiaなのでグラフィックはスルーして、ドライバーは更新。
USBに5.1を展開して、BIOSのインスタントフラッシュを起動。
更新は2分くらいで完了。

問題はその後。
BIOSが立ち上がるよりも早く再起動を繰り返す。
USBの認識もしていない様子。
CMOSクリアも関係なし。
マザボ上のエラー表示は「4F」で、これが表示された時点で再起動がかかる。
延々と再起動。
…。

ネットで調べてみても4番台の解説は見当たらず。
もしかしたら更新で何か失敗したかも(大汗)。
intelの時の事故の記憶がよみがえる。
このマザーのBIOSの設定を何一つ触らなかったのは、あの時の壊れる恐怖がそうさせたわけで…。

とここで、メモリーでも外して見るか、と。
外せる物は外すというのがこの場合の対処の定石。

CPUから数えて2番目、A2ソケットのみメモリを残して起動。

すると…。

あっけなくBIOS画面へ。
そうか、メモリが原因だったか。

初期化で起動ドライブの設定がおかしいので、setupして、今度こそ起動。
一旦、windowsのライセンスが剥がれたが、すぐに復旧し、動作も問題なし。
まさか、BIOSの更新の前後でメモリーの問題が出るとはね。

その後、無事に5.4に更新完了。
久しぶりにすんごい焦った話、でした。

CPUクーラーの変更

前件続きの常時起動PC。
名前が長くて面倒くさいからサーバPCにしておきたいが、WHS2011から変更したソフトのバックアップ用ストレージであるネットワークPCが別にあるので、これも紛らわしくて駄目だな。
データサーバPCにしておくか。

前置き長し。
さて、このデータPC、intel純正のCPUクーラーを付けていた。
お手軽だし、たくさん余ってるし、薄いし軽いし、こんな風に何かに付け便利な立ち位置なのだが、エンコードさせていると結構うるさい。
マザーの回転数制御に寄るのだが、回転の上げ下げが割と頻繁でその変化がやたら耳に付く。
気にならないPC設置場所ではあるが、気になりだすとうるさいものである。

CPUの温度チェックをソフトウェアcoretempから実行してみると、何と70℃近くまで上昇している。
i3ってこんなに熱かったっけ?
gen7と古いからかも知れないが、余っている静かなクーラーは他にもある。
前件で分解したついでに交換することにした。

サイズのカブトも静かで良いのだが、何しろでかい。(リンク先より古いリビジョンのやつ)
冷却能力ではクーラーマスターのサイドフローの方がよく冷えるのはいつかの比較で承知していたし、その方がファンが静かになるのも当然。
メモリーを交換するかも知れないことを考慮して、取り付け面積が相対で小さいクーラーマスターに決定。

かなり静かになった。
室温は同じ、エンコード負荷と同じ条件で、交換後最大で53℃止まりだった。
純正の熱伝導グリスが不均一だったのかと裏返して見てみたが、しっかりついている。
今回のクーラーがたまたまうるさくて放熱効果が良くなかった、のかもしれない。
社外クーラーばかり使ってきたせいで、そもそも複数在庫があるのでどれが本来のクーラーかもわからないので、事情は他者と比べて厳密ではない。

それでもやはり、かなり静かになったことはありがたい事実である。

ここからは参照情報
夏を乗り切るi5-8400最適CPUクーラーはコレ
形状はもとより、どうやら番号も同じだし、純正クーラーはこれと同じ様子。
検証中の80℃という数字からしてまだ純正でも冷却が効きそうではある。
が、五月蠅さはやはりネックのようで、一方のサイドフローは60℃中盤で推移。
今回のPCはi3の2コアなのでその辺は良く冷却できているということか。