新しい会話を開始

未解決

1 Rookie

 • 

21 メッセージ

435

2022年8月28日 17:00

IsilonianTech 第24回 Search & Recover for PowerScale

いつも本ブログをご覧頂きましてありがとうございます。今回はSuperna社のSearch & Recoverについてご紹介いたします。
Search & Recoverは、ひとことで言うとPowerScaleに格納されている非構造化データに対して高速検索を提供するソフトウェアです。

PowerScaleは大量の非構造化データをシンプルに管理することを得意としている製品であるため、数十億ものファイルを格納されているケースが多く存在します。企業がイノベーションを成功させるためには蓄積したデータの活用や分析を迅速に行う必要がありますが、従来型の検索の仕組みではインデックス作成の観点からPowerScale上の数十億ものファイルを検索することは困難でした。
Search & Recoverは、ファイルのメタデータとコンテンツ(ファイル内のテキストデータ)をインデックス化し、ユーザに対して様々な視点での検索を提供します。また、日々蓄積されていく非構造化データに対して、PowerScaleのchangelist APIを用いて前回との差分を抽出してインデックスを再作成しますので、フルスキャンを行うことなく効率の良いインデックス化を実現しています。

title.png

      <コンテンツのインデックスはMicrosoft Officeファイルを中心に1000以上のファイルタイプに対応しています。>

Search & Recoverのユースケースは様々ですが、海外の製造業の事例ではPowerScaleに何百万枚もの画像を保存しており、以前はPCから特定の日付と場所に撮影された目的の画像を検索していました。画像ファイルの数が非常に多く検索に10時間以上かかるため夜間に検索を行い翌朝に結果を確認する運用をしていましたが、翌朝出社しても思うような検索結果が出ておらず再実行が必要になることも多々ありました。Search & Recoverの採用後はPowerScale上のすべての画像ファイルにファイル名、作成日時、更新日時などのインデックスを効率的に作成することができたため、現在では数分以内に結果を得ることが出来ているとのことです。

今回は、現時点(2022年8月26日)で最新版であるSearch & Recover 1.1.8(最小の4VM構成)とOneFS 9.4(シミュレータ)を構築してテストしました。Search & RecoverはPowerScaleに格納されているファイル数(メタデータやコンテンツのインデックスの量)によってSearch & RecoverのVMのスペックおよび台数が異なります。

 

 

 

1.検索機能(Search)

はじめに基本的な検索の機能についてご紹介します。Search & Recoverにログインするとインターネットの検索エンジンのような下記の画面が表示されます。中央にある検索ボックスに検索したい文字列を入力すると条件に該当したファイルの一覧が表示されます。なお、空白の状態で"Enter"キーを押すと全てのファイル一覧が表示されます。

sr001.png

 

 

 

1.1メタデータおよびコンテンツのインデックス検索

ファイルのメタデータを条件にして検索を行う場合は、検索ボックスの右側にある「∨」アイコンをクリックすると下記のようなメタデータの条件を入力する画面がポップアップします。ファイル名やコンテンツ、ファイルサイズ、各種タイムスタンプなどを条件で指定してファイルを検索することができます。

sr000.png

他の製品には無い特長を1つ挙げると、Search & RecoverではCloudPoolsによってECSやパブリッククラウドへアーカイブされたファイルの状態(SmartLinkedか否か)をメタデータとして保持しているため、ファイルがPowerScale内に存在しているかCloudPools先のストレージにアーカイブされているかを判断することができます。「Cloudpool Status: Archived」にチェックを入れて検索することによりアーカイブ済みのファイルの検索や一覧を表示することが可能です。
また、ファイルだけでなくフォルダも検索対象となりますので条件を指定して該当のフォルダを特定したり、PowerScaleに存在する全てのフォルダの一覧を表示することもできます。さらに、Search & Recoverは自動タグ付けにも対応しております。定義した条件でタグが自動的に付与されたファイルは「Classification」から該当のタグを指定することによりファイルを検索することができます。

 

下記は、ファイル名に"onefs"を含んでいる"5MB以下"の"PDF"ファイルを検索した例です。検索は非常に高速で1秒かからずに表示されます。ファイルを選択して右クリックすることによりファイルのパスのコピーやメタデータの詳細情報を表示することができます。

rslt01.png

 

 

1.2 ユーザ単位のアクセス制御

PowerScaleにアクセス権のあるWindows Active Directoryのユーザは、Search & Recoverはログオンすることができます。その際、ログインしたユーザの共有権限に従いアクセス権のあるファイルのみが検索対象となりますのでユーザに権限のないファイルが表示される心配はありません。

下記はyasui(yasui@coffee.local)でログインして全ファイルを検索した際のスクリーンショットですが、検索の結果1348個のファイルがヒットしました。

sr02y.png

一方、user1(user1@coffee.local)でログインして全ファイルを検索すると、下記のとおり結果は1090個とyasuiと比べて少ないのが確認できます。(user1はyasuiに比べてアクセス可能な共有が限定されています。)

sr02u.png

 

 

 

2.ファイル復旧機能(Recover)

続いて、Search & Recoverの"Recover"部分のご紹介となります。Search & RecoverではPowerScaleのスナップショットをインデックス化することで、ユーザにスナップショットデータの検索とファイルの復旧を提供します。PowerScaleは標準でWindowsのVSSと連携できますので、探しているファイルのパス(親フォルダ)がわかれば"以前のバージョン"から当たりを付けて復旧することも可能ですが、Search & Recoverのファイル復旧機能は保存していたファイルのパスがわからない場合や、ユーザからの問い合わせ(幾つかのキーワード)を頼りに管理者が復旧する際に便利です。ユーザや管理者はSearch & Recoverの画面から直接ファイルを復旧することができます。

スナップショットから検索する場合は「Search Previous Versions」にチェックを入れます。あとは先程(1.1 メタデータおよびコンテンツのインデックス検索)と同様に検索条件を入力して該当のファイルを探します。今回は、"h18808-cp-uds-cyber-protection-recovery-bdm-deck.pptx"をスナップショットから検索して復旧してみます。

下記のとおり、メタデータの検索画面に"Search Previous Versions"、ファイル名に"cyber"、拡張子に"pptx"を指定して検索したところ幾つかファイルが表示されましたので、該当ファイルを右クリックして「Recover File」を選択します。

rcv001.png

 

スナップショット内からファイルを復旧する旨のメッセージが表示されますので、内容を確認後「Recover」を選択します。

rcv002.png

 

「Recover」を選択して少し待つと復旧が完了します。復旧が完了すると下記のように"Success"の表示とともに該当ファイルが復旧されたことが確認できます。下記のメッセージに記載がありますが、復旧されたファイル名は[igls-restored]という接頭辞と[スナップショット名(今回は、20220826_Snapshot_test2)]が元のファイル名に追加されます。よって、今回は"igls-restored-20220826_Snapshot_test2-h18808-cp-uds-cyber-protection-recovery-bdm-deck.pptx"というファイル名で元の場所に復旧されました。

rcv003.png

 

 

 

3.レポート機能(Quick Report)

Search & Recoverは収集したメタデータの情報をもとに各種レポートを生成することが可能です。また、レポートを生成する際は先程(1.1 メタデータおよびコンテンツのインデックス検索)と同様にメタデータを条件にすることが可能です。主なレポートをスクリーンショットとともに紹介します。

 

3.1 誰がどのくらいファイルを所有しているのか?(Who owns what?)

ユーザごとに所有するファイル数や容量をレポートします。例えば直近でストレージが急激に消費された際に、どのユーザが大量にファイルを生成(ストレージの容量を消費)したか検索条件にパスや期間を指定することによって細かく確認することができます。

rpt01.png

 

3.2 ファイル種別による表示(Show me the types!)

ファイル種別(拡張子)ごとにファイル数と容量をレポートします。ファイル種別から不要な拡張子(業務とは関係無い拡張子や、現在使用されていない古いアプリケーションの拡張子など)を探したり、SmartPoolsやCloudPoolsによるアーカイブ化の検討材料になります。

rpt02.png

 

3.3 ファイルの経過時間の表示(What's growing old?)

各種タイムスタンプやファイルサイズなどを指定してファイルの経過時間やファイル数、容量が確認できます。デフォルトは月ごとのレポートとなりますが、週や日ごとのレポート生成も可能です。

rpt04.png

 

3.4 ファイルプールの容量表示(What's in the file pools?)

ファイルプール毎にどのくらいのファイル数、容量が存在しているか確認できます。ECSやパブリッククラウドにアーカイブしたファイル数や容量の確認も可能です。

rpt05.png

 

 

 

さいごに

今回はSearch & Recoverについてご紹介いたしました。Search & Recoverで非構造化データが秘めている可能性を引き出し、皆様のデータの価値の最大化に少しでもお役に立てれば幸いです。

 

 

 

 バックナンバー

IsilonianTech 第1回 Isilonとオープンソース ~REX-Ray編~

IsilonianTech 第2回 Isilonとオープンソース ~OpenStack Manila編~

IsilonianTech 第3回 Isilonとオープンソース ~Isilon Data Insights Connector~

IsilonianTech 第4回 Software Defined Storage ~IsilonSD Edge~

IsilonianTech 第5回 Isilonとオープンソース ~Isilon-POSH~

IsilonianTech 第6回 Isilonとオープンソース ~Elastic Stack編~

IsilonianTech 第7回 Isilonとデータアナリティクス ~Cloudera編~

IsilonianTech 第8回 Elastic Cloud Storage (ECS) ~ECS Community Edition~

IsilonianTech 第9回 ISILON + ECS = UNLIMITED ~Isilon CloudPools~

IsilonianTech 第10回 Isilonとデータアナリティクス ~Isilon Ambari Management Pack~

IsilonianTech 第11回 OneFS 8.2リリース!

IsilonianTech 第12回 データファーストを支援するソフトウェア ~DataIQ~

IsilonianTech 第13回 vRealize Orchestratorプラグイン

IsilonianTech 第14回 超簡単!ファイルサーバ アセスメント ~Live Optics Dossier~

IsilonianTech 第15回 DataIQ プラグイン作成講座 ~概要編~

IsilonianTech 第16回 PowerScaleとデータアナリティクス ~CDP編~

IsilonianTech 第17回 DataIQ API操作講座 ~概要編~

IsilonianTech 第18回 PowerScaleとサイバーセキュリティ ~Ransomware Defender編~

IsilonianTech 第19回 PowerScaleとサイバーセキュリティ ~CAVA編~

IsilonianTech 第20回 DR Manager for PowerScale

IsilonianTech 第21回 Easy Auditor for PowerScale

IsilonianTech 第22回 Performance Auditor for PowerScale

IsilonianTech 第23回 Golden Copy for PowerScale

 

 

 

安井 謙治
Dell Technologies│Unstructured Data Solutions
デル・テクノロジーズ株式会社 UDS事業本部 SE部

レスポンスがありません。
イベントは見つかりませんでした!

Top