技業LOG
はじめに
サービスを使っていて、中の仕組みがブラックボックス過ぎて不安に思うことはありませんか?
今回、そんな不安を解消したく私が担当しているバックアップソリューションの中身の技術をお伝えできる範囲で紹介したいと思います。5分程度お付き合くださればと思います。
データ社会における電子データの活用方法と依存のリスク
~もし、全データが突然消えたら~
質問です。
もし、急に自分の仕事で使っているパソコンのHDDやファイル共有サーバーなど全て消えてしまったとしましょう。その状況で仕事を継続することができますか?
恐らく多くの方が、データを利用した働き方(Excel, メール..)で、かなり困ってしまうのではないでしょうか?
私の仕事の場合は電子データに完全に依存しており、仕事が完全に止まってしまいます。新しいパソコンが手に入ったとしてもパソコンの中にデータが無ければ以前と同じように業務が出来るようになるまで数か月はかかるかもしれません。
皆様もいかがでしょう?消えたその瞬間だけ困ってしまうのではなく、長い期間困ることになってしまいませんか?
電子データのロストは予期せぬタイミングで起きることが多いです。
- 自然災害(台風、地震、噴火等)
- 人為的なミス
- 機器故障
- テロ行為
自然災害に関しては、日本は世界と比較しても多いと言われており(M6以上の地震の2割は日本と言われています)、データのロストが起きる確率が高いと言えます。企業はそのような緊急事態が発生した場合でも事業を継続し、築き上げた顧客との信頼関係を守り、社員やその家族の生活を支える必要あります。
また、昨今、データ活用社会と言われるように、AI、IoT、ビッグデータなどを活用したビジネスが増えてきています。
今後、データ活用ビジネス自体が企業の収益の根幹を担い、そのビジネスが我々の日常生活に溶け込むことで、社会的にデータへの依存度が高くなることが想定されます。
そうなると、データロストのインパクトは個人の仕事だけに閉じた話ではなく、社会的なインパクトをもたらすような時代になるでしょう。
データロストの有効な対策とその現状
先ほども申し上げた通り、データロストによるダメージはデータの依存度と共に増え、タイミングも予測しにくいので、日常的に対策を講じておく必要があります。
データロストに有効な対策1つとしては、
「データのバックアップ(データ冗長化)を取っておく」
ことです。非常にシンプルで広く知られていることと思います。
バックアップの効果は大きく、バックアップがあることでゼロからのスタートではなく、数時間、数日前のチェックポイントからスタートでき、業務再開に数か月かかるようなダメージを数時間~数日のダメージに抑えることが出来ます。
ただし、「バックアップを取っておく」という言葉はシンプルですが実現するにあたって様々なことを考慮しなければなりません。
Ex).
- 何をバックアップしておけば良いか?
- どのくらい新鮮なデータが良いか?(世代管理など)
- どこにデータを保存しておけば安全なのか?(DRなど)
- 保存しておく機器はどうするのか? (性能など)
- 容量はどれくらい必要になるのか?
- どのような方式でバックアップを取るのか?(差分かフルバックアップか)
- 有事の際、同時アクセスの負荷はどれくらい来るのか?
- 何重にデータを保存しておけば安全なのか?
- バックアップ経路のセキュリティは大丈夫か?
- バックアップ先の設備のセキュリティは大丈夫か?
- 誰がデータやシステムを管理するのか?
- 機器を設置するラックはあるのか?
- 電源の冗長は取られているのか?
...
いかがでしょうか?データのバックアップを行うまでには専門のスキルやコスト(人件費、設備、運用etc)が必要となります。
結果、大規模な災害時の要件を満たさないバックアップ対策になっていたり、そもそもバックアップ対策自体を後回しにせざるを得ないというのが現状ではないでしょうか?
今回、そのような課題をお持ちの方に、お客さまがより安価で手軽にデータを未知の脅威から守ることが出来るよう、NTTPCが提供する「ネットワークストレージサービス(NSS)」を技術の観点から紹介し、その魅力をお伝えできればと思います。
NTTPCのネットワークストレージサービス(NSS)とは?
NTTPCが提供するNSSはNTTPCが長年のICTシステム運用で培ってきたノウハウを活かし、有事の際にもデータ消失などによりお客さまの業務が滞らないよう、データ保存に特化した小型サーバーの運用(監視、故障交換)とデータの管理をワンストップで提供するサービスです。
今回は、お客さまのデータをお預かりし保管する部分であるクラウドバックアップの中身を説明していきます。
バックアップ元の機器(NTTPCが提供する宅内設置型の小型サーバー)
オフィス・ステーション2 / Office Station 2
サーバー・ストレージ機器の販売からシステム開発などを行っているNTTPCが選定したエンタープライズ向けパーツを搭載した小型サーバー(RAIDなど機器内でデータの論理冗長が組まれている)
バックアップ先のシステム(NTTPCのシステム)
クラウドバックアップ
日本国内の堅牢な複数のデータセンターに立てたストレージ上にオフィス・ステーション2のデータをインターネット経由でセキュアに保存できるサービス。
システムは24時間365日モニタリングされ、専門のエンジニアが運用を行っており、拡張性や安全性の高い最新のアーキテクチャを採用
クラウドバックアップシステムの機能
クラウドバックアップシステムの機能を紹介します。
バックアップ・リストア
安全な場所に自動でバックアップが行われる
お客さまがスケジュールした時間帯に自動でシステムへ地理的に離れた複数の堅牢なデータセンターへお客さまがバックアップを意識することなく、自動で定期的なバックアップが行われます。
バックアップしておいたデータから復旧できる
災害等によりオフィス・ステーション2のデータがロストした場合でもバックアップしているデータから数時間~数日で復旧することが出来る。
- ※通信状況やデータの大きさによって変わります。
バックアップしておいたデータの中から欲しいものだけ取り出せる
お客さまポータル画面を提供しており、最後にバックアップを行ったデータを外出先などからWebブラウザを通してダウンロードすることが出来ます。
セキュリティ
データの暗号化
バックアップシステムに保存されているデータやバックアップ経路が暗号化されており、複合するための鍵を持っていない第三者がデータを読み取れない形式になっています。
お客さま毎の専用領域と個別のアクセスキー
お客さまの毎の専用領域が割り当てられており、そこに対して個別のアクセスキーが割り当てられているので、鍵を持っていない第3者からはデータにアクセス出来ないようになっています。
2度と使いまわしの出来ない個別のアクセスキー
個別に払い出されているアクセスキー自体が毎回リフレッシュされるので、2度と同じ鍵でアクセスすることが出来ずデータ漏洩するリスクが更に低くなっています。
クラウドバックアップでは、新たなストレージアーキテクチャを採用
なぜこのような機能が多彩な機能が提供出来ているのかと申しますと、クラウドバックアップシステムは「オブジェクトストレージ」という新しいストレージアーキテクチャを採用しているからです。
オブジェクトストレージというのは、階層構造を用いらずデータにIDなどの識別子を割り当てて、フラットな「オブジェクト」という単位で、ファイルシステムなどに依存せず大量のデータを管理できるようにしたストレージです。
また、オブジェクトストレージはSDS(Software-Defined※ Storage)の代表的な存在で、世の中にはたくさんのオブジェクトストレージソフトウェアがあります。
いずれにも言えるのは複数台の汎用サーバーをソフトウェアで抽象化し、機能を提供しているので、従来のストレージの機能限界や課題をソフトウェアでカバーするような構造となっているということです。
- ※ネットワーク、サーバー、ストレージなど、これまでハードウェアで行っていた処理をソフトウェアにオフロードすることによって、運用上の課題やビジネスの変化にソフトウェアの柔軟さを活かして対応出来るようにする考え方(SDxなどと言われています)
そのため採用するソフトウェアによって特長が様々あるのですが、その中でも共通したエンジニア視点でのメリット、デメリットについて触れていきたいと思います。
メリット
-
オブジェクトを複数ノードにレプリカ
分散ストレージとしての機能があり、保存したオブジェクトのレプリカを分散配置アルゴリズムによって複数の機器やDiskに配置することができ、データ冗長が出来る。
また、データの何を冗長にするかのパラメータなどを設定することでき、利用するデータの重要性によっては、データセンター単位などリージョン単位での故障に対応できる構成をとることも可能 -
オブジェクトの自己修復とアクセスできない時間の最小化
オブジェクトのチェックサムなどの情報を保持しておき、その情報を用いて、破損の検知や修復が自動で行われ、機器のダウンなどが発生した際は該当ノードへのアクセスを禁止しアクセス出来ない時間を最小限に止めつつ、オブジェクトの冗長度を保つためのリバランス処理が自動で行なえるなど、データを守りつつサービスを提供し続ける仕組みが備わっている -
その時の需要に応じた柔軟な設備運用が可能
従来のストレージだとアクセス数、ファイル数、データサイズの需要を予測し、将来を見据えたスペックのストレージを購入する必要があったため設備投資リスクが高かった。
一方、オブジェクトストレージは複数台の汎用サーバーをソフトウェアで抽象化することにより増設、減設(※)が容易に行えるため、その時の需要に応じた設備投資で済むため、そういったリスクを低減できる。※機器追加や故障時は、バックグラウンドでリバランス処理が行われるので、性能劣化を体感させないような機器選定やデータ配置設計が必須
-
アプリケーションと連携しやすくシンプルな構成が作れる
- データアクセス方法がシンプル
RESTful APIによるファイル単位でのアクセスができ、ファイルシステムやドライバを通すことなく、アプリケーションからデータのやり取りができる - カスタムメタデータを定義できる
オブジェクトはファイルに対する拡張情報をメタデータとして自由に定義できるので、ファイルに応じた個別の情報を管理するためのデータベースを使わずシンプルなシステムを実現でき、バグや故障などを軽減できる。
- データアクセス方法がシンプル
デメリット
-
小さいファイルの高速処理が苦手
書き込み時にはオブジェクトの分散配置処理やデータ破損チェック、読み出し時には取り出したオブジェクトが正しいのかのエラーチェックの処理など可用性、拡張性を維持するためのオーバーヘッドがあり、小さいファイルだと従来のストレージ技術(SAN, NAS...)より低速に感じてしまう -
リアルタイムに更新されるファイルを扱うのが苦手
ブロック単位ではなく、ファイル単位でやり取りが行われるため、ファイルの中身がリアルタイムで更新されるようなログデータやデータベースなどのデータだと処理効率が悪い。
また、分散ストレージとして機能を安定させるため、更新時の動きとして処理を行った後、アクセス先の切り替えを行うので、参照するタイミングによっては、更新前のデータが見える(結果整合性)。
以上、メリット、デメリットについて触れてみました。いかがでしたでしょうか? ゲーム、動画、音楽などのコンテンツ配信であったり、大容量で大量のデータ数を扱う必要がある場合など、最も優れたストレージアーキテクチャだと思います。
そして、今回、クラウドバックアップシステムに採用したことにより、
- 「災害や機器故障が起きてもデータを守ることが出来る」
- 「データ増えてもパフォーマンス劣化なく、心地よく使ってもらえる」
- 「NSSを手頃な価格で、誰にでも使ってもらえる」
- 「ストレージと連携する側の開発効率が良く、改善や機能追加を素早く行える」
...
といった様々な恩恵がありました。
また今後、従来のストレージよりも優れた拡張性と柔軟性を兼ね備えたオブジェクトストレージのニーズはより高まることが予想されます。
- 5G普及などネットワーク広帯域化に伴うコンテンツの大容量化
- IoTやAI普及に伴う学習データの大容量化
- リモートワークやオフショア開発の本格化に伴うインターネット経由でのセキュリティを考慮した重要データへのアクセス
...
こういったニーズが増えることでデベロッパーのコミュニティも活発になり、新機能の追加やデメリットだった部分の解消も行われていくでしょう。
もし、もっとオブジェクトストレージ深く知りたいという方は、オープンソース のCeph(RADOSGW), OpenStack Swiftなどがあるので倉庫で眠っているサーバーを見つけて一度Tryしてみてはいかがでしょうか?
- Ceph :
- OpenStack Swift :
おわりに
NTTPCのNSSの魅力は伝わりましたでしょうか?
オフィス・ステーション2とNSSをご利用になることによってお客さまご自身がシステム運用やデータ管理などを行う必要なく、災害や操作ミスなどからデータを守ることが出来ます。
もし、本記事を読んでデータの管理で心配な点があった方は、ぜひ、オフィス・ステーション2とNSSをご検討くださればと思います。
お読みくださり有難うございました。
技業LOG
この記事で紹介しているサービスは
こちら
Security BOSS® ネットワーク ストレージサービス
自動バックアップとリモート監視でデータ消失を回避。中小企業向けBCP対策