データ・コストを最小限に抑え、成長を促進するための11の方法

Alan Zeichick |コンテンツ・ストラテジスト| 2023年5月31日

ビジネスデータを有効に活用するためには、工場、オフィスの拡張、研究開発への投資と同様に、投資対効果(ROI)の計算が必要です。組織は、顧客、製品、取引、従業員、財務、経済状況、競合他社などに関するさまざまなデータがなければ事業運営ができません。こうしたデータは、組織が成長・発展する上で欠かせません。しかし、高品質なデータの取得、保存、管理、保護、分析にはコストがかかります。企業が保有するデータが多いほど、顧客へのサービス向上やパートナーとの連携が可能になりますが、一方で、データエコシステム全体にかかる時間や労力、リソースへの投資も増大します。企業は、このようにROIを意識してデータを運用することで、大きなメリットを得られます。

この記事では、データのROI(投資対効果)のうち特にコスト面に焦点を当て、データの取得・保存・保護・活用にかかるコストを管理し、最小限に抑える方法について解説します。

データコストとは

データコストとは、ビジネスデータの取得、維持、保護、活用にかかる費用のことを指します。これらのデータコストの多くは明確に把握できます。データ自体は、オンプレミスのハードドライブやストレージアレイ、あるいはクラウドストレージ(物理ハードドライブで構成)など、どこかに保存する必要があります。また、データを整理するためのソフトウェア、例えばコンテンツ管理システム、リレーショナルデータベース、データウェアハウスやデータレイクなどの仕組みが必要であり、これらには商用ライセンス費用や、オープンソース・ソリューションの場合はサブスクリプションやサポート契約費用が発生します。さらに、データのバックアップも必要となり、追加のストレージやバックアップ管理のためのソフトウェアが求められます。これにより、データ損失時の部分的なリカバリや物理的災害時の全面的な復旧に備えることができます。

サードパーティのプロバイダーからデータを取得する際には、ライセンス料やその他の費用が発生する場合もあります。また、業界や政府の規制、プライバシーへの配慮などに対応するため、セキュリティおよびアクセス制御の体制も必要です。さらに、データの有効性を確認したり、古い情報を修正するなどしてデータ品質を維持・向上させるためのコストも発生します。

データを最大限活用するためには、ユーザーインターフェースや分析、レポート作成用のソフトウェア、さらにはインサイト発見のためのディープラーニングやAIソフトウェアの導入といったコストも必要です。

最後に、パフォーマンスや拡張性を確保するためのコストも発生します。データがメガバイトからテラバイト、さらにはペタバイトに拡大すると、そのデータを維持・活用するためには、高度なソフトウェアや綿密な計画、場合によっては自動化ツール、そして大規模に保存・アクセスするためのハードウェアが必要となります。また、上述した各データコストごとに、企業はデータ管理ツールを運用・管理できるスキルを持った人材を雇用する必要があります。

主なポイント

  • データコスト削減プログラムを始める前に、自社が現在どのようなデータ資産を保有しているのか、そのデータがどのように利用されているのか、データが最も急速に増えている領域やボトルネックがどこにあるのかを把握することが重要です。
  • データコストを大きなIT予算に埋もれさせず、データ関連の支出項目を個別に抽出し、特に大きな(かつ増加の速い)費用がどこにあるのかを明確にしましょう。これにより、コスト削減に最も効果的な部分を特定できます。
  • 複数のデータベースやサービスを統合データベースに集約するなど、効率向上のための代替データアーキテクチャを検討しましょう。たとえば、分析や機械学習のワークロードをトランザクション・データベースと同じプラットフォームで実行することで、作業工程の短縮、インサイトの迅速化、コスト削減につながります。
  • クラウドベースのデータサービスを利用すれば、必要なパフォーマンス・自動化・セキュリティを担保しつつ、運用コストを削減することが可能です。

データコスト削減の基本

データコスト削減は、まず組織が保有するデータの種類を理解することから始まります。一部のデータはリレーショナル、つまり行と列で管理できるデータです。一方で、その他のデータは非構造化データであり、ドキュメント、画像、動画、バイナリファイルなどが含まれます。組織がどのようなデータ資産を持っているかを理解したら、次に考えるべきは、それらを最適な形式で保存する方法です。たとえば、リレーショナルデータベース、NoSQLデータベース、ドキュメントリポジトリなどが挙げられ、データベース統合の機会も検討できます。さらに、データの発生元や保存場所、どこでどのように使用されるのかも把握することが重要です。

組織が自社のデータとその最適な保存先を理解できたら、次のステップとして、すべてのデータソースと用途を網羅できる柔軟なデータアーキテクチャを導入し、データの取得、管理、保存、分析を最適化できる体制を構築します。このアーキテクチャの重要な要素の一つは、データの活用方針を決定する適切なデータガバナンスモデルの策定です。また、コストを最小限に抑えつつ、パフォーマンス、柔軟性、セキュリティ、有用性を最大化できるオンプレミスやクラウドのデータ管理システムの選定も重要です。これらすべての取り組みによって、組織はあらゆるデータの価値や用途を評価し、その価値を提供するためのコストを最小限に抑えるための適切な対応が可能となります。

データコストを最小限に抑える11の方法

現在どれほど多くのデータを保有していても、日々あるいは秒単位でさらに多くのデータが企業にもたらされています。その多くは、ビジネス運営や取引、顧客やパートナーへのサービス提供、経営判断の強化、財務報告、コンプライアンス遵守などに不可欠です。一方で、あまり価値のないデータも含まれている可能性があります。以下に、これらのデータの取得、変換、保存、保護、活用にかかるコストを削減する11の方法をご紹介します。これらの取り組みは、直接的な予算削減だけでなく、ビジネスの俊敏性や従業員の生産性向上など、間接的なコスト削減にもつながる場合があります。

1. データアーキテクチャの最新化

予想されるユースケースやデータ量に応じて、トランザクション・データベース、データウェアハウス、データレイク、機械学習ツールなど、最も適したデータ管理システムを選定しましょう。データやワークロードを少数のデータベースに集約することで、ソフトウェアライセンスやデータ管理のコストを削減できます。また、最適なデータストレージおよび管理技術を選択することで、システム統合・保守にかかる業務量を減らし、コストを削減できます。

2. クラウドへの移行

クラウドベースのデータ管理システムを活用することで、オンプレミスと比べて総コストを抑えつつ、スケーラビリティや運用性の向上、そして高い可用性・接続性・セキュリティ・管理サービスのメリットも得られます。クラウド環境では、インフラ管理にかかる人件費を削減できる可能性も高まります。

3. コストのかかるプロセスの自動化

データ管理の手作業によるプロセスは、拡張が難しく、人的ミスやポリシー適用のばらつきが発生しがちです。自律型データベースなどを活用したプロセス自動化により、予測可能な運用と強固なセキュリティを確保しつつ、人件費の削減も可能になります。

4. データガバナンスの確立

データガバナンス・ポリシーは、組織がどのようにデータを最適化・保護し、ビジネス運営のために活用するのかを定めるものです。強固なデータガバナンス・ポリシーにより、データの重複排除などのメリットが得られ、保存・バックアップ・分析が必要なデータ量も削減できます。

5. オープンソース・データベースの活用

主要なオープンソース・データベースを活用することで、多様な開発者コミュニティ、信頼性、さまざまな関連ツールやソフトウェアの利用、ソフトウェアを自由にカスタマイズできる柔軟性、そしてソフトウェア・ライセンス費用の削減といった多くのメリットが得られます。オープンソースの導入が総コストの削減につながるかどうかは、慎重な財務分析が必要です。オープンソース・ソフトウェアを基盤としたマネージドクラウドサービスを利用することで、これらの利点をさらに活用する選択肢が広がります。

6. データ分析への投資

日々の取引や業務運営にはデータが不可欠です。これは重要なスタート地点ですが、真の競争力は分析によってもたらされます。データ分析によって、トレンドの発見、運用コストの削減、売上の拡大、そしてカスタマーサービスの向上に役立つ新たなインサイトを得ることができます。これには、さまざまな大規模データストアからAIを活用してインサイトを抽出するビッグデータの取り組みも含まれる場合があります。ただし、データ分析はROI(投資対効果)の「リターン」を高める役割を果たしますが、分析ツールの導入など追加コストが発生するため、総データ管理コスト自体が削減されるとは限りません。

7. データのクレンジング

データのクレンジングは、業界標準や自社のルールに基づいて、データの行や列に含まれる誤りや不整合を修正する作業です。未加工のままのデータでもトランザクション処理には問題ない場合がありますが、データ分析をより正確かつ有用なものにするためには、クレンジングされたデータであることが重要です。さらに、データがクレンジングされていれば、分析の手間やコストも抑えられます。ただし、データのクレンジングによるコスト削減効果を過剰に評価しすぎないよう注意してください。実際に削除・整理されるデータ量はそれほど多くないことが多く、クレンジング自体にもコストがかかるため、この施策の主なメリットはコスト削減よりも分析精度の向上にあります。

8. ネットワークのアクティビティ監視

オンプレミスでもクラウドでも、ネットワーク・トラフィックの分析によって、効率的に運用されている部分や不要なボトルネックが発生している箇所を特定できます。利用状況やネットワーク・アクティビティを監視することで、構成変更によりパフォーマンスやユーザーの生産性向上が期待できる領域を特定できます。ネットワーク監視によって、データアクセスで過剰なコンピュートやストレージリソースが消費されているケースを発見し、より効率的でコスト削減につながるアーキテクチャへの改善余地を見つけることができます。

9. データリネージの管理

貴社で利用している最も重要なデータは、どこから取得されているのでしょうか?重要なデータが社内外のどこから、どのように流れてきているのかを分析し可視化することで、データガバナンスを最適化し、データをより効率的に活用できるようになります。特にビッグデータの場合はこれが重要になります。この取り組みも大幅なコスト削減にはつながりにくいですが、不要または十分に活用していないにも関わらず費用をかけている外部データの特定に役立ちます。

10. データサービスの外部委託

データアーキテクチャやサーバー、リソース、アプリケーションを自社で管理することもできますが、専門のサービスプロバイダーに委託することも可能です。これにより、複雑なデータ管理業務に煩わされることなく、本来のビジネスに集中できるうえ、効率化やリスク低減にもつながります。さらに、専門のサービスプロバイダーを利用したほうが、低コストな場合があります。こうした委託については、費用対効果の検証を行う価値があります。

11. データ利用状況の監視

部門によってデータ依存度は異なりますが、本当に重要なデータはどれでしょうか。そのデータはどのように、いつ、どこで活用されていますか。また、誰がそのデータを利用しているのでしょうか。これらの情報をもとに、テクノロジーリソースやデータ管理予算を最適に活用できるようにしましょう。

HeatWave: OLTP、レイクハウス分析、ML、GenAI

トランザクションとレイクハウス規模の分析向けに、自動化された統合生成AIと機械学習を1つのクラウド・サービスで利用する方法をご紹介します。

データコスト削減プログラムの作成方法

データコスト削減プログラムの目的は、より少ないコストで多くの価値を引き出すことにあります。つまり、管理コストを抑えつつ、データからより大きなビジネスインサイトや業務対応力を獲得することです。

インフォグラフィック:下記に概要を記載
データコスト削減プログラムに必要なステップには、プロジェクトオーナーの任命、データコストの可視化、予算の策定、成果の評価などがあります。

7 データコスト削減プログラムの7つのステップ

  1. プログラムオーナーの任命
  2. 現状のデータ支出を評価
  3. データコストの可視化
  4. データ予算の策定
  5. 最適なコスト削減施策の特定
  6. データ関係者との連携
  7. 成果の評価
  1. プログラムオーナーの任命:
    全体的な目標を見据え、正しいステップやマイルストーン、スケジュールに沿って進行できる責任者を任命しましょう。データコスト削減プロジェクトを優先課題として管理できるプログラムオーナーが必要となります。
  2. 現状のデータ支出を評価:
    データ支出やその用途について、詳細に把握しましょう。コストが一定している領域と、増加傾向にある領域を特定し、支出からどのような価値を得ているのかも明確にします。
  3. データコストを優先課題として位置づける:
    データコストをIT予算の中に埋もれさせないようにしましょう。実際のコストを正確に理解することで、コスト管理がしやすくなり、各部門もデータから得られる価値がコストに見合っているかどうかを判断しやすくなります。
  4. データ予算の策定:
    現在の支出状況や今後のコスト増加の見込みを把握できたら、総保有コスト(TCO)を基に今後の予算を決定しましょう。これにより、コスト削減目標が設定されます。
  5. コスト削減施策の特定:
    コスト削減にはさまざまな方法があります。データアーキテクチャの変更や分散データベースの統合、オープンソース技術の導入、クラウド移行、マネージドデータサービスの利用などが挙げられます。自社にとって最も効果的な戦略を見極めましょう。
  6. ステークホルダーごとのコスト削減効果を特定:
    どの部門やユーザーが、直接的または間接的にデータ関連コストを負担しているのかを把握します。各ステークホルダーと協力して、どの削減策が効果的か、またどのコスト削減がリスクが大きすぎるかを評価します。
  7. 成果の評価:
    当然のことと思われがちですが、「どれだけコスト削減できたのか?」といった問いに数値でしっかりと答えるためには、正確な集計と分析が必要になります。さらに「コストを削減しすぎた部分はどこか」「今後より投資すべき部分はどこか」といった点まで検証しましょう。

データ・コスト削減の例

多くの組織(大小)は、クラウドと最新のデータ・アーキテクチャを活用することで、データのコストを削減しています。

  • Pinnacle Teleservicesは、クライアントのコミュニケーションを改善し、オンライン・トランザクション処理と分析ワークロードを統合します。同社は、コストのかかる広範なハードウェア・メンテナンスと、複雑な抽出、変換、ロード(ETL)プロセスを排除し、毎日のトランザクションを最大10億件まで3X以上を管理しました。
  • ある学術的なテスト準備会社であるEstuda.comは、複雑なエンド・ユーザーの問合せを処理するためにクラウド内のより効果的なデータ・アーキテクチャに移行することで、データ・コストを85%削減するとともに、レスポンス時間を300倍に短縮しました。
  • 中小企業向けの契約入札プラットフォームを運営するLicitapymeは、コンバージド・クラウド・データベース・アーキテクチャに移行し、コストを74%削減すると同時に、Webページのロード時間を最大3Xに短縮することで、ユーザーがあきらめる可能性を低減しました。

Oracle HeatWaveでデータコストを削減

データは請求書処理や翻訳ログ、文書管理、部品カタログ、価格表、在庫管理など、あらゆるビジネス機能を支えています。これらの業務データをより効果的に活用することで、新たなビジネスチャンスが広がります。しかし、日々データは増加し続けており、それに伴いコストも増大しています。幸いにも、ビジネス成長や業務効率を維持・向上させながら、データのコストを最小限に抑える施策を講じることが可能です。

HeatWaveでは、トランザクションやレイクハウス規模の分析において、自動化・統合された生成AIおよび機械学習を一つのクラウドサービス上で活用できます。これにより、別々の分析用データベースやベクトル・データベース、機械学習サービス、ETLプロセスの導入・管理コストや複雑さを排除し、データストア間のデータ移動に伴う遅延やセキュリティリスクも避けられます。機械学習による自動化機能により、開発者やDBAは作業時間を大幅に削減し、さらなるパフォーマンス向上やコスト削減を実現できます。HeatWaveは、Oracle Cloud Infrastructure (OCI)、Amazon Web Services (AWS)、Microsoft Azure、さらにお客様のデータセンター(OCI Dedicated Region)でもご利用いただけます。

HeatWave Lakehouseの問合せパフォーマンスは、Amazon Redshiftよりも15X、DatabricksやSnowflakeよりも18X、Google BigQueryよりも35Xの方が高速です。また、コスト・パフォーマンスも大幅に優れています。急成長中の多くの組織が、パフォーマンス・拡張性・セキュリティ・生産性を向上させながら、HeatWaveを活用してデータ基盤のシンプル化とデータ管理コストの削減を実現しています。

データコスト削減に関するよくある質問

データセンターを閉鎖する際の最初のステップは何ですか。

データセンターの終了を計画する際には、アプリケーション、データ、サービス、ユーザー、セキュリティ要件について徹底的な調査を行います。既存のアプリケーションとデータをクラウドに「リフト・アンド・シフト」する場合も、新しいアプリケーションを選択する場合も、新しいアプリケーションを最初から構築する場合も、その調査のすべてに移行計画が必要になります。

データセンターの機器の寿命はどのくらいですか。

HVAC(暖房、換気、空調)システム、配電、 物理的セキュリティ・システムなど、データセンター・インフラストラクチャの主要部分は、定期的なメンテナンスにより10年以上使用することが可能です。サーバー、ルーター、スイッチ、ストレージなどのコンピューティング機器は、目安として3年から5年で陳腐化します。

クラウドのセキュリティについて責任を負うのは誰ですか。

サーバー、ネットワーク・インフラストラクチャなどのクラウド・インフラストラクチャの物理的セキュリティは、クラウド・プロバイダーが管理します。ソフトウェアとサービスの確保に関わる責任は、クラウド・サービス・プロバイダーと企業の間で共有されます。

データセンターの閉鎖にはどのくらいの時間がかかりますか。

データセンターの完全な閉鎖には、数か月かかるとお考えください。より大規模なITインフラストラクチャの場合は数年かかることもあります。これはすべて、データセンターの規模、複雑さ、データ量に異なります。その時間の多くは、徹底的な棚卸し、計画の策定、新しいソフトウェアの作成とテスト(必要となる場合)、トレーニングに費やされます。オフィスの移転と同様、すべての計画が完了すれば、実際の移行と終了自体は比較的短い期間で行われます。

エキスパートによる無料のワークショップをリクエストして、HeatWaveの評価や開始にお役立てください

生成AIの活用方法、機械学習モデルの構築、オブジェクト・ストレージのクエリ・データ、その他のご興味あるHeatWaveに関するトピックの詳細をご覧ください。