DMBOKとは?データマネジメントの基礎と実践方法を学ぶ

目次

DMBOKとデータマネジメント

DMBOKの定義と目的

DMBOK(ディンボック)とは、Data Management Body Of Knowledge(データマネジメント知識体系)の略で、データマネジメントに関する知識を体系立ててまとめた書籍です。

データマネジメントとその重要性

データマネジメントとは、「データをビジネス活用できる状態にすること」を意味します。単に「データを管理する」だけではなく、しっかりとビジネスに繋げていくことを意味するケースが多くなってきています。

具体的には、収集・登録・更新・管理・活用などデータをビジネスに活用するために必要な取り組み全般を指します。

適切なデータマネジメントによって、必要なデータに安心してアクセスできるようにすることで、経営の意思決定のスピードを早めることに繋がります。

また、近年データセキュリティの重要性が増しており、機密情報の漏洩やプライバシー侵害が企業の評判や法的責任を損なうリスクを招きます。データへのアクセス制御や監査ログの活用によって、セキュリティの強化を行っていきましょう。

DMBOKの11の知識領域

DMBOKではデータマネジメントを11の知識領域に分類しています。

データアーキテクチャ

データアーキテクチャとは、データ全体の設計図のことです。データとビジネスのつながりの俯瞰図とも言えます。
まずは、データの取得場所、保存場所、活用業務の3つを押さえ、データの洗い出しを行います。その後、データの種別を区別し、データがビジネス活用されるまでの全体のアーキテクチャ図を作成することで、シンプルなデータ構成を保つことができます。

データストレージとオペレーション

データベースの設計と実装、サポートを行うこと。
データの可用性(必要な時にデータにアクセスできる状態)・完全性(データが正確で最新である)・機密性(アクセス権限を持つ人のみがアクセスできる状態)を管理することでビジネス活用できる状態にすることが目的です。

データ統合と相互運用性

様々なデータの統合(データの形式を統一)と相互運用性(複数のシステムで利用可能)、つまりデータを使いやすい形にし、適切な場所に移動するプロセスのことです。

データをアプリケーションやシステム間で連携する際、抽出(Extract)・変換(Transform)・取込(Load)が行われ、それぞれの頭文字をとって「ETL」と呼びます。

データモデリングとデザイン

データの関連性を図を用いて可視化するプロセス。データレベルを3つのレベル(概念・論理・物理)で書き表す。

企業が保有するデータ量が増えてくると、それぞれのデータの関連性を各部署で把握できなくなってしまう。データモデルをメタデータとして保存し、参照できるようにすることでこのようなリスクを排除します。

参照データとマスターデータ管理

マスターデータは企業が活動をしていく上で必要な基本データのことです。具体的には、「従業員」や「顧客」、「商材」「拠点」などのデータが挙げられます。

ドキュメントとコンテンツ管理

画像や音声などの非構造データを適切に管理することです。データをビジネス活用していくためには、構造化データだけでなく、非構造データの管理にも目を向けることが重要です。

データセキュリティ

データセキュリティは、情報資産の機密性、完全性、および可用性を維持するためのポリシー、プロセス、および技術手法のことです。権限管理、データの分類、データ漏洩の防止、暗号化、監査ログの管理、データのバックアップやリカバリーなどの多くのプロセスを含みます。

データ品質

データの質の定義とその品質の評価と担保を行う。DMBOKにおいては、データ品質の項目として、正確性(データが正しい)・完全性(データが揃っている)・適時性(データが正しいタイミングで収集・利用されている)・一貫性(データに矛盾がない)・妥当性(データが正しい前提から導き出されている)の5つを定めています。

データウェアハウジングとビジネスインテリジェンス

データウェアハウスとは、企業内のさまざまなデータソースから取り込まれたデータを一元化し、統合された形で保存・管理するためのデータベースシステムです。

また、ビジネスインテリジェンス(BI)は、データウェアハウスのデータを分析・レポーティングが行えるツールのことを指します。

メタデータ

メタデータはデータのためのデータ、つまりデータの説明を指します。具体的には、ファイルのタイトルやデータサイズ、データ型などがあります。
また、メタデータにはビジネスメタデータ(用途、データの状態 etc)、テクニカルメタデータ(アクセス権限、物理データモデル)、オペレーショナルメタデータ(履歴など)の3つに分類することが出来ます。

データガバナンス

データマネジメントによる成果が最大化されるように、ルール設定や体制の構築を行う。

この記事を書いた人

AIに関する情報を分かりやすく発信していきます。G検定取得。日々、最新のテクノロジーへのキャッチアップやデータサイエンスの学習に奮闘中。

目次
閉じる