データ分析基盤におけるメタデータの活用③ - ビジネス用語集とドメイン

 
重要:個人情報や機密情報の使用に関する注意喚起(必ずお読みください)
当検証で紹介している技術やサービスの使用は、読者の皆様自身の判断と責任で行ってください。特に、個人情報や機密情報を含むデータの取り扱いについては、最大限の注意を払い、適切なセキュリティ対策を講じることが不可欠です。
 検証や実際の利用を行う際には、常にプライバシー保護の法律、規制、およびベストプラクティスを遵守するよう心掛けてください。また、第三者のデータを使用する場合は、必要な同意を得ること、及びそのデータの使用が法律に準じていることを確認することが重要です。
 本ブログや筆者、所属する団体は、紹介する技術を用いて行われるいかなる活動から生じる直接的または間接的な損害に対して、責任を負いかねます。技術を使用することによって生じ得るリスクを理解し、自己の責任で慎重にご活用ください。
 本投稿に記載されている会社名やクラウド製品名は、各社の登録商標です。
 また、投稿内容は投稿日時点のものであり、変更される可能性があります。
 ご不明点や懸念がある場合は、クラウドベンダーや専門家に相談することをお勧めします。
 当検証の情報を活用することで、読者の皆様が新たな知識やスキルを安全に身に付け、ビジネスでの活用をすすめていただければ幸いです。
 
 前回の投稿「データ分析基盤におけるメタデータの活用② - インストール~Ingestion~Lineage」では、メタデータ管理ツール「DataHub」を例にとり、インストールからIngestion、Lineageまでの流れを説明しました。今回の投稿では、前回の検証で得られたデータベースの情報を整理・分類・活用するための、ビジネス用語集とドメインについて説明と検証を行います。

ビジネス用語集

ビジネス用語集とは

 
 ビジネス用語集(Business Glossary)は、企業内で使用される用語や定義の一貫性を確保するためのツールです。ビジネス用語集の管理には以下の機能が含まれます。
  1. 定義の標準化
      • 企業全体で使用される用語の定義を一元管理し、混乱を避けるための標準化された定義を提供します。
      • 例えば、「顧客」や「売上」といった基本的なビジネス用語の定義を明確にします。
  1. コンテキストの提供
      • 用語がどのように使用されるか、ビジネスプロセスやレポートにおける役割などのコンテキスト情報を提供します。
      • 各用語に関連するビジネスプロセス、メトリクス、またはKPI(主要業績評価指標)についての詳細を含めます。
  1. メタデータの管理
      • 各用語に関連するメタデータ(例えば、所有者、作成日、更新日、関連するデータセットなど)を管理します。
      • 用語の履歴やバージョン管理も含まれます。
  1. アクセスと権限
      • 用語集にアクセスできるユーザーや編集権限を管理します。
      • 特定のチームや役割に基づいてアクセス権限を設定することができます。
 

ビジネス用語集の管理例

 
 メタデータ管理ツールDataHubでは、上記の機能を保持した上で、以下のようなビジネス用語集の関連性を管理することが可能です。
ある企業の「顧客」というビジネス概念が、次のような関係性を持っていたとします。

Contains(「含む」)の関係

 「顧客」という大きなビジネス概念は、「個人顧客」「法人顧客」を含んで(Contains)います。また、個人顧客は、「個人顧客コード」「個人顧客名称」「居住都道府県コード」などの属性を含んで(Contains)います。「法人顧客」の配下にも同様に階層を持っています。
 例えば、あるビジネスユーザーが顧客属性別の売上分析を行うために、顧客がどのような属性を持っているか調べたいとします。その場合、検索キーワードで「顧客」と入力し検索します。
 この結果、顧客というビジネス用語には、「個人顧客」と「法人顧客」が含まれていることがわかります。
 また、ここから「個人顧客」を深掘りすると、「個人顧客」が持つ属性を表示することができます。
 このような経路を辿ることで、顧客の属性を見つけることができます。
 

Inherits(「継承」)の関係

 Containsのようなビジネス上の意味的な関わりの他に、属性を継承(Inherits)するような関連の定義も可能です。例えば、「生年月日」「創業年月日」「売上日」などの属性項目は、データ間に直接の意味的な関係はありませんが、「日」というビジネス用語の特性(西暦は4桁、月は2桁、日は2桁、区切り文字は"/"など)を継承することで、データの共通性と統一性を担保し、ユーザーの利便性を高めます。
 例えば、DataHubでは特定のビジネス用語の属性を継承しているビジネス用語を検索し、確認することが可能です。
ビジネス用語「日」を継承しているビジネス用語
ビジネス用語「日」を継承しているビジネス用語
 

ビジネス用語と実データの関連付け

 ビジネス用語の整理ができたら、実際のデータベースオブジェクトとの関連付けを行います。こうすることにより、ビジネスユーザーは、ビジネス用語集の検索を通じて、必要なデータベースオブジェクトにたどり着くことができます。

エンティティの関連付け

属性の関連付け

 

ドメイン

ドメインとは

 
 ドメイン(Domain)は、データカタログの中でデータを論理的に分類するためのフレームワークです。ドメインの考え方には以下の要素が含まれます。
  1. データの分類
      • データを論理的に分類し、関連するデータセットをグループ化します。
      • 例えば、顧客データ、財務データ、製品データなど、ビジネスの異なる領域ごとにドメインを設定します。
  1. 所有権と責任
      • 各ドメインにはデータの所有者(ドメインオーナー)や責任者を明確にします。
      • ドメインオーナーは、そのドメイン内のデータ品質やアクセス権限の管理を担当します。
  1. データガバナンスの強化
      • ドメインごとにデータガバナンスポリシーを設定し、データの使用方法やアクセスルールを明確にします。
      • コンプライアンスやセキュリティ要件に従ったデータ管理を実施します。
  1. コンテキストと関連性
      • 各ドメイン内でデータの意味や関連性を提供し、データの使用方法を明確にします。
      • ドメイン間の関係を定義し、データの相互参照を容易にします。
ビジネス用語集の管理とドメインの考え方を統合することで、企業全体でのデータの一貫性と利用効率を向上させることができます。これにより、データの発見、理解、使用が容易になり、データガバナンスとコンプライアンスの向上にも寄与します。
 

ドメインの管理例

 
 メタデータ管理ツールDataHubでは、ドメインを以下のように管理します。製造業の分析ドメインを例に、次のように分類・定義したとします。
製造業のドメイン定義例
製造業のドメイン定義例
 この中で 「020_在庫管理(Inventory Management)」「030_販売管理(Sales Management)」について、それぞれのドメインで下図のとおりエンティティ(テーブル)を管理するとします。
ドメインとエンティティの関係
ドメインとエンティティの関係
 DataHubでは、次のように管理されます。
ドメインの説明
ドメインの説明
ドメインとエンティティの関係
ドメインとエンティティの関係
 このように、ドメインを管理し、ドメインの単位でユーザーにアクセス権限を与えることで、ビジネスユーザーは、自身の業務に適合したデータやビジネスビューを容易に活用することが可能となります。

おわりに

 データマネジメントにおいてメタデータは非常に重要ですが、その有効性を最大限に引き出すためには、人間の関与が欠かせません。メタデータには、ビジネス用語の定義やドメインの分類といった要素が含まれます。これらの要素を適切に定義することで、データの発見、理解、管理の効率が大幅に向上します。しかし、ビジネス用語やドメインの定義は、技術的な作業ではなく、組織の業務知識やコンテキストを深く理解している人々の参加が必要です。専門家の知見を反映させることで、メタデータが実際の業務に即した形で機能し、データマネジメント全体の効果を高めることにつながります。