学ぶ

データ活用はDX成功の鍵!データの価値を最大化するためのデータ整備のポイント

データ活用

経済産業省のDXの定義では、「データとデジタル技術を活用して(中略)製品やサービス、ビジネスモデルを変革する」とされています。データを活用することはDXを実現する上で不可欠です。
みなさんも自社にあるデータを探したり、活用のためにデータを整備したりしているのではないでしょうか。

この記事では、IPAの「データの相互運用性向上のためのガイド」をもとに、人やコンピューターがデータを活用するために重要なこと、またデータを整備する上で、データの価値を最大化するポイントについて解説します。

データを連携して活用するために重要なこと

私たちの暮らしは、もはやデータと切り離すことができません。
SNS の投稿、店頭やネットでの決済記録、デバイスやウェブサーバー等に蓄積される行動ログ等のパーソナルデータ。
さらには、業務システムに記録される会計や製造データ、建物や道路、車やドローン、センサー等を介して製品や設備等から収集される環境や位置情報、各種オープンデータなど。枚挙にいとまがありません。

社会・経済活動の多くはデータとして記録され、活用されています。このように、データ駆動型のデジタル社会では、それぞれの組織が運用する情報システムを超えて、データが相互に運用されます。

しかし、データがありさえすれば相互に連携して運用できるかというとそうではありません。データを連携して活用するためには、そのデータを共有する関係者、つまり作った人と利用する人がそのデータの意味を共通に理解できる状態になければなりません。

民間イベントのデータと公共イベントのデータがそれぞれ作成されている状況において、両社が共通の語彙を利用して理解できれば容易にデータの結合が可能となり、データの価値は向上する。共通理解によるデータの価値向上

上の図の例では、民間イベントの「イベント名」と、公共のイベントの「名称」が同じものであることを利用者が認識できれば、さまざまなサービスとして二次利用でき、データの価値は上がります。
上記は民間と公共という異なる組織のデータの例ですが、一企業内の部署Aと部署Bのデータでも同じことが言えるでしょう。

経済産業省の「DX レポート」では

既存システムが老朽化・複雑化・ブラックボックス化する中では、データを十分に活用しきれず、新しいデジタル技術を導入したとしても、データの利活用・連携が限定的であるため、その効果も限定的となってしまう

という課題が指摘されています。

たとえば、企業内のシステムは、営業支援システム、顧客管理システム、会計システム等の業務システムに分散しており、それぞれがデータをもっています。通常の業務では処理ごとに必要なデータしか見ないため、他のシステムでの利用は考えられていません。つないで新たな価値を見出すという発想は生みづらく、企業内のデータを相互に運用することは簡単なことではありません。

しかし、DX時代のデータ活用経営においては、不可欠な取り組みです。
データを相互運用するために重要なこと、それはデータを共有する関係者が、そのデータの意味を共通理解できる状態でデータを作り、共有することです。

データ整備の3つのポイント

では、データの意味を共通理解できる状態にするためには、どのようなデータを作ればよいでしょうか。
ここでは、データの項目やデータの構造の整理について、3つのポイントを説明します。

データ項目を確認しよう

たとえば「仕入先」というデータセットには、どのような情報が含まれるでしょうか。

仕入先には10個のデータ項目が含まれていることを示す表。具体的には次の10個。ID、仕入先情報1、仕入先情報2、仕入先住所1、仕入先住所2、使用通貨、支払条件、担当部署、担当者情報1、担当者情報2仕入先に関するデータ項目の例

「仕入先」には、これらの10個の「データ項目」が含まれているとします。

データ項目の形式を整備しよう

仕入先のデータを扱う際には、仕入先1件の情報を1レコードという単位で扱います。このレコードの集合が、仕入先のデータセットです。

10個のデータ項目に対して定義をまとめている表。たとえば「ID」というデータ項目に対しては「仕入先を識別する5桁の整数」であることが定義されている。基本的なデータ項目定義書

人やコンピューターがデータを活用できるようにするためには、まずは「データ項目」に対して値の形式や意味を定義しなければなりません。これをまとめたものを「データ項目定義書」と呼びます。

意味構造を整理しよう

「データ項目定義書」で定義した型や桁数、単位に合致した「文法的に正しいデータ」を整備することが必要です。
しかし、「担当者情報」という項目だけでは、「仕入先の営業部門担当者」なのか、それとも「商品を発送する物流部門担当者」なのか、この情報の作成者以外の人は判断できません。

人とコンピューターがデータを活用するには、項目だけでなく「意味構造」も定義しなければなりません。意味構造を定義するためには、データ項目の分類と構造化が有効です。

「データ項目定義書」に意味構造を加えると、このようになります。
この定義の説明部分を読むことで「当社」独自の管理項目(赤字)、「仕入先」そのものに関わる項目(青字)、「仕入先」の「担当者」に関するサブ項目(緑字)に分類できます。

データ項目定義書を表形式で示した図。たとえば「ID」というデータ項目に対して、「必須かどうか」「説明」「形式」「記入例」の4つの意味を加味している。意味構造を加味したデータ項目定義書

データ項目の分類と構造についてツリー状に展開すると、各データ項目の意味構造が理解しやすくなります。

当社仕入先情報をツリー状に展開した図分類構造の展開

データ項目の定義書などが整備されていない場合や、ベンダーに丸投げしていて組織で一元的に管理されていない場合、データの相互運用が難しくなります。
画面や帳票の名称やデータ項目名の意味、入力される数値や文字などの書式が統一されていない場合も同じです。

認識違いによって不正確な情報が入力されてしまうと、業務処理が停滞したり、顧客に迷惑のかかるトラブルが発生するかもしれません。
データがもつ背景や正確性の判断材料を、関係者とコンピューターが共有できる工夫が、データを利活用するためには欠かせない取り組みなのです。

データの運用ルールと体制の2つのポイント

データを連携し活用していくためには、データ自体の整備だけでなく、データの運用環境も整備する必要があります。ここでは、データの運用ルールと体制の整備について、2つのポイントを説明します。

組織的なマネジメントが必要

データは組織的にマネジメントする必要がある。

法改正やルール変更、事業戦略やビジネスモデルが変化すれば、それを表すデータ構造やデータ項目も変わっていきます。
つねに変化し続けることを前提として、活用ニーズを汲みつつ、組織内でデータを一元管理することがデータの相互運用性の向上につながります。

そのためには、組織的なマネジメントを行う部署を整備することが望ましいでしょう。
この部署は、

  •  組織内でのオペレーション
  • データ構造やデータカタログを含むデータ資産の定義・設計開発、統合管理
  • データマネジメントを遂行する人材育成、教育研修

などを統括します。

具体的には、経営視点を交えて以下のような取り組みを推進します。

  • 各業務部門を統括する責任者に対し、扱っているデータの所在把握やデータに用いている用語の説明文などをまとめた辞書の組織横断的な整備についての協力を依頼
  • 所在把握や辞書整備における目標設定やスケジュール管理を行う業務部門参加型の共通の「場」や推進体制の設置
  • 整備したデータの所在や辞書などを管理するルールの策定とルールに則った維持管理の継続
  • データ作成や入力業務を担う現場の担当者を含め、組織全体に対するデータ教育研修の企画と実施
  • 対外的に開示できる定義情報や採用する標準を積極的に公開
  • データ連携を望む他の組織との協業検討の窓口
  • データ利活用を検討するコミュニティへの参画や円滑な活動に対する支援
  • データ品質を維持するためのオペレーション自動化の検討と実装

オペレーションを自動化しよう

データの入力や転記において、人手が介在するケースは多くあります。
みなさんの会社では、

  • FAX で受信した発注情報を見ながら、コンピューターに担当者がデータを入力する。
  • 他の情報システムから印刷出力された資料を参照しながら、データを再入力する。

といったことはないでしょうか。

これらは負担が大きいだけでなく、個人の習熟度や認識の違い、うっかりなどによるミスを招きやすくなります。
その結果、データ全体の品質や二次利用における信頼性の低下を引き起こす原因になります。

たとえば、こんなことが起きるかもしれません。

  • 姓名をローマ字転記する際にヘボン式と日本式が混在する。
    その結果、システムによる文法上のチェック機能では問題ないが、内容が不正確または不一致となることで、業務の遂行やサービスの提供で支障をきたす。
  • 値のないデータ項目が存在する。
    その結果、「ゼロ(0)」なのか「空白」なのかが曖昧で、データ分析などを行う場合に結果の信頼性が揺らぐ。

入力や転記などのオペレーションをできるだけ自動化することで、データの信頼性の低下を防ぐことができます。また、オペレーションの自動化の検討には、ペーパーレス化だけでなく、業務フロー全体の見直しが大切です。

データ活用するために、データの整備を意識して進めよう

DXの実現のためには、データ活用は不可欠です。
組織でデータを活用していくためには、データの整備や運用をきちんと行わなければなりません。この記事で説明したポイントを意識して、データの作成や整備を進めていきましょう。

また、ここで紹介したデータ整備やデータ運用環境のポイントはほんの一部です。
もっとくわしく知りたい方はIPAの「データの相互運用性向上のためのガイド」を読んでみましょう。データ資産の整備手法やデータ連携のしくみ、データ連携を行う際にどのように技術標準を取り込んでいくかなどの手順を紹介しています。

  • ホーム
  • 学ぶ 記事一覧
  • データ活用はDX成功の鍵!データの価値を最大化するためのデータ整備のポイント

concept『 学んで、知って、実践する 』

DX SQUAREは、デジタルトランスフォーメーションに取り組むみなさんのためのポータルサイトです。みなさんの「学びたい!」「知りたい!」「実践したい!」のために、さまざまな情報を発信しています。

DX SQUARE とは