デジタルとアナログの違いとは? DXのキモはデータにあり
データ活用経済産業省によるDXの定義に、「データとデジタル技術を活用して」という言葉があります。デジタル技術よりも先に「データ」が置かれています。つまり、データの活用は、DXには欠かせないものです。
DXの取り組みにおいて、なぜデータが必要なのか。そもそもデータとは何か。
2023年3月までデジタル庁にてデータ戦略統括として従事し、2023年7月現在はIPA デジタル基盤センターのセンター長である平本健二とともに、「DXとデータ」について学んでいきます。
この記事は、2023年6月14日に開催した「DXまるわかり!30分ランチタイム勉強会 5thシーズン第1回」の対談の内容をまとめています。勉強会の情報は以下のページからご覧ください。
DXまるわかり!30分ランチタイム勉強会
対談者紹介
平本 健二(ひらもと けんじ) 独立行政法人情報処理推進機構(IPA) デジタル基盤センター長 大手SI会社、コンサルティング会社、デジタル庁データ戦略統括を経て現職 | |
五味 弘(ごみ ひろし) 独立行政法人情報処理推進機構(IPA) デジタル基盤センター 研究員 DXまるわかり!ランチタイム勉強会MC兼メイン講師 博士(工学) IPAではソフトウェア開発分析データ集や組込み動向調査を担当 |
DXにデータが必須な理由
五味:さっそくですけど、平本さん。ずばり、DXの肝心はなんだと思いますか。
平本:みなさんご存知のように、DXとは、デジタル技術を使ってトランスフォーメーションするということです。そのためには、絶対データが必要なわけですよね。
今、デジタル技術といえばスマートフォンでも何でも、機械がすごいのではない。その中で流れているデータがすごいってことです。そういう意味で、「肝心」というか、DXするのにデータは必須ですよね、というのがまずあります。
それともう1つは、今までのBPR(ビジネスプロセス・リエンジニアリング)だと、ちょっとした改善が多かったと思うんですよね。それに対して、DXというのは、データに着目することによって、根本的に業務を変えようというものです。今、そういうことができる時代になってきたのかなと思っています。
僕がよく話をするのが、たとえば「トラックの輸送を変えましょう」という話。
今までの延長線上だと、「経路探索をよくしたらいいんじゃない」となります。しかし、今やデジタル技術によって、トラックじゃなくてドローンで物が運べるようになったわけです。
そのドローンも凧あげのようにタコ糸で操作してるわけじゃなくて、データに基づいて遠くに飛ばしています。つまり、データが根本から変えてくれる。
そういう意味で、データはDXの肝心というか、鍵になってきてるのかなと思います。
五味:DXで変革することは目的ではなく、手段です。競争優位性を保つとか、継続的に収益を上げるとか、つまりお金儲けが目的になってくる。そこのキーとなるのがデータですね。
データって何?
五味:では、第2のセッションです。データとは何か。デジタルデータとアナログデータってどう違うの、というのをお話ししていきます。
平本さん、データはデータでもデジタルデータ、それからアナログデータ。色々なデータがあります。データとは何でしょうか。
平本:難しい質問をしてきますね。
アナログデータとデジタルデータの違い、僕は「照合できること」だと思っています。
みなさんが住民票を取り寄せたり、申請をするとき、今までは紙に自分の名前や住所を書いていました。
それも、一種のデータだったわけですよね。しかしこれはアナログだから、結局書いた人も手で書くし、見る人も目で見ます。だから、多少揺らいでいてもよかったんです。
たとえば、渡辺という苗字の「べ」の字ってたくさんあるんですよね。人が見れば一瞬でわかります。しかし、これをデジタルデータにした瞬間に、完全に一致していないとダメなわけです。
また、住所でも、「1丁目」を漢字で書く人もいれば、ハイフンでつなぐ人もいる。いろんな人がいます。
今までのアナログデータは、そんなブレや曖昧性を許容していました。なので、すごく自由に扱えたんです。
それがデジタルデータになると、すごく正確に扱われるようになります。その代わり、照合した時に100%合致していれば、もう自動でその次の手続きができる、という形ですね。
データというのは、全てのものを動かす原動力です。そのためには、正しいデータ、使えるデータじゃなければならない。なので、デジタル化して正確なデータを送ることが重要になってきてるのかなと思いますね。
五味:そうですね。みなさんの周りにも、アナログデータが山のようにあるはずです。それをデジタルデータ化していくのが、DXの最初の一歩じゃないかなと思います。
平本:はい。どの会社さんも、実はたくさんデータを持ってるんですよね。たとえば、タクシー会社さん。
運行データ以外にも、車の振動データを集めたらすごいデータになります。他にも、ワイパーの稼働データで雨の状況も調べられますね。
そういう意味で、みなさんが持っているデータをお金に換えていこうということになると思います。
「データは原油である」とか「データはアセット(資産)である」と言われます。しかも、気づかないうちに持っている資産なんですよね。使っていないだけで、埋蔵している資産でもあります。
それを少しひとひねりして味つけをすることによって、お金になることがあるんです。
なので、データきちんと揃えていくということは、とても重要なのかなと思いますね。
DXにおけるデータのありかた
五味:第3セッションのキーワードとして、「交換」、「ネットワーク」、「セキュリティ」を挙げました。そのうちの「交換」についてですが、「交換できるデータこそがデータだ」ということでいいでしょうか。
平本:うーん。交換できなくても、自分の中だけで使ってもデータではあります。
しかし、交換するとより一層いろんな価値が出てくるかな。
データって、組み合わせによって価値が出てくるといわれるんですよね。自分の持っているデータだけじゃなくて、他の会社が持ってるデータと組み合わせる、ということですね。
たとえば、街のデータと気象データを組み合わせるとか、災害データを組み合わせるとか。組み合わせると、いろんな価値が出てきます。組み合わせるためには、データを交換しなければいけません。
データって、今はスーパーマーケットに行けば売ってるものでもないでしょう。しかし、将来的にはそのようなマーケットもできてきます。自社が持っているデータと、他社が持っているデータ、また役所が出すデータなどを組み合わせて、ビジネスをどんどん作っていく世界になっていくのかなと思います。
データ品質の向上にはモデリング手法を
五味:データの「品質」についてはどうでしょう。
平本:データ品質は今、世界で一番ホットトピックになっています。
日本だとトラスト、つまり「信頼」という話が出ていますね。DFFT(Data Free Flow with Trust:信頼性のある自由なデータ流通)というものが掲げられています。
信頼できるデータ、ということは、相手が確かな品質の情報を出してくることが重要なわけですよね。
たとえばChatGPTも今すごく話題になっています。ああいったAIは、何かから学習して答えてくれるわけですけど、その学習データが間違っていると困っちゃうわけです。どのデータを学習してこのAIができているのか、とか。そういった話も含めて、データ品質に今すごく着目が集まっている。
ソフトウェア開発において、SQuaRE(スクエア:システム・ソフトウェア品質標準)という品質モデルがあります。そこでは、データベースを作るときの、データの品質管理プロセスや、データそのものの品質について標準化されています。
データの品質管理のプロセス、つまり誰がデータを作って、どこで誰が変換して、公開するところまで。そのプロセスごとに、どこで品質を担保するのかということですね。
さらに今は、ISO8000(データ・クオリティの国際標準化)みたいな形で、管理体制まで含めた品質というのが語られています。こういった標準に沿って、データをきちんと作ることが重要かなと思います。
五味:私もソフトウェアベンダー出身ですから、SQuaREというのは耳タコです。
しかし、SQuaREの話をすると、それよりも「お前がテーブルに入れてるデータ、これどこで使うんだ、無駄なデータじゃないのか」みたいな話が出てきます。
「いつかは使いますから今はどんどん集めます」と言って、とにかくありとあらゆるデータを集めると、結局10年ぐらい一度も使ったことがない、みたいなデータもあるわけです。「無駄なデータ」というのはどうなんでしょうか。
平本:今はストレージが安くなってきているので、無駄なデータもとりあえず集めてみるかと言って、集めちゃう人が結構いますね。
しかし、データって目的に従ってあるべきだと思うんです。「こういうことをやりたいから、このデータを集めてこよう」と、分解して考えないといけない。
また、これまではデータの設計をExcelみたいな表計算ソフトでしていたりするわけですよね。しかし、3人くらいが引き継いでくると、このデータをどうして入れてたんだっけ、消すとなにか問題が起こりそうだから消すのはやめよう、と言って、どんどん増えていっちゃったりするわけです。
僕たちは今、クラス図を使うことが多いんですけど、やっぱりモデリング手法をきちんと利用することが必要ですね。データの設計図をきちんと作って、それを維持管理できるようにすれば、無駄は結構減ると思います。合理的に構造化できますからね。
無駄の最たるものは、いろんなところで同じデータをたくさん持っていることなんですよ。
違うところで管理するから、同じ会社なのに社長名が違っているとか、問題が生じてくるわけですね。これはストレージの無駄でもあるし、サービスの品質が低下することにもなる。
データ品質を担保するには、マスタデータ管理などをきちんとやっていくのが必要かなと思ってます。
データの権利は誰にある?
五味:もう1つ、「データの著作権」が大事な問題として出てきます。データは誰の持ち物か、誰が権利を持っているのか、そこはいかがでしょう。
平本:これも難しい問題だと思うんですよね。むしろデータって、物体じゃないから著作権はないんじゃないかという話があって。
オーナーシップというか、コントローラビリティというか。自分がコントロールできることや、利用権が重要じゃないかという議論がされています。特に、コントローラビリティは非常に重視されていますね。
たとえば、僕が五味さんにあげたデータを「五味さんにだけあげます」と言っても、五味さんがコピーして誰かに配っちゃうかもしれないですよね。それに、五味さんが変換して誰かにあげちゃうかもしれない。
そういうことを考えると、データをコントロールできることが重要だ、ということで、今までの一般的な著作権とは違う考え方で整理しないといけないのかなと思っています。
まとめ
今回の記事では、「データとDX」についてお送りしました。「データはDXの肝心」です。
データを交換する。それによって価値が生まれます。また、組み合わせによって価値が増えるでしょう。
そして昨今、データの品質が大きなトピックになっています。正しいデータを作る。無駄なデータを作らない。そのためには、データモデルをきちんと使っていく必要がありますね。
IPAの「DXまるわかり!30分ランチタイム勉強会」は、2023年8月23日(水)までの原則毎週水曜日、12:00から12:30に開催しています。ラジオ感覚でお楽しみいただける勉強会です。
どなたさまもお気軽にご参加ください。
concept『 学んで、知って、実践する 』
DX SQUAREは、デジタルトランスフォーメーションに取り組むみなさんのためのポータルサイトです。みなさんの「学びたい!」「知りたい!」「実践したい!」のために、さまざまな情報を発信しています。
DX SQUARE とは