2020年6月30日
本コラムは、アジアにおけるデータ流通・活用をテーマに連載してきた。前編では、スマートシティーの動向として、シンガポールの事例を紹介した。中編では、個人データの流通・活用に関する動向として、インドにおけるIndia Stack(インド版マイナンバーをベースにした個人認証、オンライン決済、文書共有等のプラットフォーム)およびAccount Aggregator(個人の金融データの共有サービス事業者)を紹介した。
連載の最終回となる本稿では、ビッグデータの流通に焦点を当てる。コンピューターの処理能力向上と価格低下によって、生成・活用が容易となったビッグデータは、ビジネスの現場でも日常的に使われるようになった。例えば製造分野では、工場のさまざまな設備に設置したセンサーからデータが収集され、設備の故障予兆の検知や製造の予実管理に利用されている。また教育分野では、生徒の学習履歴を収集・活用し、カリキュラムを生徒一人一人に適したものにカスタマイズするサービスも生まれている。このような中、自前のデータを活用するだけではなく、第三者から取得したデータを活用することで、新たな価値を得ようという動きが活発になっている。例えば、通信キャリアのエリア別、時間別、属性別の人口統計データを購入し、商圏分析や観光客分析などに活用する事業者もいる。今やデータは売買する価値のある商品となっており、その売買を仲介するデータ取引市場をビジネスとして手掛ける企業も現れ始めている。
このようなビッグデータの流通や取引において、我が国に先行しているのが中国や韓国である。中国では、既に10カ所以上のデータ取引市場が開設されており、韓国では、さまざまな分野のデータを提供する官民協働のプラットフォーム(以下PF)が立ち上がり、事業を確立している。これらの先行する取り組みを学ぶことは、我が国のデータ流通を進展させる糧となる。そこで本稿では、これらの国々におけるビッグデータ流通に関する動向を紹介する。2章は中国の動向として、政府の後押しの下、設立が相次ぐビッグデータ取引PFを紹介する。3章は韓国の動向として、整備が進められている分野別のビッグデータPFを紹介する。
中国では2014年からビッグデータ推進政策が本格化してきた。具体的には2014年3月の「政府工作報告」において、政府文書に初めて「ビッグデータ」という用語が登場し、未来の産業発展に向けてビッグデータ等を注力領域に据えることが示された。その後、2015年9月に国務院が公表した「ビッグデータの発展促進に関する行動要綱」において、多様な分野でビッグデータを応用していくことなどが規定された。そして2015年10月に中国共産党中央委員会 第5回全体会議(五中全会)で草案が承認された「第13次5ヵ年計画」において、ビッグデータが初めて国家戦略に加えられた。これを受け、2016年1月の「ビッグデータ発展の重大なプロジェクトの実施・促進に関する通知」において、ビッグデータ取引PFの設立に対して、政府が重点的に支援することが表明された(図表 1)。
図表 1:中国のビッグデータ推進政策の変遷
このような政府の積極的な後押しもあり、中国ではビッグデータの取引PFがいくつも立ち上がっている。本章では中国で運営されているビッグデータ取引PFを概説した上で、特徴的なものを紹介する。
中国では2001年ごろからビッグデータの取引ができるPFが登場し始め、2020年3月時点で10を超えるPFが運営されている(図表 2参照)。
No | ビッグデータ取引PF | 運営組織 | 設立時期 | データセット数※1 |
---|---|---|---|---|
1 | www.markwaymall.com | 上海天津情報技術社 | 2001年 | 15,732 |
2 | 阿里云 云市场 (Alibaba Cloud Market) | アリババクラウド社 | 2009年9月 | 991 |
3 | Datatang | Datatang社 | 2011年9月 | 222 |
4 | Global Big Data Exchage (GBDEx) | 貴陽ビッグデータ取引所 | 2014年12月 | 3,689 |
5 | Donghu Big Data | 武漢東湖ビッグデータ取引センター | 2015年7月 | 150 |
6 | www.finndy.com | 上海連元情報技術社 | 2015年9月 | 20,273 |
7 | Jiangsu Big Data Exchange (BDEX) | 東中国江蘇省ビッグデータ取引センター | 2015年11月 | 14 |
8 | Youe Data | 国信优易データ社 | 2015年12月 | 6,391 |
9 | Shanghai Data Exchange Corp. | 上海データ取引センター | 2016年4月 | (非公表) |
10 | BDG Store | 九次方ビッグデータ情報グループ社 | 2016年11月 | (非公表) |
11 | Qingdao Big Data Exchange | 青島ビッグデータ取引センター | 2017年 | 300 |
12 | wx.jdcloud.com | JD Cloud & AI社 | (非公表) | 2,004 |
13 | 大海洋 | 安徽数洋テクノロジー社 | (非公表) | 475 |
図表 2に示すPFは、企業登記や裁判の判決記録等のストックデータのほか、気象の観測値や船舶の位置等のリアルタイムなフローデータの販売や売買仲介を主に行っている。またPFの中には、利用者が電話番号を入力すると、その電話番号の持ち主の年齢層やブラックリストの掲載有無等を返答するような形でデータを販売するものもある。さらに、一部のPFではデータの販売や売買仲介だけでなく、以下のようなサービスを提供している。
次節では図表 2に示したPFの中から、AI(Artificial Intelligence)の教師データ(AIの学習に用いる正解となるデータ)に特化してデータ販売や関連サービスの提供を行っており、他のPFと比べて特色があるDatatangについて紹介する。
Datatangは顧客のAIの開発を支援するため、以下のサービスを提供している。
「①AIの教師データの販売」では、自動運転や警備、モバイルアプリケーション、スマートホーム、消費者向けチャットボット、機械翻訳等で使用されるAIの開発に必要な教師データを販売している。販売されるデータは音声データ、画像データ、テキストデータの3種類となっている。例えば自動運転の分野では、ドライバーが音声でコミュニケーションを取れるAIの開発を支援すべく、以下のようなデータが販売されている(図表 3参照)。
No | 販売データの例 | データの活用例 |
---|---|---|
1 | 車内での標準中国語の発話データ(テキスト等のアノテーション付き) | 音声認識、声紋認識、機械翻訳AIの学習 |
2 | ロケーションやスケジュール、To doに関する中国語のテキストデータ | 自然言語処理AIの学習 |
3 | 車内のノイズデータ(車両モデル、走行環境(天気、路面)、エアコンの動作有無のアノテーション付き) | ノイズキャンセリングのためのノイズのモデリング |
また、外部環境を正確に認識し、適切に走行できる自動運転AIの開発を支援するため、以下のようなデータが販売されている(図表 4参照)。
No | 販売データの例 | データの活用例 |
---|---|---|
1 | 北京の主要道路における車上カメラの画像データ(自動車、人体、標識のアノテーション付き) | 自動車、人体、標識を検知するAIの学習 |
2 | 中国の都市や地方の道路における車載カメラの画像データ(道路、通行人、車両、信号機、標識のアノテーション付き) | 道路の識別や通行人、車両、信号機、標識を検知するAIの学習 |
「②AIの教師データの収集代行」では、50以上の国や地域にいる約150万人のクラウドソースワーカーから顧客の求めるデータを収集し、アノテーションを付与した上で提供している。例えば、顧客は以下のようなデータの収集代行を依頼することができる(図表 6参照)。
No | 区分 | データの例 |
---|---|---|
1 | 音声データ | シーン別の会話、地域別のアクセントがついた英語の会話、方言の会話 |
2 | 画像データ | 動物、ジェスチャー、OCRの認識結果 |
3 | 3Dデータ | 3Dの人の顔、3Dの人の動作、3Dのジェスチャー |
4 | 映像データ | 道路、家庭内の様子、人の動作 |
5 | テキストデータ | コーパス、Q&A |
「③顧客のデータに対するアノテーション付与」では、顧客の持つ音声、映像、画像データにアノテーションを付与している。具体的には、それぞれ以下のようなアノテーションの付与が可能である(図表 7参照)。
No | 区分 | アノテーションの例 |
---|---|---|
1 | 音声データ | 会話音声を書き起こした文字 |
2 | 画像データ |
|
3 | 映像データ |
|
Datatang社は2011年9月の創業後、国内外における1,000以上のAI開発企業や研究機関にサービスを提供している。Datatang社は本社のある北京に加え、南京、貴陽、安徽、雄安、保定に拠点を有しているほか、カリフォルニア(米国)にも拠点を設けている。
データ取引市場の黎明期にある我が国は、5~10年の間、ビッグデータの取引を生業にしたサービスを展開してきた中国から、その取り組みを概観しただけでも以下のことを学ぶことができる。
特に世界中にクラウドソースワーカーを抱えるプラットフォーマーに成長したDatatangは、さまざまな国の言語での発話データや道路等の景色の画像データを、顧客の要望に応じて収集・提供する仕組みを築き上げている。我が国においても、既存のデータを流通させるだけでなく、用途に応じて必要なデータを生成・提供することがビジネスチャンスになると考えられる。
韓国では、科学技術情報通信部が分野別にビッグデータPFを構築する事業を2019年から推進している。当事業は新しいデータ活用サービスの創出を促すことを目的に、データを収集・加工・提供するビッグデータPFを官民が連携して整備するものである。科学技術情報通信部は2019~2021年の3年間で1,516億ウォン(≒133億円※2)を投じて、10の分野別ビッグデータPFを構築するとしている。本章ではこれらの分野別ビッグデータPFを概説した上で、その中でも特徴的なものを紹介する。
韓国では科学技術情報通信部の「ビッグデータプラットフォームとセンター構築事業」として、図表 8に示す分野別ビッグデータPFが整備されている。当事業では、ビッグデータPFの構築と併せて、PFにデータを提供するデータセンターの整備も行うとされている。
No | 分野 | PF名 | PF構築の 主管組織 |
データ 提供用 データ センター数 |
データ セット数※3 |
---|---|---|---|---|---|
1 | 金融 | Financial Big Data Platform (FBDP) | BCカード社 | 7 | 140 |
2 | 環境 | envbigdata | 韓国水資源公社 | 9 | 384 |
3 | 文化・メディア | BigData MarketC | 韓国文化情報院 | 10 | 770 |
4 | 交通 | DIAMOND-E Big Data Platform | DIAMOND-E Consortium | 8 | 568 |
5 | ヘルスケア | Clinical Oncology Network for uNifying Electronic mediCal daTa (CONNECT) | 国立がんセンター | 5 | (非公表) |
6 | 流通・物流 | Korea Data Exchange (KDX) | 毎日放送社 | 10 | 7,955 |
7 | 通信 | KT Big Data Platform | KT社 | 15 | (非公表) |
8 | 中小企業 | WEHAGOデータ流通ポータル | DOUZONE社 | 8 | (非公表) |
9 | 地域経済 | 京畿地域経済ポータル | 京畿道庁 | 9 | (非公表) |
10 | 森林 | Forest Big Data Exchange | 韓国林業振興院 | 8 | 463 |
各PFでは行政機関や民間企業の持つデータが有償/無償で提供されている。またPFの中には、データの可視化サービスやデータの分析ツール、データ活用に係る問題解決や技術提供が可能な専門人材をマッチングするサービス等を提供するものもある。
次節では、取り扱うデータセット数を公表しているPFの中から、その数が群を抜いて多かったKorea Data Exchange (KDX)について紹介する。
韓国の小売企業等が保有する流通・消費データ等を取り引きするPFで、2019年12月に設立されたKDXは、毎日放送社を中心に構成された官民のコンソーシアムによって整備された。KDXにデータを提供する組織および提供データの概要を図表 9に示す。
No | データ提供組織名 | 提供データ |
---|---|---|
1 | 毎日放送社 (放送局) |
|
2 | サムスンカード社 (クレジットカード事業者) |
|
3 | CJオリーブネットワークス社 (ITベンダー) |
|
4 | SKテレコム社 (通信キャリア) |
|
5 | SKプラネット社 (デジタルサービス事業者) |
|
6 | Welcome F&D社 (金融向けITベンダー) |
|
7 | GSリテール社 (コンビニ、スーパーマーケット等の運営事業者) |
|
8 | NICE D&R社 (ITサービス・調査事業者) |
|
9 | Daumsoft社 (ビッグデータ分析事業者) |
|
10 | Dable社 (メディア/広告のパーソナライゼーションサービス事業者) |
|
11 | Loplat社 (移動データの収集・分析事業者) |
|
12 | Builton社 (eコマースデータの分析事業者) |
|
13 | SIKSIN社 (グルメ検索サービス事業者) |
|
14 | オンヌリH&C社 (薬局チェーン) |
|
15 | Zinn Plus社 (不動産データの分析事業者) |
|
16 | 韓国クレジットビューロ社 (個人信用情報機関) |
|
17 | 韓国郵便事業振興院 (郵便事業者) |
|
韓国が進める分野別ビッグデータPFからも、データの可視化サービスやデータの分析ツール、データ活用に係る問題解決や技術提供が可能な専門人材をマッチングするサービス等の周辺サービスを提供することで、データ売買を盛り上げていることが分かる。また、韓国の分野別ビッグデータPFでは、行政機関だけでなく、民間企業も保有データをPF上で提供している点が特徴的だが、これは科学技術情報通信部がビッグデータPFの構築費だけでなく、データ提供用のデータセンター構築費を事業の中に組み込んでいたことで、民間企業が比較的小さい自己負担でデータ販売を始められたためだと考えられる。我が国においてもビッグデータの流通PFを整備する場合には、データ提供者向けの補助事業も併せて用意することが、提供データを増やす上で有効であると考える。
KDXの事例では、多様な業界のデータが販売されている点が特徴的である。具体的には、放送局の毎日放送社をはじめ、クレジットカード会社のサムスンカード社、通信キャリアのSKテレコム社、金融業界のWelcome F&D社、小売のGSリテール社等が保有するデータだ。これが実現できたのは、KDXの運営企業(KDX社)を新たに立ち上げ、上記各社をその主要株主にすることで、共通の利益を追い求めるパートナー関係を構築したためだと考えられる。さらに、その株主各社が出資のリターンを得るため、より価値のあるデータを販売するというインセンティブが働く機構を築いたことも影響しているだろう。我が国においても、データ流通PFの設立に当たっては、データ保有企業が出資し、PFの発展にコミットする仕組みを構築することが有効であると考えられる。
本連載では、シンガポール、インド、中国および韓国におけるデータ流通やデータ活用に関する取り組みを全3回にわたって紹介してきた。各国の取り組みは各様であるが、いずれもデータ流通・データ活用の分野において先進的なものであり、それぞれの工夫は、我が国でデータ流通の仕組みを築く上で重要な学びとなる。当社は今後も、データ流通・データ活用に関する動向を注視し、そこで得た知見をコンサルティングサービスに生かすことで、Society 5.0の実現に貢献していく。
田中 総一郎 株式会社 日立コンサルティング シニアコンサルタント
AIやIoT、ロボットなどの先端技術を駆使し、社会課題の解決と経済発展を両立させる社会「Society 5.0」。
その実現のための肝はデータであり、他者からデータを入手して活用することは世界的な潮流となっています。
本コラムでは、今後のデータ流通・活用を検討するうえで有用な海外の事例として、アジア(シンガポール・インド・中国・韓国)における動向を3回にわたって紹介します。
※記載内容(所属部署・役職を含む)は制作当時のものです。