ページの本文へ

中国・韓国におけるビッグデータ流通プラットフォーム

田中 総一郎 株式会社 日立コンサルティング シニアコンサルタント

2020年6月30日

1.はじめに

本コラムは、アジアにおけるデータ流通・活用をテーマに連載してきた。前編では、スマートシティーの動向として、シンガポールの事例を紹介した。中編では、個人データの流通・活用に関する動向として、インドにおけるIndia Stack(インド版マイナンバーをベースにした個人認証、オンライン決済、文書共有等のプラットフォーム)およびAccount Aggregator(個人の金融データの共有サービス事業者)を紹介した。

連載の最終回となる本稿では、ビッグデータの流通に焦点を当てる。コンピューターの処理能力向上と価格低下によって、生成・活用が容易となったビッグデータは、ビジネスの現場でも日常的に使われるようになった。例えば製造分野では、工場のさまざまな設備に設置したセンサーからデータが収集され、設備の故障予兆の検知や製造の予実管理に利用されている。また教育分野では、生徒の学習履歴を収集・活用し、カリキュラムを生徒一人一人に適したものにカスタマイズするサービスも生まれている。このような中、自前のデータを活用するだけではなく、第三者から取得したデータを活用することで、新たな価値を得ようという動きが活発になっている。例えば、通信キャリアのエリア別、時間別、属性別の人口統計データを購入し、商圏分析や観光客分析などに活用する事業者もいる。今やデータは売買する価値のある商品となっており、その売買を仲介するデータ取引市場をビジネスとして手掛ける企業も現れ始めている。

このようなビッグデータの流通や取引において、我が国に先行しているのが中国や韓国である。中国では、既に10カ所以上のデータ取引市場が開設されており、韓国では、さまざまな分野のデータを提供する官民協働のプラットフォーム(以下PF)が立ち上がり、事業を確立している。これらの先行する取り組みを学ぶことは、我が国のデータ流通を進展させる糧となる。そこで本稿では、これらの国々におけるビッグデータ流通に関する動向を紹介する。2章は中国の動向として、政府の後押しの下、設立が相次ぐビッグデータ取引PFを紹介する。3章は韓国の動向として、整備が進められている分野別のビッグデータPFを紹介する。

2.中国:ビッグデータ取引PF

中国では2014年からビッグデータ推進政策が本格化してきた。具体的には2014年3月の「政府工作報告」において、政府文書に初めて「ビッグデータ」という用語が登場し、未来の産業発展に向けてビッグデータ等を注力領域に据えることが示された。その後、2015年9月に国務院が公表した「ビッグデータの発展促進に関する行動要綱」において、多様な分野でビッグデータを応用していくことなどが規定された。そして2015年10月に中国共産党中央委員会 第5回全体会議(五中全会)で草案が承認された「第13次5ヵ年計画」において、ビッグデータが初めて国家戦略に加えられた。これを受け、2016年1月の「ビッグデータ発展の重大なプロジェクトの実施・促進に関する通知」において、ビッグデータ取引PFの設立に対して、政府が重点的に支援することが表明された(図表 1)。

図表 1:中国のビッグデータ推進政策の変遷

中国のビッグデータ推進政策の変遷

このような政府の積極的な後押しもあり、中国ではビッグデータの取引PFがいくつも立ち上がっている。本章では中国で運営されているビッグデータ取引PFを概説した上で、特徴的なものを紹介する。

2.1 中国における主なビッグデータ取引PF

中国では2001年ごろからビッグデータの取引ができるPFが登場し始め、2020年3月時点で10を超えるPFが運営されている(図表 2参照)。

図表 2:中国における主なビッグデータ取引PF
No ビッグデータ取引PF 運営組織 設立時期 データセット数※1
1 www.markwaymall.com 上海天津情報技術社 2001年 15,732
2 阿里云 云市场 (Alibaba Cloud Market) アリババクラウド社 2009年9月 991
3 Datatang Datatang社 2011年9月 222
4 Global Big Data Exchage (GBDEx) 貴陽ビッグデータ取引所 2014年12月 3,689
5 Donghu Big Data 武漢東湖ビッグデータ取引センター 2015年7月 150
6 www.finndy.com 上海連元情報技術社 2015年9月 20,273
7 Jiangsu Big Data Exchange (BDEX) 東中国江蘇省ビッグデータ取引センター 2015年11月 14
8 Youe Data 国信优易データ社 2015年12月 6,391
9 Shanghai Data Exchange Corp. 上海データ取引センター 2016年4月 (非公表)
10 BDG Store 九次方ビッグデータ情報グループ社 2016年11月 (非公表)
11 Qingdao Big Data Exchange 青島ビッグデータ取引センター 2017年 300
12 wx.jdcloud.com JD Cloud & AI社 (非公表) 2,004
13 大海洋 安徽数洋テクノロジー社 (非公表) 475
※1
2020年3月時点でのデータセット数。

図表 2に示すPFは、企業登記や裁判の判決記録等のストックデータのほか、気象の観測値や船舶の位置等のリアルタイムなフローデータの販売や売買仲介を主に行っている。またPFの中には、利用者が電話番号を入力すると、その電話番号の持ち主の年齢層やブラックリストの掲載有無等を返答するような形でデータを販売するものもある。さらに、一部のPFではデータの販売や売買仲介だけでなく、以下のようなサービスを提供している。

  • データのクレンジング、加工
  • データの品質評価
  • データの分析、可視化ツールのUI(User Interface)での提供
  • データの加工、分析アルゴリズムのAPI(Application Programming Interface)での提供 (例:身分証明書画像のOCR(Optical Character Recognition:光学文字認識)、中国語テキストの英語への翻訳)
  • Webページのクローリング
  • データの収集代行
  • サービス(データ分析等)の売買仲介
  • データ提供用APIの構築

次節では図表 2に示したPFの中から、AI(Artificial Intelligence)の教師データ(AIの学習に用いる正解となるデータ)に特化してデータ販売や関連サービスの提供を行っており、他のPFと比べて特色があるDatatangについて紹介する。

2.2 Datatang

Datatangは顧客のAIの開発を支援するため、以下のサービスを提供している。

AIの教師データの販売
AIの教師データの収集代行
顧客のデータに対するアノテーション付与

「①AIの教師データの販売」では、自動運転や警備、モバイルアプリケーション、スマートホーム、消費者向けチャットボット、機械翻訳等で使用されるAIの開発に必要な教師データを販売している。販売されるデータは音声データ、画像データ、テキストデータの3種類となっている。例えば自動運転の分野では、ドライバーが音声でコミュニケーションを取れるAIの開発を支援すべく、以下のようなデータが販売されている(図表 3参照)。

図表 3:Datatangの販売データの例(自動運転分野、コミュニケーション関連)
No 販売データの例 データの活用例
1 車内での標準中国語の発話データ(テキスト等のアノテーション付き) 音声認識、声紋認識、機械翻訳AIの学習
2 ロケーションやスケジュール、To doに関する中国語のテキストデータ 自然言語処理AIの学習
3 車内のノイズデータ(車両モデル、走行環境(天気、路面)、エアコンの動作有無のアノテーション付き) ノイズキャンセリングのためのノイズのモデリング

また、外部環境を正確に認識し、適切に走行できる自動運転AIの開発を支援するため、以下のようなデータが販売されている(図表 4参照)。

図表 4:Datatangの販売データの例(自動運転分野、走行関連)
No 販売データの例 データの活用例
1 北京の主要道路における車上カメラの画像データ(自動車、人体、標識のアノテーション付き) 自動車、人体、標識を検知するAIの学習
2 中国の都市や地方の道路における車載カメラの画像データ(道路、通行人、車両、信号機、標識のアノテーション付き) 道路の識別や通行人、車両、信号機、標識を検知するAIの学習

「②AIの教師データの収集代行」では、50以上の国や地域にいる約150万人のクラウドソースワーカーから顧客の求めるデータを収集し、アノテーションを付与した上で提供している。例えば、顧客は以下のようなデータの収集代行を依頼することができる(図表 6参照)。

図表 6:収集代行ができるデータの例
No 区分 データの例
1 音声データ シーン別の会話、地域別のアクセントがついた英語の会話、方言の会話
2 画像データ 動物、ジェスチャー、OCRの認識結果
3 3Dデータ 3Dの人の顔、3Dの人の動作、3Dのジェスチャー
4 映像データ 道路、家庭内の様子、人の動作
5 テキストデータ コーパス、Q&A
  • 資料:Datatang「AI Data Collection」を基に日立コンサルティングが作成

「③顧客のデータに対するアノテーション付与」では、顧客の持つ音声、映像、画像データにアノテーションを付与している。具体的には、それぞれ以下のようなアノテーションの付与が可能である(図表 7参照)。

図表 7:付与できるアノテーション例
No 区分 アノテーションの例
1 音声データ 会話音声を書き起こした文字
2 画像データ
  • 検知したオブジェクトの種類(人、顔、信号、自動車等)
  • オブジェクトの分類結果(顔のパーツ、洋服、道路の路線、道路上の物体等)
  • 画像におけるキーポイント(人体キネクト等)
3 映像データ
  • 人の表情に基づく感情判定結果
  • 映像の中で追跡するオブジェクト
  • 資料:Datatang「AI Data Annotation」を基に日立コンサルティングが作成

Datatang社は2011年9月の創業後、国内外における1,000以上のAI開発企業や研究機関にサービスを提供している。Datatang社は本社のある北京に加え、南京、貴陽、安徽、雄安、保定に拠点を有しているほか、カリフォルニア(米国)にも拠点を設けている。

2.3 中国のビッグデータ取引PFからの学び

データ取引市場の黎明期にある我が国は、5~10年の間、ビッグデータの取引を生業にしたサービスを展開してきた中国から、その取り組みを概観しただけでも以下のことを学ぶことができる。

  • 単なるデータ販売だけでなく、データの収集、加工、分析やデータ提供を支援するサービスも有効である
  • データ販売についても、売り切りモデルだけではなく、利用者の指定に応じたデータを要求される度に提供するモデルも有効である
  • AI学習の教師データの販売がビジネスになる

特に世界中にクラウドソースワーカーを抱えるプラットフォーマーに成長したDatatangは、さまざまな国の言語での発話データや道路等の景色の画像データを、顧客の要望に応じて収集・提供する仕組みを築き上げている。我が国においても、既存のデータを流通させるだけでなく、用途に応じて必要なデータを生成・提供することがビジネスチャンスになると考えられる。

3.韓国:分野別のビッグデータPF

韓国では、科学技術情報通信部が分野別にビッグデータPFを構築する事業を2019年から推進している。当事業は新しいデータ活用サービスの創出を促すことを目的に、データを収集・加工・提供するビッグデータPFを官民が連携して整備するものである。科学技術情報通信部は2019~2021年の3年間で1,516億ウォン(≒133億円※2)を投じて、10の分野別ビッグデータPFを構築するとしている。本章ではこれらの分野別ビッグデータPFを概説した上で、その中でも特徴的なものを紹介する。

※2
1ウォン=0.088円で算出。

3.1 韓国における分野別ビッグデータPF

韓国では科学技術情報通信部の「ビッグデータプラットフォームとセンター構築事業」として、図表 8に示す分野別ビッグデータPFが整備されている。当事業では、ビッグデータPFの構築と併せて、PFにデータを提供するデータセンターの整備も行うとされている。

図表 8:韓国で整備される分野別ビッグデータPF
No 分野 PF名 PF構築の
主管組織
データ
提供用
データ
センター数
データ
セット数※3
1 金融 Financial Big Data Platform (FBDP) BCカード社 7 140
2 環境 envbigdata 韓国水資源公社 9 384
3 文化・メディア BigData MarketC 韓国文化情報院 10 770
4 交通 DIAMOND-E Big Data Platform DIAMOND-E Consortium 8 568
5 ヘルスケア Clinical Oncology Network for uNifying Electronic mediCal daTa (CONNECT) 国立がんセンター 5 (非公表)
6 流通・物流 Korea Data Exchange (KDX) 毎日放送社 10 7,955
7 通信 KT Big Data Platform KT社 15 (非公表)
8 中小企業 WEHAGOデータ流通ポータル DOUZONE社 8 (非公表)
9 地域経済 京畿地域経済ポータル 京畿道庁 9 (非公表)
10 森林 Forest Big Data Exchange 韓国林業振興院 8 463

各PFでは行政機関や民間企業の持つデータが有償/無償で提供されている。またPFの中には、データの可視化サービスやデータの分析ツール、データ活用に係る問題解決や技術提供が可能な専門人材をマッチングするサービス等を提供するものもある。
次節では、取り扱うデータセット数を公表しているPFの中から、その数が群を抜いて多かったKorea Data Exchange (KDX)について紹介する。

※3
2020年3月時点でのデータセット数。

3.2 Korea Data Exchange (KDX)

韓国の小売企業等が保有する流通・消費データ等を取り引きするPFで、2019年12月に設立されたKDXは、毎日放送社を中心に構成された官民のコンソーシアムによって整備された。KDXにデータを提供する組織および提供データの概要を図表 9に示す。

図表 9:KDXへのデータ提供組織および提供データ
No データ提供組織名 提供データ
1 毎日放送社
(放送局)
  • 毎経メディアグループが保有するメディアデータ(記事、テレビ映像)
  • 不動産データ
  • 証券データ等
2 サムスンカード社
(クレジットカード事業者)
  • 会員タイプ別のクレジットカードの消費行動データ(約1,000万人分)
  • 加盟店の業種別売上データ(約210万店分)
  • 地域別や時間帯別の消費データ
3 CJオリーブネットワークス社
(ITベンダー)
  • 大韓通運社※4の配送先地域別・商品分類(約1,600種類)別の宅配データ
  • CJフレッシュウェイ社※5の地域別・生産者別・購買者の業種別の食材売上データ
4 SKテレコム社
(通信キャリア)
  • SKテレコムユーザーに基づく地域別流動人口や観光人口の推定データ
  • Point of Interaction(クレジットカード決済可能な店舗)のデータ等
5 SKプラネット社
(デジタルサービス事業者)
  • アプリケーション※6ユーザーの年齢、性別、訪問先、訪問先でのアプリ使用内容(検索、クーポンダウンロード等)、検索ワード等のデータ
6 Welcome F&D社
(金融向けITベンダー)
  • Welcome Financial Groupの口座分布のデータ(年齢別、性別、地域別の預金額、振込額等)
  • Welcome Financial Groupのローン分布のデータ(年齢別、性別、職業別、地域別の顧客の信用評価、ローンの承認額、ローン月数等)
  • Welcome Financial Groupの顧客が保有する不動産分布のデータ(年齢別、性別、地域別の不動産の保有形態、不動産の居住形態、不動産評価のスコア等)
  • Welcome Financial Groupの消費者ローン顧客に関する信用格付け分布のデータ(年齢別、性別、地域別のローン額、推定月収等)
  • Welcome Financial Appの会員分布のデータ
7 GSリテール社
(コンビニ、スーパーマーケット等の運営事業者)
  • GS25(GSリテール社のコンビニチェーン)の月別、商品分類別の売上データ
  • GS25の商品分類別、前年、前月比の売上伸び率のデータ
  • GS25の店舗あたりの売上データ
  • GS25の商品分類別、地域別の販売構成比のデータ等
8 NICE D&R社
(ITサービス・調査事業者)
  • 自動車登録の統計データ(性別、年齢別、地域別の新車登録数)
  • 自動車関連アプリケーションの利用状況に関する統計データ(性別、年齢別、地域別の自動車関連アプリケーションの利用状況)
9 Daumsoft社
(ビッグデータ分析事業者)
  • SNSでの登場頻度急上昇ワードのデータ
  • SNS上で、あるキーワードが登場した投稿数の推移データ
  • SNS上で、あるキーワードと共起したキーワードのリスト
  • SNS上で、あるキーワードが出現した投稿のタイトル、作成日、URL等
10 Dable社
(メディア/広告のパーソナライゼーションサービス事業者)
  • Webメディアの利用統計データ(Webメディアユーザーが興味を寄せた記事、トピック等)
11 Loplat社
(移動データの収集・分析事業者)
  • Wi-Fiで測位した人流データ
  • Wi-Fiで測位した来客数の店舗別ランキングデータ等
12 Builton社
(eコマースデータの分析事業者)
  • eコマースの商品、価格、コメント(顧客満足度、コメントの肯定/否定の評価結果等)のデータ
  • eコマースでの露出度・広告表示回数のランキングデータ
13 SIKSIN社
(グルメ検索サービス事業者)
  • 全国の飲食店のデータ(店名、場所、ユーザー評価、画像等)
  • 会社員向けモバイル食券の取扱店の位置データ
  • 会社員向けモバイル食券の消費状況のデータ等
14 オンヌリH&C社
(薬局チェーン)
  • 地域別の健康機能食品の販売データ
  • 地域別の医薬部外品の販売データ
  • 地域別のジェネリック医薬品の販売データ
  • オンラインでの健康機能食品・医薬部外品の販売データ
15 Zinn Plus社
(不動産データの分析事業者)
  • 地域別のマンション、アパートの取引量、相場のデータ
  • 新築のマンション、アパートの位置データ等
16 韓国クレジットビューロ社
(個人信用情報機関)
  • 地域別の所得に関する信用分析データ
  • 地域別の消費に関する信用分析データ
  • 地域別の債務に関する信用分析データ
17 韓国郵便事業振興院
(郵便事業者)
  • 郵便物の分類別、発送地域・受取地域のデータ
  • 地名コード、地名のマッピングテーブルのデータ等
  • 資料:Korea Data Exchange「参加企業」を基に日立コンサルティングが作成
※4
韓国における大手宅配事業者で宅配市場のシェアは50%にのぼる。
※5
レストラン、ケータリング事業者、スーパーマーケット、食品工場等向けの食材流通サービス等を提供する企業。
※6
SKプラネット社が提供する以下のアプリケ-ションのこと。
  • OK CASHBAG:韓国最大(2020年6月現在)の共通ポイントサービスのアプリケーション。約44,000の加盟店と約3,500万のユーザーを持つ。
  • Syrup Wallet:銀行口座やクレジットカード等の利用状況の閲覧やポイントカードの管理等ができるアプリケーション。クーポン配信やポイント付与も行う。約630の提携ブランドを持つ。

3.3 韓国の分野別ビッグデータPFからの学び

韓国が進める分野別ビッグデータPFからも、データの可視化サービスやデータの分析ツール、データ活用に係る問題解決や技術提供が可能な専門人材をマッチングするサービス等の周辺サービスを提供することで、データ売買を盛り上げていることが分かる。また、韓国の分野別ビッグデータPFでは、行政機関だけでなく、民間企業も保有データをPF上で提供している点が特徴的だが、これは科学技術情報通信部がビッグデータPFの構築費だけでなく、データ提供用のデータセンター構築費を事業の中に組み込んでいたことで、民間企業が比較的小さい自己負担でデータ販売を始められたためだと考えられる。我が国においてもビッグデータの流通PFを整備する場合には、データ提供者向けの補助事業も併せて用意することが、提供データを増やす上で有効であると考える。

KDXの事例では、多様な業界のデータが販売されている点が特徴的である。具体的には、放送局の毎日放送社をはじめ、クレジットカード会社のサムスンカード社、通信キャリアのSKテレコム社、金融業界のWelcome F&D社、小売のGSリテール社等が保有するデータだ。これが実現できたのは、KDXの運営企業(KDX社)を新たに立ち上げ、上記各社をその主要株主にすることで、共通の利益を追い求めるパートナー関係を構築したためだと考えられる。さらに、その株主各社が出資のリターンを得るため、より価値のあるデータを販売するというインセンティブが働く機構を築いたことも影響しているだろう。我が国においても、データ流通PFの設立に当たっては、データ保有企業が出資し、PFの発展にコミットする仕組みを構築することが有効であると考えられる。

4.最後に

本連載では、シンガポール、インド、中国および韓国におけるデータ流通やデータ活用に関する取り組みを全3回にわたって紹介してきた。各国の取り組みは各様であるが、いずれもデータ流通・データ活用の分野において先進的なものであり、それぞれの工夫は、我が国でデータ流通の仕組みを築く上で重要な学びとなる。当社は今後も、データ流通・データ活用に関する動向を注視し、そこで得た知見をコンサルティングサービスに生かすことで、Society 5.0の実現に貢献していく。

本コラム執筆コンサルタント

田中 総一郎 株式会社 日立コンサルティング シニアコンサルタント

AIやIoT、ロボットなどの先端技術を駆使し、社会課題の解決と経済発展を両立させる社会「Society 5.0」。
その実現のための肝はデータであり、他者からデータを入手して活用することは世界的な潮流となっています。
本コラムでは、今後のデータ流通・活用を検討するうえで有用な海外の事例として、アジア(シンガポール・インド・中国・韓国)における動向を3回にわたって紹介します。

※記載内容(所属部署・役職を含む)は制作当時のものです。

Search日立コンサルティングのサイト内検索