ヒト、メディア、社会を考える

データサイエンス

ビッグデータの時代、新卒採用を巡って何が起きているのか。

 2019年8月9日、リクルートホールディングスは4月―6月期の連結純利益が前年同期比25%増で過去最高だったと発表しました。「じゃらん」(旅行)、「ホットペッパービューティ」(美容)、「リクナビNEXT」(中途採用)、「リクナビ」(新卒採用)など、データを活用したサービス事業が利益を生み出していたのです。

 近年、リクルートが成長戦略として推進してきたのが、AIを使い、個人と企業とのマッチングを行う事業でした。今期はそれらが軒並み、業績を上げていたのですが、その中の一つ、「リクナビ」が手掛けていたサービスで問題が発覚しました。

■リクナビ、内定辞退率を企業に提供
 2019年8月2日、就職情報サイト「リクナビ」を運営するリクルートキャリアが、本人からの同意を得ないまま、個人情報を使って「内定辞退率」を算出し、38社に有償で提供していたことが報じられました。

 それを聞いた瞬間、私は思わず、耳を疑ってしまいました。リクナビといえば、大手の就職サイトです。それがユーザーである学生の信頼を踏みにじり、騙し討ちにするような行為で、大幅な利益を得ていたというのです。開いた口がふさがらず、私は不快感をおぼえ、不信感をつのらせてしまいました。

 この時の報道によると、リクルートキャリアは、学生の閲覧履歴をAIで分析し、選考や内定を辞退する確率を5段階で評価するサービスを開発していたといいます。「リクナビDMPフォロー」と名付けられたこのサービスがどのような仕組みになっているのか、私にはよくわかりません。

 ただ、ログインすれば、登録情報から自動的に個人が割り出されますし、その個人情報を閲覧履歴に紐づけて分析すれば、内定辞退の確率を個別に算出することができるのではないかという程度のことは推察できます。

 このサービスは2018年3月から開始され、38社が利用していまたといいます。利用料金は関連サービスと合わせて年額400万円から500万円だったそうです。内定辞退率は企業にとってそれほど高い価値を持つ情報なのでしょう。

 リクルートは人事担当者のニーズをしっかりと把握した上で、個別企業のニーズに合わせ、当該学生の内定辞退率を提供していました。学生の氏名を特定した上で、内定辞退率を算出し、企業ごとに情報を提供していたのです。

■内定辞退率の商品化
 内定辞退率が、人事担当者からのニーズが高く、価値の高い情報であることは確かでした。学生と企業とのマッチングが適切でなければ、内定者が辞退してしまうということは今後も多々、起こるでしょう。

 事前に当該学生の内定辞退率を把握することができれば、より承諾する可能性の高い学生に内定を出すことができると、企業が考えたとしても不思議はありません。企業にとって喉から手の出るほど欲しい情報なのです。ですから、内定辞退率の商品化は半ば当然のことだったといえるでしょう。

リクナビといえば、年間80万人もの学生が利用するサイトです。

こちら →https://job.rikunabi.com/2021/

 ほとんどの学生はこのサイトで企業情報を得、就職活動を展開しています。その結果、リクナビには学生の個人情報や企業の閲覧履歴が膨大なデータとして蓄積されていました。ユーザー数が多ければ多いほど精度の高い情報が得られますし、サービスを改善していくこともできます。

 ビッグデータの時代にはデータが価値を生みます。ビッグデータを処理する技術があり、インフラがあれば、内定辞退率を個別に算出し、商品化することは可能でした。最大手の就活サイト「リクナビ」だからこそできた情報サービスだといえます。

 一方、「リクナビ」は、企業側のニーズを的確に把握しやすい立場にありました。だからこそ、企業が把握している特定の個人情報に紐づけ、閲覧履歴をAIで分析し、企業が知りたい学生の内定辞退率を算出することができたのです。この仕組みを図式化すれば、以下のようになります。

こちら →
(2019年8月2日、日経新聞より。図をクリックすると、拡大します)

 そもそも学生の閲覧履歴など、これまでは単なるデータに過ぎませんでした。ところが、AIの登場によって、ただのデータを価値ある情報に転換することができるようになりました。データを利活用し、ビジネスに結び付けることができるのが、閲覧履歴などの個人情報です。

 もっとも、個人情報の利活用はビジネスに直結させることができる一方、個人の権利や利益を侵害する恐れがあります。

■本人の同意を得ず、個人情報を利用
 今回、問題になっているのは、本人の同意を得ないまま、個人情報が使われていたことでした。先ほどの図を見てもわかるように、情報のやり取りはすべてネット上で行われています。

 リクナビは学生と企業をつなぐプラットフォームですから、メインの顧客は学生だと思っていましたが、今回の一件からは、企業を重視したサービスが展開されていたことがわかります。企業のニーズに応えるために、本人の同意を得ないまま個人情報を使用していたのです。

 明らかに、個人情報保護法に違反していますが、8月2日の時点では、リクルートキャリアはこのサービスをいったん、休止するとしか表明していませんでした。個人情報の扱いに関する認識が甘かったのかもしれません。

 ところが、8月6日の報道では、このサービスを「休止する」から、「廃止する」に変更されていました。事件発覚後、リクナビに対する内部調査によって、個人情報保護法違反が明らかになったからでした。

 例えば、「2019年3月にプライバシーポリシーを変更した際、一部の画面で反映できておらず、不適切に個人情報を取得した」ことが明らかになったといいます。システム上、本人の同意を得られない状況があったことが示されており、これによって、7983人の学生に影響が及んだと説明されています。

 これはほんの一例です。これ以外の方法で、多くの個人情報が本人の同意なく、利用されていたのでしょう。正確に何人の学生の予測データが企業に販売されていたのか、この時点ではまだわかっていません。問題の根幹にかかわる情報の多くが不明だったのです。今後、このサービスの仕組みが明らかになってくれば、リクナビだけではなく、企業側の責任も問われる可能性がありました。

 案の定、調査が進むと、企業は自社が持つ学生の個人データをリクナビに提供していたことが明らかになってきました。考えてみれば、確かに、企業からのデータ提供がなければ、特定の学生のその企業に対する「内定辞退率」を予測することなどできるはずがありません。

 内部資料によると、企業はこのサービスを利用するために、リクルートから以下の作業を行うことが求められていました。すなわち、①採用のデータベースから、個人IDや選考結果、学歴など応募者情報をリクルート側に送付すること、②応募者に対して個人ID付きのURLの入ったメールを送信すること、等々です。

 つまり、学生の内定辞退率を算出するには、リクルート側が持っているデータだけでは不可能で、当該企業からのデータが不可欠でした。双方のデータを収集してAIが分析した結果、学生がその企業の内定を辞退する確率を予測することができる仕組みだったのです。

■新卒者の内定辞退率の推移
 企業が個人情報保護法に抵触してでも入手したかったのは、学生の内定辞退率でした。実際、手間暇かけて選考し、熟考の末、内定を出しても、辞退されてしまったのでは、元も子もありません。できることなら、確実に入社してくれる学生に内定を出したいというのが、企業の本音でしょう。

 ところが、近年、内定を辞退する確率が高止まりしているようなのです。ネットで検索すると、新卒者の内定辞退率の推移を示すグラフを見つけることができました。2013年以降、内定辞退率は以下のように推移しています。

こちら →
(日経新聞2018年12月1日付。図をクリックすると、拡大します)

 上のグラフを見ると、2014年以降、内定辞退率は急速に上昇しています。2016年から2017年にかけては一旦、下がるのですが、その後、再び上昇しています。2019年春の卒業生の場合、内定辞退率は66%にも及び、過去最高を記録していました。ちなみに、学生が内定を得た企業数は平均2.45社だったそうです。

 内定辞退率の推移をみていくと、企業の人事担当者がどれほど虚しい思いをし、徒労感を募らせていたかがわかろうというものです。しかも、内定辞退者数は60%以上で高止まりしています。このような状況が固定してくれば、企業の人事担当者が、内定を出した学生の辞退する確率を事前に把握したいと思うのも当然なのかもしれません。

 ある企業の人事担当者によれば、1名の内定承諾者のために、2名に内定を出し、2名の内定者を出すために3名を社長面接に繋ぎ、3名の社長面接に繋ぐために5名を役員面接に繋ぐといいます。そして、5名の役員面接に繋ぐために10名のマネージャー面接を設定し、10名のマネージャー面接を設定するために20名の人事面接が必要だといいます。

 さらに、20名の人事面接に繋ぐためにはイベントで300名の学生に接触しなければならないというのです。一人の内定承諾者を出すために、企業側はなんと300名の学生に接触していたのです。

 採用のための一連のプロセスを見ると、企業が新卒採用にどれほど時間とコスト、心的エネルギーをかけているかがわかります。企業側の現状がわかってくると、次第に、この種の情報サービスは必要なのかもしれないと思うようになってきました。

 とはいえ、本人の承諾を得て、個人情報を利用し、内定を得た学生の不利にならないようなシステムを構築することは可能なのでしょうか。個人情報を利用しなければ価値ある情報は得られず、本人の同意を求めれば、個人情報は得られない可能性があります。こうしてみると、現在の新卒一括採用システムそのものを考え直すことが必要になっているのかもしれません。

 せっかく内定を得ても、学生はちょっとしたきっかけで容易に辞退してしまうというのが実態だとすれば、インターン制を充実させ、就職前に就労経験を積む必要があるでしょう。学生側の就労意識に問題があるのだとすれば、大学側でキャリア教育を充実させる必要があるかもしれません。

 いずれにしても、これだけ内定辞退率が高いのは、新卒一括採用方式がもはや時代に合わなくなっているからだということも考えられるでしょう。

■新卒の通年採用の枠を拡大
 そういえば、2019年4月22日、経団連は、新卒学生の通年採用を拡大することで大学側と合意し、正式に発表しました。これまでの春季一括採用に加え、通年採用の枠を拡大すると経団連が宣言したのです。

 通年採用であれば、海外に留学した学生を採用しやすくなりますし、時期にとらわれずに優秀な学生を採用することができます。採用方式を多様化することによって、企業側は多様な人材を獲得することができるという判断から、経団連は新卒の採用方式を変更したのです。

 大学側にしてみれば、通年採用を拡大することによって、新卒一括採用に合わせたカリキュラムではなく、大学で学ぶべき教育課程を充実させることができます。インターン制度を使い、専門知識を活かして仕事をする機会を学生に提供することもできます。このような可能性を考えると、通年採用は、企業にとっても大学にとっても通年採用方式にはメリットがあるといえるでしょう。

こちら →
(日経新聞2019年4月22日付より。図をクリックすると、拡大します)

 もっとも、多様な採用方式が広がっていけば、新卒の採用時期が前倒しされる懸念があります。これについて経団連と大学側は、就職活動に多くの時間を割いて、大学4年時を浪費しないよう、「卒業要件を厳しくするよう徹底すべき」だという見解を確認し合ったと報道されています。学生にはしっかりと学んでもらい、知識、技能、見識などを習得してもらうという点で、受け入れる側と送り出す側は一致していたのです。

 デジタル競争の時代、世界に通用する人材を採用しなければ、企業を持続的に発展させることはできません。文系・理系を問わず、基本的な数学やデータ分析力を養い、語学やリベラルアーツの習得が必要だということが共通認識になっているといえます。今春、経団連が打ち出した通年採用は時代の要請でもあったのです。

 さて、日経新聞は2019年4月22日、通年採用の導入について、企業にアンケート調査を実施しました。その結果、すでに通年採用を始めていると答えた企業が24.5%、検討中が54.9%、検討していない企業は20.6%という結果でした。なんと8割弱の企業がすでに通年採用を実施しているか、検討していることがわかりました。

 そして、通年採用を評価すると回答した企業は53.8%、評価しないはわずか10.4%でした。「評価する」理由の上位は、①「就活ルール」が形骸化、②留学生や外国人材を採用しやすくなる、③優秀な人材を確保しやすくなる、④学生との「ミスマッチ」が起きにくい、⑤学生が学業に注力できる、等々でした。

 このアンケート調査の結果からは、企業が国内外を問わず、優秀な人材を求めていること、学生にはしっかりと勉強してほしいと望んでいること、等々が裏付けられました。組織内の和を重視するメンバーシップ型雇用から、能力重視のジョブ型雇用へと、明らかに変化し始めているのです。技術変化の激しいデジタルトランスフォーメーションの時代、優秀な人材の採用こそが、企業の命運を握るようになってきたからでしょう。

■ジョブ型雇用が意味するものは?
 IT関連企業は当初から、ジョブ型雇用を実施していました。今回、注目されているのは、大企業が加盟している経団連が、このような雇用方針の転換を表明したことでした。これまで組織内調和を重視し、メンバーシップ型雇用を行ってきた経団連が、組織の調和を乱しかねないジョブ型雇用を打ち出したのです。

 いったい、何故なのでしょうか。

 人材サービス企業の大手エン・ジャパンの沼山祥史執行役員が、興味深い見解を披露しています。

ご紹介することにしましょう。
(https://style.nikkei.com/article/DGXMZO44519100Y9A500C1000000/?page=2より)

 沼山氏は採用の現状について、「メンバーシップ型の採用をしている企業の給与制度は、年功序列を前提とした職能給であるため、ほしい専門人材に柔軟な条件提示ができない。結果、条件面で有利な外資やベンチャーに負けてしまう。こうした現状を何とかしないと企業として生き残れないという危機感がある」と述べています。ジョブ型採用に移行すれば、人材獲得競争の面でメリットが大きいと指摘するのです。

 沼山氏さらに、「ジョブ型採用が広がると、学生時代から専門性を磨いたり職業経験を積んだりした人が就職の際に一段と有利になるだろう。だから、大学では専門的な勉強をしっかりとすることが求められる。また、インターンをするのも一つの手だ」といい、「就職してからも自己投資を怠らず、専門性に磨きをかけることが必要になってくる。年功序列のメンバーシップ型とは違い、ジョブ型は基本的に、自分で努力しないとキャリアアップも昇給もままならない」と述べています。

 最近、『AERA』の2019年8月5日号を読んだところ、「新卒の年収も一千万円時代」というタイトルの記事が掲載されていました。これもまた、ジョブ型採用の一例といえるでしょう。

■新卒年収、1000万円時代?
 ネット関連企業のDeNAは2017年、高いAI知識を持つ学生のための採用枠「エンジニア職AIスペシャルコース」を設け、年収を「600万円以上、最高1千万円」としたそうです。

 タイトルを見たとき、あまりにも高額の年収に驚いてしまったのですが、これは、優秀な学生をつなぎとめるためのジョブ型採用の一つでした。

 DeNAのAIシステム部長は、実際に1千万円の年収を提示する学生には最低条件として、「研究者としてトップレベルであること」、「学生時代に国際学会で発表し、論文が採択されていること」、「事業やサービスの提供を先導できること」などを求めるといいます。

 破格の年収には驚いてしまいましたが、採用基準をみると、極めて高い知識や技能、経験が求められています。グローバル化し、デジタル化した社会状況の中で、十分に能力を発揮できる人材が必要とされているのでしょう。

 人材獲得競争がし烈になっている今、求める人材を獲得しようとすれば、考えられないほど多額の報酬を提示せざるをえないようになっているようです。

 さて、2017年に「エンジニア職AIスペシャルコース」で、DeNAに採用された学生は、AI専門職の採用枠を設けている企業をターゲットに就職活動をしていたといいます。結果として、大学、大学院でしっかりと研究してきたことが評価されて、採用されました。

 大学や大学院でしっかりと学び、成果を出していれば、専門職を遂行できる人材だとして評価され、企業から高い報酬で採用されるのです。入社してから、専門を活かしてモチベーション高く働くことができれば、職場でも成果を上げやすく、企業も満足するというwin-winの関係が生み出されます。新卒学生に高い報酬を支払っても、高い確率で、それに見合う成果が得られるのです。

 DeNAと同様、新卒にも高額の報酬で報いるという企業は他にもありました。

こちら →
(『AERA』の2019年8月5日号より。図をクリックすると、拡大します)

 これを見ると、主に研究者、AIエンジニアとして力量のある人材が求められていることがわかります。デジタル技術に長けた優秀な人材を採用しなれば、企業の存続が危ぶまれる時代になっているからでしょう。

■ビッグデータの時代、何が求められているのか
 デジタル競争の時代を迎え、ビッグデータ、AIが主要な役割を果たすようになっています。企業が求める人材もそれに応じて変化しており、高度なデジタル人材の獲得競争がし烈になっているようです。

 ところが、従来の給与体系では優秀な若い人材の雇用は難しく、企業の成長を維持することはできなくなっています。既存社員よりも多額の報酬を支払ってでも、有能な新卒を採用しなければ、デジタルトランスフォーメーションへの対応が不可能になっているのです。

 そのような状況下で発覚したのが、就活サイト「リクナビ」の個人情報保護違反の案件でした。内部調査が進むにつれ、企業もまた学生の個人情報を本人の同意なく、リクルートに提供していたことが明らかになりました。就活サイトと企業が共同して学生の個人情報を勝手に利用し、個別に内定辞退率を算出し、新たな情報サービスとして企業に有償で提供していたのです。

 ビッグデータが価値を持つ時代を反映するような案件でした。

 一方、新卒に1000万円の報酬を提示する企業が出てきました。採用基準をみると、グローバルに展開するデータ経済の時代に活躍できる能力や技能、経験を備えていることが条件になっています。

 今回、ご紹介した新卒採用を巡る一連の案件はいずれも、デジタルフォーメーション時代に向けて社会が変革している過程で生み出されたものだといえるでしょう。新たな事業を創出し、企業が持続的に発展していくには、技術力、知識、経験、人間性など、きわめて高い能力を備えた人材が不可欠になっていることがわかります。

 さらに、「リクナビ」の一件では、個人情報が大量に集積すれば、新たな価値を生み出すこともわかりました。改めて、どのようにすれば個人情報を守れるのか、個人の権利や利益を侵害しないで利用するには個人情報をどのように扱うべきなのか、ルールの徹底が必要だと思いました。(2019/8/16 香取淳子)

データサイエンスの時代、大学に求められるものは何か。

■武蔵学園データサイエンス研究所設立記念講演会の開催
 2018年11月24日、武蔵大学で「武蔵学園データサイエンス研究所設立記念講演会」が開催されました。

こちら →
https://www.musashigakuen.jp/albums/abm.php?f=abm00012613.pdf&n=181124_%E3%83%87%E3%83%BC%E3%82%BF%E3%82%B5%E3%82%A4%E3%82%A8%E3%83%B3%E3%82%B9%E3%81%AE%E5%B1%95%E9%96%8B.pdf

 武蔵学園では、社会科学、人文科学の視点でデータサイエンス研究を推進することを目的に、2017年に「武蔵学園データサイエンス研究所」が設立されました。ここではデータサイエンスに関する人材育成、研究・教育方法の開発、社会への啓発活動を展開していくといいます。

 「社会科学、人文科学の視点でデータサイエンス研究を推進する」という趣旨に興味を覚え、このシンポジウムに参加してみることにしました。

 当日配布された資料によると、武蔵大学は2014年に社会学部を再編し、新学科を設立する構想を開始しました。2016年には諸状況を考慮し、学科新設ではなくコース新設に当初の方針を変更し、2017年に社会学科、メディア社会学科共通のコースとして新設されたのが、「グローバル・データサイエンスコース」です。この時同時に設置されたのが、「武蔵学園データサイエンス研究所」でした。所長は有馬朗人氏です。

 講演会が始まってまず驚いたのは、有馬朗人氏が開会挨拶のため壇上に立たれたことでした。有馬氏といえば、かつて東大総長であり、科学技術庁長官であり、文部科学大臣であったことは私も知っていました。ところがいま、武蔵学園の学園長であり、今回、設立された武蔵学園データサイエンス研究所の所長でもあるというのです。ずいぶん前に文部科学大臣をなさっていましたから、多分、相当のご年齢のはずです。

 さっそくスマホを取り出し調べてみると、有馬氏はなんと今年88歳でした。すっかり驚いてしまいました。確かに、壇上に上がってこられる際の足元にはややおぼつかない印象がありました。やはりご年齢のせいかと思いましたが、お顔は私がかつて新聞雑誌等で拝見したときのままでした。

 さらに驚いたのは、パワーポイントを使って要領よくデータサイエンス研究所設立の経緯を述べられたことでした。いったん檀上に立たれると、その年齢を忘れさせてしまうほど力強く、張りのある声で会場の参加者たちを引き付けてしまわれたのです。ご自身の経歴とデータサイエンスとの関わりを、ユーモアたっぷりにお話しされるご様子には圧倒されてしまいました。そして、開会の挨拶にふさわしく、ビッグデータはこれまでもっぱら自然科学領域で活用されてきたが、今後は人文社会科学領域で利活用し、その発展につなげてもらいたいと締めくくられたのです。

 たしかに今後、高齢化によって生産年齢人口はますます減少していくことを思えば、社会人文科学領域でのビッグデータの利活用によって社会の維持を図っていくことが必要になるでしょう。この領域でのデータサイエンティストの育成は必須です。

■社会現象をデータ処理すること
 私は大学院生の頃、質問紙調査によって得られたデータを、統計的手法によって分析するという手法で、社会現象を研究していました。1980年代初、実証社会学の領域ではデータ解析にSPSS(Statistic Package for Social Science)を使うのが主流でした。調査票で得られた回答をコーディングシートに書き写し、そのデータをパンチカードに入力し、次にプログラムを入力したカードと合わせてカードリーダーに読み取らせ、集計結果を出していくという方法です。

 当時、大型計算機は拠点校にしか設置されていませんでした。ですから、個々のデータをコーディングシートに書き写すと、わざわざ東京大学の計算機センターにまで出向いて、入力作業、データの読み取り、解析作業を行っていました。入力作業は手作業ですから、当然、打ち間違いがあります。まずは単純集計結果を出してから、データのバグを発見し、修正していく作業が必要でした。よくあるのは、「0」と「O」、「7」と「1」の打ち間違いでしたが、回答肢にない数字を打ってしまうこともよくありました。ヒトが行う作業に完璧はないということを再認識させられたことを思い出します。

 そのようにローデータを丁寧に修正してから、解析作業に入るわけですが、私は、クロス集計をしてからχ二乗検定を行う、あるいは、因子分析を行う、等々の作業を行っていました。χ二乗検定の結果で有意差が出たとき、あるいは、因子分析結果ではっきりとした結果が出たとき、瞬間、なんともいえない嬉しさが立ち上ってきて、これまでの労苦が報われるような思いがしたものでした。

 ところが、帰宅してそれを文章にまとめようとすると、想定内の結果でしかなかったと思うことが多く、次第にこの手法に不満を感じるようになっていました。その後、同じような経験を何度か重ねるうちに、この手法は仮設検証には有効でも、何かを発見するには向かないのではないか、あるいは、社会現象に伴う時間経過の要因を把握するのは難しいのではないか、という思いが強くなっていきました。横断的に収集したデータの限界を感じていたのです。

 そのような私が当時、達した結論は、①少数サンプルで徹底したパイロットスタディを行い、そこで得られた知見に基づいて仮設を立て、調査の枠組みを設計し、構造化された質問票を作成する、②対象を限定し、サンプル数をできるだけ多くする、③コントロールグループを設定し、比較検討できるようにする、というものでした。このような条件の下ではじめて、現実に即した有効な結果が得られるのではないかと思っていました。

 さて、その後、コンピュータの性能は向上し、解析手法の精度も高くなっています。当時とは違って、社会科学、人文科学の領域でデータ活用できる範囲も広がっていますし、データ処理に基づく結果についても信頼度が高まっています。

 しかも、センサーが発達した結果、様々な領域で自動的に収集されるデータが増え続けています。私が調査研究を行っていた頃は数百サンプルのデータを収集しようとすれば、巨額の資金が必要でした。研究助成を申請し、採択されでもしない限り、不可能でした。

 ところが現在、様々な領域でセンサーが自動的に収集する膨大なデータがあります。ビッグデータからは数百サンプルのデータよりはるかに精度の高い結果が導かれるでしょう。これを利活用しない手はありません。しかも、社会人文科学領域でのデータサイエンティストの育成は緒に就いたばかりです。武蔵大學がデータサイエンス領域での人材育成に向けて舵を切り、同時に、研究所を設立して教育、研究、実践に対応しようとされていることは時宜に合っており、素晴らしいと思いました。

 それでは、記念講演会に戻りましょう。有馬氏に続き、武蔵大学学長の山嵜哲哉氏の開会の挨拶が終わると、横浜市立大学データサイエンス学部長・岩崎学氏による基調講演、次いで、専門家によるパネルディカッションが行われました。

■基調講演:「データサイエンスの展開~社会科学分野への提言~」
 岩崎学氏は「統計的データ解析の理論と応用」の専門家で、現在は横浜市立大学データサイエンス学部長です。「データサイエンスの展開~社会科学分野への提言~」と題して、講演されました。

 岩崎氏は、データサイエンティストに求められるのは、〇ビジネス課題を整理し、解決する力(business problem solving)、〇データを分析能力(data science)、〇データサイエンスを意味ある形に使えるようにし、実装、適用できるようにする力(data engineering)、等々だといいます。

こちら →
(図をクリックすると、拡大されます)

 この図で示されるように、社会科学領域ではまず、現実社会の問題点を整理し、課題は何かを発見する能力が必要になります。ビジネスであれ、行政であれ、教育であれ、それぞれの現場で何が課題なのかが明らかになれば、その解決に向けてデータを選択し、それぞれの課題にふさわしい条件下で活用し、分析することができます。

 興味深いのは、データを分析した結果を意味ある形に整理し、実際に使えるようにする実装能力、あるいは、適用能力が必要だと説かれていたことでした。社会現象の説明のためのデータ分析ではなく、社会現象に伴う課題を解決するためのデータ分析が重要だということです。それには、分析結果を踏まえて何らかの社会実装、あるいは社会への適用ができるものでなければならないというわけです。

 岩崎氏はさらに、社会科学には相関関係があっても因果関係があるとは言えないことに留意すべきだとし、そもそもデータさえあればいいというわけではなく、データの素性、背景なども明らかにしておく必要があるとも述べられました。実例をあげてわかりやすく説明されながら、統計学では平均値を押さえた上で個々の数値を見ていく必要があることも指摘し、線からズレているところに情報があるといわれました。確かにそうです。経験に照らし合わせ、私はなるほどと思いました。

 こうしてみると、データから情報を最大限に引き出すためのスキルの獲得だけではなく、データにはそれぞれ限界があることも知っておく必要があることがよくわかります。それだけに、先ほどの図で示されたような三つのジャンルの専門家がチームワークよく動くことが大切で、互いにリスペクトし合いながらコミュニケーションを取り、目的を遂行していく必要があるのでしょう。

■パネルディスカッション
 基調講演をされた岩崎氏をはじめ、横浜国立大学教授・松本勉氏、国際大学准教授・庄司昌彦氏、株式会社アサツーディ・ケイ執行役員・沼田洋一氏によるパネルディスカッションが行われました。

こちら →
(図をクリックすると、拡大します)

 松本氏は、新しい情報社会は、CPS(Cyber Physical System)とIoT(Internet of Things)で構成されるものだとし、今後は社会科学系に強みを持つデータサイエンティストが必要になってくるといいます。

こちら →
(図をクリックすると、拡大します)

 CPSとは、実世界にある多様なデータをセンサーネットワークで収集し、サイバー空間で大規模データ処理技術等を駆使して分析し、そこで創り出した情報によって社会問題の解決を図るという仕組みを指します。そして、IoTとは、インターネット経由でセンサーと通信機能を内蔵したモノが情報交換をし、相互にコントロールし合うようになることを指します。

 私はこれを聞いてすぐ、自動走行する車を連想しました。センサーと通信機能を備えた車が道路を走ると、周辺を走る車の情報、道路情報などをセンサーが自動的にキャッチし、それらのデータを瞬時に分析して、車にフィードバックし、混雑しない道路の選択、目的地への到着時間などがわかる、といったようなものが事例としてあげられるでしょう。

 データといっても私がかつて行っていたようにデータ入力をヒトが行うのではなく、センサーが自動的に行い、そのデータを通信装置が自動的にクラウドに送信していくのです。それをキャッチしたクラウドが自動的にビッグデータを分析し、そこで新たに創り出された情報が車にフィードバックされるという仕組みです。

 このように様々な領域でセンサーが自動的に収集した膨大な量の情報に基づいて分析しますから、当然その精度も高くなっています。しかも通信機能を通して刻々とフィードバックしていきますから、その都度、修正が加えられていきます。ヒトの手を介することなく、適切な判断が下され、適切に対応されていきます。

 私が調査研究をしていた頃とは、データ収集の方法、そして、データ分析の規模も精度もまったく異なった時代を迎えていることがわかります。

 国際大学の庄司氏は、別の視点からデータサイエンティストに求められるものを提示してくれました。

こちら →
(図をクリックすると、拡大します)

 庄司氏は、上図で示された価値判断、目的の段階で、人文科学の果たす役割があるのではないかといいます。つまり、実際の社会現象についてデータに基づき研究するだけではなく、そこに理念を含めた視点を持ち込んだ研究が必要ではないかというのです。課題を発見し、その解決に向けてデータを活用して分析する場合、現実だけをみていて、果たして、解決できるのかという問題提起です。

 現象を科学的に明らかにするだけでは、あるべきものを探求するための手がかりを得ることは難しいでしょう。ですから、そこになんらかの価値判断あるいは目的設定を行って研究に取り組む必要があるといいます。つまり、実態を単にフォローするだけではなく、解決策が浮き彫りになるよう、デザインという概念を加えて取り組む必要があるのではないかというのです。

 政策に関わる社会科学領域では特にそのような枠組みが必要になってうるのかもしれません。データ分析には認識科学と設計科学の両方が必要だというわけです。

 さて、ビジネス現場の視点から報告されたのが、沼田氏でした。ビジネスには実態を明らかにした上で解決策が求められます。有効な解決策を見出そうとするなら、データの属性や特性、限界性を認識した上でデータを扱う必要があるといいます。一方、物事にはなんらかの視点が組み込まれています。ですから、それら一切を踏まえた上で、総合的に分析結果を解釈していく必要があるということなのでしょう。

 さらに沼田氏は、企業で求められるデータサイエンスには、課題設定をする際、明確な視点が必要だといいます。というのも、データがあって、ロジックもしっかりしているのに、肝心の課題設定ができない若者を多く見てきたからでした。そして、彼らがなぜ課題設定することができないかといえば、想像力が足りないからではないかといいます。データ分析によって明らかになった情報をどのように読み取るかという段階では想像力が必要になってくるのに、想像力が働かないので、適切な課題設定ができないというわけです。

こちら →
(図をクリックすると、拡大します)

 ビジネスの現場で様々な経験をしてこられた沼田氏は、想像力がすべてのビジネスの基礎だといいます。そして、ヒトの活動を想像する力は社会科学を学ぶことによって培われると指摘するのです。ですから、データサイエンティストに求められるのは、データサイエンスのスキルとロジックであり、社会科学によって培われた想像力だというのです。

■トップダウン(仮設構築)式かボトムアップ式か
 最後に、司会者から、データによるモデル化には、仮設構築式分析によるものとボトムアップ式分析によるものがあるが、それらの違いについてどう思うかとパネリストに向けて質問されました。興味深かったのは、パネリストの一人が、ボトムアップ式でもデータからモデルが浮かび上がってくるが、得られた結果について説明可能かといえば、ボトムアップ式だけでは難しいし、非効率だと答えたことでした。予測はできても制御はできないからだというのです。
 
 別のパネリストからは、日々の戦術ではボトムアップ式でやっていくが、ABテストを行いながら、実験的要素を加えていくという意見が出されました。ABテストとはインターネットマーケティングで施策が適切かどうかの判断を行うためのもので、ビジネスの現場ではこれによって日々調整をしているといいます。ネット通販ではABテストを繰り返し行っているそうです。

 こうしてみると、データ量が膨大になったとはいえ、依然としてデータ分析においてこの二つの観点が外せないことがわかります。これは庄司氏が図示した認識科学と設計科学の枠組みの違いとも重なります。二つを切り離して考えるのではなく、相互に補い合いながら実践につなげていくのがいいのかもしれません。

 会場では、データと対峙して研究を実践してきた研究者とデータを駆使してビジネスを展開してきた事業者がそれぞれの立場でデータに関する経験を踏まえ、社会人文科学でのデータサイエンスについての見解を披露されました。とても有意義な講演会だったと思いました。

■大学教育の見直しが必要か?
 2018年11月30日、日経新聞電子版で「文系学生も数学を、経団連が改革案 大学教育見直し提言」という見出しの記事を読みました。その内容は以下の通りです。

***
 大学には文系と理系でそれぞれ偏りすぎた教育内容の見直しを迫る。ビジネスの現場ではシェアビジネスやデジタルマーケティングが広がり、統計などの知識が必要だと考える経営者は多い。データを扱うために「最低限の数学」を学生が学び続けるよう求める。
 理系の学生に対しても「リベラルアーツ(教養)」の充実を求める。グローバルに活動する企業には従業員の国籍が多様になり、他国の文化を理解しながら働く人材が求められる。研究室に閉じこもらず、幅広い視点を持つ人材の育成を目指す。
***

 経団連は、以上のような内容の提言を大学側に向けて行っていくといいます。大学に改革を迫らなければならないほど、デジタル人材が不足しているのでしょう。

 そういえば、文科省は「データサイエンティストを束ねてリーダーシップを発揮できる棟梁レベルの人材が不足しており、その育成は喫緊の課題」だとし、2017年度には人材育成プログラムをスタートさせています。ちなみに、データサイエンティスト人材育成のためのスキームは以下のようなものです。

こちら →
(図をクリックすると、拡大します。日経新聞電子版、2018年4月19日)

 上記の図に示された「棟梁レベルの人材」は、年間500人を輩出していかなければならないほど不足しているようです。

 2017年に文科省のプログラムに採択され、企業と大学が連携して人材育成を推進していこうとしているのが、以下の4つのグループです。

こちら →
(図をクリックすると、拡大します。日経新聞電子版、2018年4月19日)

 東京医科歯科大学のグループが2017年、2018年でそれぞれ64人、60人、同様に、電気通信大学が40人、40人、大阪大学が0人、70人、早稲田大学が120人、70人ですから、2年合わせても464人で、年間必要とされる500人を下回っています。しかも、それぞれ予定、計画、目標値といった文言が添えられていますから、実際の受講生は464人を下回る可能性もあります。

 経団連が2018年11月30日の段階で大学への提言を打ち出したということからは、データサイエンティストの人材育成がスムーズに進んでいない可能性が考えられます。将来を見据えれば、非難を覚悟で、経済界から大学への教育改革を迫らざるをえなくなっているのでしょう。

 一連の流れをみていると、経済界はいち早く時代の変化に立ち向かうのに対し、教育界は経済界から後押しされてもなかなか動かない(動けない)というのがどうやら現実のようです。それは、経済界の競争相手が世界の事業者であるのに対し、教育界の競争相手がごく一部を除き、ほとんどが国内の大学・学校だからでしょうか。あるいは、経済界は判断を誤るとすぐにも倒産しかねないほど早く結果が出るのに対し、教育界は判断を誤ってもそれが判明するのに時間がかかるといった特性のせいでしょうか。いずれにしても、武蔵大学で行われた講演会はタイムリーでとても興味深く、さまざまなことを考えさせられました。(2018/11/30 香取淳子)