ヒト、メディア、社会を考える

データサイエンスの時代、大学に求められるものは何か。

データサイエンスの時代、大学に求められるものは何か。

■武蔵学園データサイエンス研究所設立記念講演会の開催
 2018年11月24日、武蔵大学で「武蔵学園データサイエンス研究所設立記念講演会」が開催されました。

こちら →
https://www.musashigakuen.jp/albums/abm.php?f=abm00012613.pdf&n=181124_%E3%83%87%E3%83%BC%E3%82%BF%E3%82%B5%E3%82%A4%E3%82%A8%E3%83%B3%E3%82%B9%E3%81%AE%E5%B1%95%E9%96%8B.pdf

 武蔵学園では、社会科学、人文科学の視点でデータサイエンス研究を推進することを目的に、2017年に「武蔵学園データサイエンス研究所」が設立されました。ここではデータサイエンスに関する人材育成、研究・教育方法の開発、社会への啓発活動を展開していくといいます。

 「社会科学、人文科学の視点でデータサイエンス研究を推進する」という趣旨に興味を覚え、このシンポジウムに参加してみることにしました。

 当日配布された資料によると、武蔵大学は2014年に社会学部を再編し、新学科を設立する構想を開始しました。2016年には諸状況を考慮し、学科新設ではなくコース新設に当初の方針を変更し、2017年に社会学科、メディア社会学科共通のコースとして新設されたのが、「グローバル・データサイエンスコース」です。この時同時に設置されたのが、「武蔵学園データサイエンス研究所」でした。所長は有馬朗人氏です。

 講演会が始まってまず驚いたのは、有馬朗人氏が開会挨拶のため壇上に立たれたことでした。有馬氏といえば、かつて東大総長であり、科学技術庁長官であり、文部科学大臣であったことは私も知っていました。ところがいま、武蔵学園の学園長であり、今回、設立された武蔵学園データサイエンス研究所の所長でもあるというのです。ずいぶん前に文部科学大臣をなさっていましたから、多分、相当のご年齢のはずです。

 さっそくスマホを取り出し調べてみると、有馬氏はなんと今年88歳でした。すっかり驚いてしまいました。確かに、壇上に上がってこられる際の足元にはややおぼつかない印象がありました。やはりご年齢のせいかと思いましたが、お顔は私がかつて新聞雑誌等で拝見したときのままでした。

 さらに驚いたのは、パワーポイントを使って要領よくデータサイエンス研究所設立の経緯を述べられたことでした。いったん檀上に立たれると、その年齢を忘れさせてしまうほど力強く、張りのある声で会場の参加者たちを引き付けてしまわれたのです。ご自身の経歴とデータサイエンスとの関わりを、ユーモアたっぷりにお話しされるご様子には圧倒されてしまいました。そして、開会の挨拶にふさわしく、ビッグデータはこれまでもっぱら自然科学領域で活用されてきたが、今後は人文社会科学領域で利活用し、その発展につなげてもらいたいと締めくくられたのです。

 たしかに今後、高齢化によって生産年齢人口はますます減少していくことを思えば、社会人文科学領域でのビッグデータの利活用によって社会の維持を図っていくことが必要になるでしょう。この領域でのデータサイエンティストの育成は必須です。

■社会現象をデータ処理すること
 私は大学院生の頃、質問紙調査によって得られたデータを、統計的手法によって分析するという手法で、社会現象を研究していました。1980年代初、実証社会学の領域ではデータ解析にSPSS(Statistic Package for Social Science)を使うのが主流でした。調査票で得られた回答をコーディングシートに書き写し、そのデータをパンチカードに入力し、次にプログラムを入力したカードと合わせてカードリーダーに読み取らせ、集計結果を出していくという方法です。

 当時、大型計算機は拠点校にしか設置されていませんでした。ですから、個々のデータをコーディングシートに書き写すと、わざわざ東京大学の計算機センターにまで出向いて、入力作業、データの読み取り、解析作業を行っていました。入力作業は手作業ですから、当然、打ち間違いがあります。まずは単純集計結果を出してから、データのバグを発見し、修正していく作業が必要でした。よくあるのは、「0」と「O」、「7」と「1」の打ち間違いでしたが、回答肢にない数字を打ってしまうこともよくありました。ヒトが行う作業に完璧はないということを再認識させられたことを思い出します。

 そのようにローデータを丁寧に修正してから、解析作業に入るわけですが、私は、クロス集計をしてからχ二乗検定を行う、あるいは、因子分析を行う、等々の作業を行っていました。χ二乗検定の結果で有意差が出たとき、あるいは、因子分析結果ではっきりとした結果が出たとき、瞬間、なんともいえない嬉しさが立ち上ってきて、これまでの労苦が報われるような思いがしたものでした。

 ところが、帰宅してそれを文章にまとめようとすると、想定内の結果でしかなかったと思うことが多く、次第にこの手法に不満を感じるようになっていました。その後、同じような経験を何度か重ねるうちに、この手法は仮設検証には有効でも、何かを発見するには向かないのではないか、あるいは、社会現象に伴う時間経過の要因を把握するのは難しいのではないか、という思いが強くなっていきました。横断的に収集したデータの限界を感じていたのです。

 そのような私が当時、達した結論は、①少数サンプルで徹底したパイロットスタディを行い、そこで得られた知見に基づいて仮設を立て、調査の枠組みを設計し、構造化された質問票を作成する、②対象を限定し、サンプル数をできるだけ多くする、③コントロールグループを設定し、比較検討できるようにする、というものでした。このような条件の下ではじめて、現実に即した有効な結果が得られるのではないかと思っていました。

 さて、その後、コンピュータの性能は向上し、解析手法の精度も高くなっています。当時とは違って、社会科学、人文科学の領域でデータ活用できる範囲も広がっていますし、データ処理に基づく結果についても信頼度が高まっています。

 しかも、センサーが発達した結果、様々な領域で自動的に収集されるデータが増え続けています。私が調査研究を行っていた頃は数百サンプルのデータを収集しようとすれば、巨額の資金が必要でした。研究助成を申請し、採択されでもしない限り、不可能でした。

 ところが現在、様々な領域でセンサーが自動的に収集する膨大なデータがあります。ビッグデータからは数百サンプルのデータよりはるかに精度の高い結果が導かれるでしょう。これを利活用しない手はありません。しかも、社会人文科学領域でのデータサイエンティストの育成は緒に就いたばかりです。武蔵大學がデータサイエンス領域での人材育成に向けて舵を切り、同時に、研究所を設立して教育、研究、実践に対応しようとされていることは時宜に合っており、素晴らしいと思いました。

 それでは、記念講演会に戻りましょう。有馬氏に続き、武蔵大学学長の山嵜哲哉氏の開会の挨拶が終わると、横浜市立大学データサイエンス学部長・岩崎学氏による基調講演、次いで、専門家によるパネルディカッションが行われました。

■基調講演:「データサイエンスの展開~社会科学分野への提言~」
 岩崎学氏は「統計的データ解析の理論と応用」の専門家で、現在は横浜市立大学データサイエンス学部長です。「データサイエンスの展開~社会科学分野への提言~」と題して、講演されました。

 岩崎氏は、データサイエンティストに求められるのは、〇ビジネス課題を整理し、解決する力(business problem solving)、〇データを分析能力(data science)、〇データサイエンスを意味ある形に使えるようにし、実装、適用できるようにする力(data engineering)、等々だといいます。

こちら →
(図をクリックすると、拡大されます)

 この図で示されるように、社会科学領域ではまず、現実社会の問題点を整理し、課題は何かを発見する能力が必要になります。ビジネスであれ、行政であれ、教育であれ、それぞれの現場で何が課題なのかが明らかになれば、その解決に向けてデータを選択し、それぞれの課題にふさわしい条件下で活用し、分析することができます。

 興味深いのは、データを分析した結果を意味ある形に整理し、実際に使えるようにする実装能力、あるいは、適用能力が必要だと説かれていたことでした。社会現象の説明のためのデータ分析ではなく、社会現象に伴う課題を解決するためのデータ分析が重要だということです。それには、分析結果を踏まえて何らかの社会実装、あるいは社会への適用ができるものでなければならないというわけです。

 岩崎氏はさらに、社会科学には相関関係があっても因果関係があるとは言えないことに留意すべきだとし、そもそもデータさえあればいいというわけではなく、データの素性、背景なども明らかにしておく必要があるとも述べられました。実例をあげてわかりやすく説明されながら、統計学では平均値を押さえた上で個々の数値を見ていく必要があることも指摘し、線からズレているところに情報があるといわれました。確かにそうです。経験に照らし合わせ、私はなるほどと思いました。

 こうしてみると、データから情報を最大限に引き出すためのスキルの獲得だけではなく、データにはそれぞれ限界があることも知っておく必要があることがよくわかります。それだけに、先ほどの図で示されたような三つのジャンルの専門家がチームワークよく動くことが大切で、互いにリスペクトし合いながらコミュニケーションを取り、目的を遂行していく必要があるのでしょう。

■パネルディスカッション
 基調講演をされた岩崎氏をはじめ、横浜国立大学教授・松本勉氏、国際大学准教授・庄司昌彦氏、株式会社アサツーディ・ケイ執行役員・沼田洋一氏によるパネルディスカッションが行われました。

こちら →
(図をクリックすると、拡大します)

 松本氏は、新しい情報社会は、CPS(Cyber Physical System)とIoT(Internet of Things)で構成されるものだとし、今後は社会科学系に強みを持つデータサイエンティストが必要になってくるといいます。

こちら →
(図をクリックすると、拡大します)

 CPSとは、実世界にある多様なデータをセンサーネットワークで収集し、サイバー空間で大規模データ処理技術等を駆使して分析し、そこで創り出した情報によって社会問題の解決を図るという仕組みを指します。そして、IoTとは、インターネット経由でセンサーと通信機能を内蔵したモノが情報交換をし、相互にコントロールし合うようになることを指します。

 私はこれを聞いてすぐ、自動走行する車を連想しました。センサーと通信機能を備えた車が道路を走ると、周辺を走る車の情報、道路情報などをセンサーが自動的にキャッチし、それらのデータを瞬時に分析して、車にフィードバックし、混雑しない道路の選択、目的地への到着時間などがわかる、といったようなものが事例としてあげられるでしょう。

 データといっても私がかつて行っていたようにデータ入力をヒトが行うのではなく、センサーが自動的に行い、そのデータを通信装置が自動的にクラウドに送信していくのです。それをキャッチしたクラウドが自動的にビッグデータを分析し、そこで新たに創り出された情報が車にフィードバックされるという仕組みです。

 このように様々な領域でセンサーが自動的に収集した膨大な量の情報に基づいて分析しますから、当然その精度も高くなっています。しかも通信機能を通して刻々とフィードバックしていきますから、その都度、修正が加えられていきます。ヒトの手を介することなく、適切な判断が下され、適切に対応されていきます。

 私が調査研究をしていた頃とは、データ収集の方法、そして、データ分析の規模も精度もまったく異なった時代を迎えていることがわかります。

 国際大学の庄司氏は、別の視点からデータサイエンティストに求められるものを提示してくれました。

こちら →
(図をクリックすると、拡大します)

 庄司氏は、上図で示された価値判断、目的の段階で、人文科学の果たす役割があるのではないかといいます。つまり、実際の社会現象についてデータに基づき研究するだけではなく、そこに理念を含めた視点を持ち込んだ研究が必要ではないかというのです。課題を発見し、その解決に向けてデータを活用して分析する場合、現実だけをみていて、果たして、解決できるのかという問題提起です。

 現象を科学的に明らかにするだけでは、あるべきものを探求するための手がかりを得ることは難しいでしょう。ですから、そこになんらかの価値判断あるいは目的設定を行って研究に取り組む必要があるといいます。つまり、実態を単にフォローするだけではなく、解決策が浮き彫りになるよう、デザインという概念を加えて取り組む必要があるのではないかというのです。

 政策に関わる社会科学領域では特にそのような枠組みが必要になってうるのかもしれません。データ分析には認識科学と設計科学の両方が必要だというわけです。

 さて、ビジネス現場の視点から報告されたのが、沼田氏でした。ビジネスには実態を明らかにした上で解決策が求められます。有効な解決策を見出そうとするなら、データの属性や特性、限界性を認識した上でデータを扱う必要があるといいます。一方、物事にはなんらかの視点が組み込まれています。ですから、それら一切を踏まえた上で、総合的に分析結果を解釈していく必要があるということなのでしょう。

 さらに沼田氏は、企業で求められるデータサイエンスには、課題設定をする際、明確な視点が必要だといいます。というのも、データがあって、ロジックもしっかりしているのに、肝心の課題設定ができない若者を多く見てきたからでした。そして、彼らがなぜ課題設定することができないかといえば、想像力が足りないからではないかといいます。データ分析によって明らかになった情報をどのように読み取るかという段階では想像力が必要になってくるのに、想像力が働かないので、適切な課題設定ができないというわけです。

こちら →
(図をクリックすると、拡大します)

 ビジネスの現場で様々な経験をしてこられた沼田氏は、想像力がすべてのビジネスの基礎だといいます。そして、ヒトの活動を想像する力は社会科学を学ぶことによって培われると指摘するのです。ですから、データサイエンティストに求められるのは、データサイエンスのスキルとロジックであり、社会科学によって培われた想像力だというのです。

■トップダウン(仮設構築)式かボトムアップ式か
 最後に、司会者から、データによるモデル化には、仮設構築式分析によるものとボトムアップ式分析によるものがあるが、それらの違いについてどう思うかとパネリストに向けて質問されました。興味深かったのは、パネリストの一人が、ボトムアップ式でもデータからモデルが浮かび上がってくるが、得られた結果について説明可能かといえば、ボトムアップ式だけでは難しいし、非効率だと答えたことでした。予測はできても制御はできないからだというのです。
 
 別のパネリストからは、日々の戦術ではボトムアップ式でやっていくが、ABテストを行いながら、実験的要素を加えていくという意見が出されました。ABテストとはインターネットマーケティングで施策が適切かどうかの判断を行うためのもので、ビジネスの現場ではこれによって日々調整をしているといいます。ネット通販ではABテストを繰り返し行っているそうです。

 こうしてみると、データ量が膨大になったとはいえ、依然としてデータ分析においてこの二つの観点が外せないことがわかります。これは庄司氏が図示した認識科学と設計科学の枠組みの違いとも重なります。二つを切り離して考えるのではなく、相互に補い合いながら実践につなげていくのがいいのかもしれません。

 会場では、データと対峙して研究を実践してきた研究者とデータを駆使してビジネスを展開してきた事業者がそれぞれの立場でデータに関する経験を踏まえ、社会人文科学でのデータサイエンスについての見解を披露されました。とても有意義な講演会だったと思いました。

■大学教育の見直しが必要か?
 2018年11月30日、日経新聞電子版で「文系学生も数学を、経団連が改革案 大学教育見直し提言」という見出しの記事を読みました。その内容は以下の通りです。

***
 大学には文系と理系でそれぞれ偏りすぎた教育内容の見直しを迫る。ビジネスの現場ではシェアビジネスやデジタルマーケティングが広がり、統計などの知識が必要だと考える経営者は多い。データを扱うために「最低限の数学」を学生が学び続けるよう求める。
 理系の学生に対しても「リベラルアーツ(教養)」の充実を求める。グローバルに活動する企業には従業員の国籍が多様になり、他国の文化を理解しながら働く人材が求められる。研究室に閉じこもらず、幅広い視点を持つ人材の育成を目指す。
***

 経団連は、以上のような内容の提言を大学側に向けて行っていくといいます。大学に改革を迫らなければならないほど、デジタル人材が不足しているのでしょう。

 そういえば、文科省は「データサイエンティストを束ねてリーダーシップを発揮できる棟梁レベルの人材が不足しており、その育成は喫緊の課題」だとし、2017年度には人材育成プログラムをスタートさせています。ちなみに、データサイエンティスト人材育成のためのスキームは以下のようなものです。

こちら →
(図をクリックすると、拡大します。日経新聞電子版、2018年4月19日)

 上記の図に示された「棟梁レベルの人材」は、年間500人を輩出していかなければならないほど不足しているようです。

 2017年に文科省のプログラムに採択され、企業と大学が連携して人材育成を推進していこうとしているのが、以下の4つのグループです。

こちら →
(図をクリックすると、拡大します。日経新聞電子版、2018年4月19日)

 東京医科歯科大学のグループが2017年、2018年でそれぞれ64人、60人、同様に、電気通信大学が40人、40人、大阪大学が0人、70人、早稲田大学が120人、70人ですから、2年合わせても464人で、年間必要とされる500人を下回っています。しかも、それぞれ予定、計画、目標値といった文言が添えられていますから、実際の受講生は464人を下回る可能性もあります。

 経団連が2018年11月30日の段階で大学への提言を打ち出したということからは、データサイエンティストの人材育成がスムーズに進んでいない可能性が考えられます。将来を見据えれば、非難を覚悟で、経済界から大学への教育改革を迫らざるをえなくなっているのでしょう。

 一連の流れをみていると、経済界はいち早く時代の変化に立ち向かうのに対し、教育界は経済界から後押しされてもなかなか動かない(動けない)というのがどうやら現実のようです。それは、経済界の競争相手が世界の事業者であるのに対し、教育界の競争相手がごく一部を除き、ほとんどが国内の大学・学校だからでしょうか。あるいは、経済界は判断を誤るとすぐにも倒産しかねないほど早く結果が出るのに対し、教育界は判断を誤ってもそれが判明するのに時間がかかるといった特性のせいでしょうか。いずれにしても、武蔵大学で行われた講演会はタイムリーでとても興味深く、さまざまなことを考えさせられました。(2018/11/30 香取淳子)

« »