データサイエンティストが磨くべき4つのスキル

サマリー:データサイエンティストの役割は、データ分析や優れたモデルの構築と考える人は多いだろう。しかし実際、その役割は問題解決や戦略、意思決定などを含む、とても広範なものである。本稿では、現在と未来のデータサイ… エンティストがビジネスに最大の価値をもたらす能力を磨くうえで役立つ、4つの重要なスキルと能力分野から成るフレームワークを紹介する。

データサイエンティストが能力を見直すフレームワーク

筆者は年に一度、データサイエンティスト志望者向けの講座を担当する。初回の授業の冒頭で、学生たちに何を学びたいか尋ねる。彼らの答えは「データ分析」や「優れたモデルの構築」が多い。

これらの反応を、筆者が主催する現役データサイエンティスト向けのワークショップと比べてみよう。彼らは仕事について議論する時、学生たちとは異なる言葉を使い、自分たちの仕事を「問題解決」と呼ぶ。方向性は正しいが、彼らの役割を表すにはこれでも限定的すぎる。

農業や製造業、ヘルスケア、金融サービスなどさまざまな業界で、データとアナリティクスへの依存が増し続けている。このため次世代のデータリーダーは、戦略、意思決定、オペレーションやその他無数の機能に影響を及ぼす広範な役割を担うことになるのは明らかだ。

筆者はこの新たな人材の育成を後押しするために、現在と未来のデータサイエンティストがビジネスに最大の価値をもたらす能力を磨くうえで役立つ、4つの重要なスキルと能力分野から成るフレームワークを考案した。これは、データサイエンスの仕事が重要かつ不可欠であると事業部のリーダーに認識させることで達成される。

現役のデータサイエンティスト、および今後この分野に進む人は、このフレームワークを用いるとともに、個々の事業分野で何が必要なのかに関する理解を深めることで、自分の知識と経験がどの程度なのか、そして強化すべき点はどこかを把握できる。

1. 問題の発見:真の問題を見極める

データリーダーは事業全体のアナリティクスを詳細に探る中で、ほぼすべてのオペレーションと機能を間近で見ることになる。このため、問題解決だけでなく、新たな問題の発見にもつながる独特の視点を持つことができる。

実例を見てみよう。ある中級ホテルチェーンのゲストリレーションズ(コンシェルジュ)責任者は、チェックイン手続きの評価が低いことで経営上層部から厳しく批判されていた。アンケートによると宿泊客は、チェックインの対応がお粗末で時間がかかりすぎ、望み通りの結果、つまりシームレスで快適な体験が提供されなかったと感じていた。また、チェックインを低く評価した人は、ホテルへのリピート率が低いことも経営陣は発見した。

ゲストリレーションズ部門はチェックインの問題の根本を明らかにすべく、データ分析チームに接触した。宿泊客の人口統計的属性、希望する客室タイプ、チェックインした場所がフロントか、セルフチェックイン端末か、スマートフォンか、一日のどの時間か、一年のどの時期か、ロイヤルティプログラムの加入者か否か──これらを調べた後でも、データチームは根本原因を突き止められなかった。

すると一人の従業員が、継続的に回収されている宿泊客アンケートを調べることを提案した。自然言語テキスト分析を何度か行うと、あるテーマが見えてきた。それは、ホテルのインフラが最適ではないということだ。Wi-Fiがつながりにくい、ルームキーが時折機能しない、家具が壊れている、到着時に部屋がきれいではない、といった問題に宿泊客は遭遇する可能性があった。

これらの問題はチェックインと直接関係はなかったが、宿泊客はチェックイン手続きを記憶に残していたため、問題をチェックインに結びつけたのである。結果的に、問題はチェックイン手続きではなく、ホテルの管理状態であった。

要点:目の前にある問題の解決は、ほかの方法による事業改善の機会を逃すことにつながる場合がある。

データを扱う人は、事業のさまざまな側面に関する深くユニークな洞察に触れる機会が多い。データリーダーが問題発見の達人になるためには、全体像をとらえて深い洞察を得ると同時に、事業リーダーにとっての最重要事項に関して透明性を高める必要がある。それによって、通常ならば見落とされる問題を発見して価値をもたらすことができる。

2. 問題の範囲の設定:明確さと具体性を高める

問題が見つかったら、次のステップではその範囲を決定する。つまり、問題の性質と、その解決に分析がどう役立つのかを明確にする。これが特に重要となるのは、事業リーダーがデータチームに持ちかけてきた懸念や課題が漠然としている場合だ。

筆者の授業とワークショップでは、エクササイズを通じて範囲の設定を練習する。まず、製品や戦略やマーケティングのリーダーの役を筆者が引き受け、明確に定義された問題を頭の中で設定しておく。たとえば、筆者は顧客管理の担当者で、どの顧客がネット・プロモーター・スコア(NPS)を低くつける可能性があるのかを特定し、介入によって彼らの体験を改善したいと望んでいる。

合理的なデータサイエンティストであれば、この問題を解決するために適切なデータとデータサイエンスの手法をどう選べばよいかがわかる。ところが事業リーダーは、上記のような言葉で説明することはめったにない。したがって筆者は、大げさな業界用語と過度に一般的な言葉を使って問題の範囲を設定する。たとえば次のような具合だ。

「我々は顧客満足度に関する目標の達成に苦労していて、市場進出戦略に焦点を絞る必要があります。パイプラインの問題かもしれませんが、連携がないのです。正しいサンドボックスを用いているは思います。後はただ『誰』と『なぜ』を知る必要があります。どうでしょうか」

データサイエンティスト役の学生が、明確にするための問いかけを練習する。おそらく最初は、「『連携』とはどういう意味ですか」「顧客満足度の目標はどのように測定していますか」「成果の有無を示す指標は何ですか」などだろう。

その後に続くのは、データ分析のツールとコンセプトによって解決可能な、明確に定義された問題を形成するための情報を引き出す反復的なプロセスだ。

筆者が最高アナリティクス責任者としてクライアントと仕事をする中で、最も重要な、そして困難な部分の一つは、事業リーダーの頭の中に何があるのかを理解し、それを範囲が明確なビジネス課題に変換することだ。詳しく探るための質問のチェックリストを筆者は用意しており、たとえば以下が含まれる。

・私たちが解決しようとしている問題は、具体的に何なのか。

・どの結果が改善すれば、問題が実際に解決されたことになるのか。

・問題を解決するためにどのデータが入手できれば理想的なのか。実際に入手できているデータはどれか。

・分析を行うことで、どのように解決につながるのか。

最後の問いに答えることは、間違いなく最も重要な部分である。これにより、適切な分析手法──いくつかの単純な洞察を引き出せばよいのか、より本格的な予測モデルや因果推論モデルを用いるのか──が決まるからだ。

ここで筆者は、多くの仮定シナリオを事業チームと一緒に駆け足で考えていく。「もし分析の結果がこれを示したら、またはあれを示したら、どうなるのか。それはよりよい意思決定にどう役立つのか」などだ。

事業リーダーは往々にして、このような問いを後回しにして、分析結果さえ出ればアクションを検討できると言う。それは間違っている。分析がどのように解決につながるのかを知っておくことは、分析計画を立てるうえで重要な要素なのだ。

要点:データリーダーが問題の範囲設定に秀でるためには、優れたコミュニケーション能力が必要だ。問題について事業リーダーと話し合い、データ分析のツールとコンセプトで事業に有意義に貢献するために不可欠な具体性を得ることが求められる。そのうえで初めて、問題をデータチームが引き継いで分析できるようになる。

3. 問題への誘導:最新情報を提供し、フィードバックを集める

問題が特定され精査された後、データアナリストの多くは隔離状態に入り、解決策を見つけた時にようやく姿を現す。このやり方には大いに問題がある。最大の効果を上げるためには、分析のプロセスで十分な情報共有と期待の設定が求められる。筆者はこれを、問題への誘導と呼んでいる。

データリーダーは、データチームが分析の中間結果を事業チームに提供することにさらに慣れるよう後押しする必要がある。それにより、毎回のやり取りはフィードバックを集める機会となる。たとえば、「これらの初期結果は、事業チームにとって興味深いものですか」「我々は用語を正しく定義していますか」といった具合だ。プロジェクトが完了するまで、最新情報が提供されるたびに分析結果がまとめられ、逐次更新されていく。

このアプローチは、一部のデータサイエンティストが好むやり方とは相容れない。彼らは時として、自分のモデルと創造的な問題解決手法に夢中になり、大発表がしたくてたまらなくなる。

だが、「大発表」は悪しき慣行であり、逆効果になりかねない。最終プレゼンでのサプライズが大きすぎると、聞き手は身構えてしまう可能性がある。なぜなら、人は予想外の結果に遭遇すると、その根底にあるデータと手法を疑問視し始める場合が多々あるからだ。

すべてのデータモデルは前提条件を必要とする(欠損データにどう対処するのか、異常値をどう処理するのか、など)。分析に積極的に取り組んでいるデータチームが、前提条件の開示と議論を事前に行わずに最後に回す場合、事業チームは疑問を積み重ね、欠点をあら探しするだろう。反対に事業チームを意思決定の過程に引き込めば、彼らは結果を受け入れて信頼してくれるはずだ。

多くの事業リーダーは、最良の最終データ成果物は驚かされるようなものではないと筆者に語っている。彼らは最初からデータチームと緊密に連携しており、最終的な成果物やプレゼンは現在までの取り組みの集大成にすぎない。問題に誘導して賛同を得るには、データサイエンティストに求められる難しい選択を明示して協働する必要がある。

要点:問題への誘導とは、定期的に最新情報を提供して事業チームからフィードバックを集めるプロセスを設けることだ。この分野に秀でたデータサイエンティストやデータチームのリーダーは、最終成果物が事業チームの要求を──驚かせることなく──満たすよう万全を期すための、率直な議論を奨励し促進することができる。

4. ソリューションの翻訳:聞き手にわかる言葉で話す

この段階で、問題からソリューションへと移行する。その成否は、データリーダーとチームが1~3のステップをどれほどうまく実行したかによって決まる。データチームは最終的な答えを決めるだけでなく、理解可能な、ひいては実行可能なソリューションを提供しなくてはならない。

これは、単にデータをチャートやその他のビジュアルで表示することではない。ソリューションがデータからの洞察であれ、モデルで推奨された一連の新たな行動方針であれ、それを事業チームにとって理解可能な言葉で伝える必要がある。

筆者が推奨する手段の一つは、解決すべき問題の最も重要な要素を2ページにまとめたデータ分析メモだ。データチームが作成しがちな長大なリポートに比べればなおのこと、2ページはかなり簡略と思えるかもしれないが、この秘密兵器の威力は簡潔さにこそある。

2ページという制限によって、データ分析の詳細を長々と述べたくなる衝動を抑えることができ、推奨事項とその根拠に焦点を絞りやすくなる。短いメモを提唱するのは、もちろん筆者だけではない。アマゾン・ドットコム創業者のジェフ・ベゾスは幹部らに対し、アイデアをパワーポイントによるプレゼンではなく、簡単に理解し議論できる6ページのメモで提示するよう義務づけた。

要点:ソリューションの翻訳においてデータリーダーに求められるのは、一歩引いた視点から、自分たちの分析と推奨によって最大の効果をもたらす方法を検討することだ。この分野に秀でたデータリーダーは、複雑さに屈することなくシンプルな言葉を使うことで、エレベータースピーチと同等に説得力があり理解しやすい形でソリューションを説明し、事業リーダーの関心を引きつけることができる。

データとアナリティクスがますますビジネスの意思決定とソリューションに組み込まれる中、データチームは単に割り当てられた問題の解決に留まっていてはならない。むしろデータリーダーとチームは、「コラボレーションとコミュニケーション」という言葉を強く意識する必要がある。

すなわち、真の問題を発見し、問題の性質と重要性を明らかにし、定期的な最新情報の提供を通じてプロセスを誘導し、真に効果をもたらすソリューションの提供と翻訳ができるよう、より幅広い役割に熟達することが求められるのだ。

Original Post>

Leave a Reply