データサイエンティストとは?必要なスキルや資格、キャリアパスについて解説

2021.09.02

2021.09.02

IT業界のキャリアについて考える


企業のデジタル化を進める上で、今求められているのが「データサイエンティスト」の存在。データを活用する上で欠かせないデータサイエンティストの存在ですが、まだまだその仕事の実態を理解できていない人が少なくありません。
そこで今回は、データサイエンティストの仕事内容から必要なスキル、将来性について解説。DXやAIを活用する上で欠かせない存在であるデータサイエンティストについて、その仕事の詳細を確認していきましょう。

データサイエンティストとは


まずは、データサイエンティストという役割の基本の部分に触れていきましょう。

データサイエンティストの概要

「データサイエンティスト」とは、“ビッグデータ”と呼ばれる膨大なデータ群を分析・解析しながら必要なデータを抽出する、データのプロフェッショナルです。さまざまなデータから企業に必要な情報を抽出する職業ですが、ITに関するスキルだけでなく統計解析やビジネス・市場のトレンドなど、幅広い知識が求められます。

DXの推進や企業のデジタル化を進める上で、“データ”の存在は欠かせないものとなりました。しかし企業が持つデータの資産をうまく活用できなければ、DXやデジタル化の成功はありません。

データサイエンティストは、確実にかつ的確にデータから情報を読み取る役割を担っているため、DX(デジタルトランスフォーメーション)にも欠かせない存在です。これからの時代を生き抜こうとする企業にとって、データサイエンティストの存在は欠かせないものになっていることは間違いありません。

データサイエンティストの最近の動向

「ビッグデータ時代」と言われる今、データサイエンティストは非常に重要な役割を果たしています。リーマンショック以降、企業では効率化を求めながら収益を伸ばしていくというプロセスにシフト。そのためにはコストの削減が避けられませんが、短期間で大幅なコストの削減は現実的ではありません。

こうしてそれまで以上に活用され始めたのが、ITなどのデジタルテクノロジーです。この流れを汲んで、日本企業のデジタル化は急加速。しかし、デジタル後進国と言われる日本では、デジタル化を進めるために必要な人材の不足が叫ばれることとなります。

エンジニア系の技術職はもちろん、ビッグデータ時代を生き抜くために欠かせないデータサイエンティストの確保は必至という状況に。2019年に実施された一般社団法人 データサイエンティスト協会の「データサイエンティストの採用に関するアンケート調査結果」では、データサイエンティストの確保について「目標人数を確保できなかった」と回答した企業が58%に上る結果になりました。

ビッグデータ市場・AI市場はこれからも拡大すると見られており、データサイエンティストの需要はこれからも伸びていくと考えられます。

データサイエンティストの仕事内容


データの解析や分析に欠かせない職業である、データサイエンティスト。具体的には、どのような仕事を行っているのでしょうか。

経営にまつわる課題の把握と戦略の立案

データサイエンティストの仕事は、まずその企業がどのような問題を抱えているのかというところから始まります。企業に対して問題定義を行うわけですが、そのためにはビジネスに対する知識が必要です。

企業が目指すビジネスモデルや経営、事業戦略などの知識を基に課題を洗い出し、どの課題から着手すべきなのかという優先順位を付けます。課題の優先順位付けが終われば、次は課題に対する目標をどのように達成していくのかの明確化。さらに、目標を達成するための仮設を立案していきます。

データサイエンティストという職業が確立する前は、事業企業部門やコンサルティングファームなどがこういった仕事を請け負っていました。しかし、現在は課題の把握から戦略の立案において、データの活用が欠かせません。

データサイエンティストは、より効率よく的確に企業の課題をクリアしていくために仕事を進めていくこととなります。

データの収集と分析

課題と目標が明確になれば、次は必要なデータの収集とそのデータの分析を行っていきます。最初のステップで立てた、“目標達成のための仮設”に必要なデータを収集。収集したデータは、分析ができる形に加工をします。収集するデータは、さまざまな形式で保存されているため、管理・整理しやすくするためにもデータを加工(クレンジング)し、分析しやすい形式にしておかなければいけません。

収集したデータは、そのまま置いておいても何の価値も生まれないため、的確に分析する必要があります。分析のためには、“Python”や“R”などデータ分析のための言語や分析プログラムを活用。ここに至るまでの前段階の準備も、データサイエンティストに求められる仕事の一つです。

データの構造化・管理

収集・分析したデータは、プロジェクト内もしくは企業内で共有されるものとなるため、データサイエンティスト以外の人が見てもわかるような状態にしておかなければいけません。”企業が次にどのようなステップを踏むべきなのか”を提示するために、データの構造化を図り管理することも、データサイエンティストの仕事です。

また、日々変わるデータを収集・蓄積するためには、売上・需要の予測、異常検知、最適化などの作業ができる環境の構築も行なっておかなければいけません。プログラミングを活用した“アルゴリズム分析系”の仕事だけでなく、コンサルの要素が強い“アドホック系”の仕事も行なうこととなります。

レポート作成

データを分析した結果は、レポートの形にして企業へ報告します。データ分析を行うことによって得られた知見をレポートにまとめ、定義された課題に対してその知見をどう生かしていくのかを、企業へ提案。ただ知見をまとめるだけでなく、「データの分析前に立てた仮説に対してどういった結果になったのか」、そして「どういったアクションを取るべきなのか」までを導いてあげることが、データサイエンティストの仕事です。

データサイエンティストに必要なスキル

データサイエンティストの仕事には、幅広い分野の専門知識が求められます。まずは、必要なスキルから確認していきましょう。

ビジネススキル

データサイエンティストは、データ分析だけでなく分析したデータをどのようにビジネスに生かすか考える力が求められる職業です。分析したデータを基に企業の問題を解決するためには、ビジネスに関するスキルも持ち合わせておかなければいけません。

そのためには、一般の人が持っているビジネススキル以上の知識とスキルを蓄え、分析対象となるビジネスについて深く理解しておくことが大切です。また、それぞれの企業のビジネスに関する課題を解決するためには、物事を論理的に考えるための「ロジカルシンキング」や、成果報告のための「プレゼンテーション力」も必要となります。

ITスキル

データサイエンティストとして仕事をするためには、ITスキルを持っていることが前提となります。データサイエンティストは、データのプロフェッショナルとも言える職業です。データの形式統一やデータ分析には、「Python」「R言語」などと呼ばれる“データ解析言語”が用いられるため、プログラミングの知識・スキルがなければ、仕事を進めることができません。

データサイエンティストはビッグデータを取り扱うケースも多いため、大規模なデータを操作するための知識も必要となります。具体的には、「HBase」・「Hive」・「pig」などのオープンソース群に関する知識を要するケースが多いとされています。ビッグデータに関しては今後発展する分野であると言われているため、常に新しい情報を手に入れるための努力も必要です。

また、データサイエンティストがアクセスするデータはデータベースに格納されているため、データベースに関する知識も求められます。SQLでデータを抽出するようなレベルのスキルがあることは当然。データベースのパフォーマンスに関する知識とスキルは、仕事をする上でマストで持ち合わせておかなければいけません。

コミュニケーションスキル

データサイエンティストの仕事は、クライアントの話を聞くことからスタートしますが、そもそも人の話を聞く力がなければ、企業の課題を見つけることができません。データを分析し結果を出すまでは専門的な作業となりますが、導き出した結果をクライアントに提示するときには、誰にでもわかる言葉を使って解説するというスキルが求められます。

ビジネススキルやITスキル、統計解析スキルだけでなく、データサイエンティストとして仕事を進めていくためには優れたコミュニケーションスキルも求められるのです。

データサイエンティストの資格


データサイエンティストは、医者や美容師などのように資格がないと仕事ができないという職業ではありません。知識とスキルさえあれば誰でもなれる職業ですが、それでも持っておいたほうがいい資格があるのは事実です。

では、データサイエンティストが仕事をする上で“持っておくといい資格”・“受けておくといい試験”とはどういったものなのでしょうか。よく挙げられるものをピックアップして、ご紹介します。

基本情報処理技術者試験/応用情報技術者試験

基本情報処理技術者試験/応用情報技術者試験は、ITエンジニアにとっての定番とも言える試験の一つ。すでにデータサイエンティストとして仕事をしている人にとっても、なじみのある試験です。

「基本情報処理技術者試験」と「応用情報技術者試験」は、IT系の資格の中でも珍しい国家資格。応用情報技術者試験は基本情報処理技術者試験の上位資格となるため、基本情報処理技術者試験→応用情報技術者試験の順で受験するのが一般的です。

この試験では、情報処理にまつわる基本理論やプロジェクトマネジメント、SQLなどの幅広い知識について問われます。この試験を合格するということは、ITに関して幅広い知識が習得できていることの証。クライアントから信頼してもらえるデータサイエンティストを目指す上でも、受験しておきたい試験です。

OSS-DB技術者認定試験

特定非営利活動法人エルピーアイジャパン(LPI-Japan)が認定する「OSS-DB(オープンソースデータベース)技術者認定試験」は、民間のIT技術者資格です。この試験ではオープンソースデータベースに関する知識が問われるため、データサイエンティストに必要なデータベースの設計・開発・運用にまつわる知識を効果的に学習できます。

この試験には、「Silver」と「Gold」の2段階のレベルが存在し、「Gold」の受験には「Silver」の合格が必須です。この資格があればデータベース運用に関する知識を持っていることの証明となるため、データサイエンティストとして取得しておきたい資格だと言えます。

統計検定

一般財団法人統計質保証推進協会が実施する「統計検定」は、統計に関する知識とスキルを持ち合わせていることの証明となる資格のひとつです。検定のレベルは4~1級まで準1級を含めて5段階あり、データサイエンティストとして仕事をするためには、準1級以上の合格を目指すといいとされています。

この検定では、“データを分析した結果からどのような結果が読み取れるのか”という、統計学に関する知識が問われます。データサイエンティストに必要な準1級は、大学で学ぶ基礎的な統計学の上を行く、さらに応用的な統計学に関する諸手法の取得が目的。

データの扱いや手法選択に関する選択肢が増えるので、実際にデータサイエンティストとして仕事を進める上でも強みになる資格です。

オラクルマスター

日本オラクル社主催の「オラクルマスター」は、データベースにまつわる資格としてもっともポピュラーです。データベースを管理するための知識とスキルが問われる資格であり、試験は「Bronze」・「Silver」・「Gold」・「Platinum」と4段階設けられています。

データサイエンティストにとって、データベースにまつわる知識とスキルの習得は欠かせません。オラクルマスターの資格取得のためには、データベース管理についての概要やSQLのデータ抽出などについて学習することとなります。

受験に関してはBronzeから順にレベルアップしていく形になるため、まずはBronzeの合格を目指しましょう。

データスペシャリスト試験

IPA情報処理推進機構が実施する「データスペシャリスト試験」は、データベース設計や運用の管理に特化した国家資格。データサイエンティストに必要な資格の一つ目にご紹介した「応用情報技術者試験」よりも、さらにレベルの高い試験として知られています。

民間資格ではないため、特定のシステムについての知識だけを問われるわけではなく、プロジェクト管理や情報分析などデータベースにまつわる一般的な問題が出題されます。この試験をクリアすれば、データベースを扱う専門家として認知されることとなるため、データサイエンティストとして仕事をする上で強みとなることでしょう。

G検定/E資格

一般社団法人日本ディープラーニング協会主催の「G検定」・「E資格」は、ディープラーニングの基礎知識やディープラーニングの理論を知るための資格です。G検定はジェネラリストのための、E資格はエンジニアのための資格として知られていますが、機械学習・深層学習についてはデータサイエンティストにとっても核となる部分であるため、受験しておいて損はありません。

G検定・E資格はそれぞれセットで紹介される機会が多く、それぞれデータサイエンティストに必要な資格として紹介されることも少なくありませんが、一部ではG検定の受験について優先度を下げてもいいという考えを訴えているケースも。G検定はディープラーニングの基礎知識のみを問う検定であるため、実際に分析業務を行うとなった場合には活かしにくいという声があるのも事実です。

データサイエンティストとしてどのような業務につくケースが多いのかを意識しながら、G検定・E資格の受験について検討してみるといいでしょう。

Python3 エンジニア認定データ分析試験

一般社団法人Pythonエンジニア育成推進協会実施の「Python3 エンジニア認定データ分析試験」は、データサイエンティストにとって身近な言語である“Python”についての知識が身に付く資格です。

この試験に合格することで、Pythonを用いたデータ分析の知識とスキルの習得が可能。試験自体の難易度はそれほど高くないという意見もありますが、データサイエンティストとして仕事をする上で知っておくべき内容が詰まっています。

統計士/データ解析士

「統計士」・「データ解析士」の資格は、一般財団実務教育研究所が実施している通信講座「現代統計実務講座」の受講・修了で手に入ります。実務においてデータや統計を扱うデータサイエンティストにとって、比較的身近な資格です。

講座の内容も初心者向けになっているので、データサイエンティストの卵にもおすすめの資格だと言えます。

【業界別】データサイエンスの活用シーン


データサイエンティストとはデータサイエンスに取り組む人のことを指す言葉ですが、そもそもデータサイエンスはどのような場面で活用されているのでしょうか。各業種別に、活用シーンをご紹介します。

流通・小売業

流通・小売業界では、「いつ」・「だれが」・「どのようなタイミングで」・「何を買ったのか」の情報を収集し、顧客一人ひとりの特性を把握するためにデータサイエンスが活用されています。

このような情報を収集することで、顧客一人ひとりによって異なる興味のある分野や嗜好性、行動パターンの認識ができるようになります。そのデータをもとにクーポンを発行したり、おすすめ商品を画面上に出したりすることで顧客の購買意欲が高まり、販売促進効果が上昇。

SNSに投稿されている内容とWeb上での行動データを組み合わせて、未来のトレンドの予測もできるようになっています。

金融業

金融業界では、株式データ・為替データと世界の経済指標を組み合わせ、株価や為替の予想のためにデータサイエンスが用いられています。数秒後の予想だけでなく長期的な予想も可能となるため、売買から銘柄選びまでAIが予想するというサービスも誕生しました。

また、顧客に対してだけでなく、金融業界で働く人に向けてもデータサイエンスが力を発揮。証券会社では、取り扱う商品の幅が広い上に顧客によってリスク許容度や購入に充てる金額、売買回数なども異なることから、営業スタッフの負担が大きいとされていました。

そこでデータサイエンスを用いて過去の売買実績などのデータを分析し、期待販売額のリストを作成。結果、営業の効率化につながったというケースもあるようです。

飲食業

飲食業においても、データサイエンスが活用されています。飲食業では、POSのデータや過去の売り上げデータをもとに売り上げ予測を立てていました。データサイエンスを用いることで、検索サイトへのアクセス数、天気や気温のデータなどのデータを分析することが可能となり、より正確な売り上げ予測が立てられるようになっています。

また、予約サイトからのキャンセル率を高度に予測するようなシステムも登場。予約サイトから予約を入れた人の性別や年齢、人数、サイト上でどのような行動を取っているかなどのデータを基に、その人がキャンセルする確率を予測。

キャンセルはお店の売り上げにも影響を与えるため、画期的なシステムとして活用されています。

不動産業

不動産業界では、データサイエンスを用いて不動産価格の査定や物件の価格推移予測、不動産投資用物件の価値の予測などが行われています。ビッグデータを基にAIを活用し、最適な募集賃料を算出したり、改修工事に投資する効果を予測したりするサービスも。

上記のようなサービスは不動産営業の効率化にも役立っており、データサイエンスの力は不動産業界の支えにもなっていることがわかります。

医療

統計学の重要性が古くから認められている医療の分野でも、データサイエンスが活用されています。画一的な医療が行われてきた今までに対し、データサイエンスが活用され始めてからは、個人差にフィットした医療の提供が可能に。優れていると言われる医薬品でも、人によって効果・副作用の表れ方はさまざまです。画一的な医療を行っているときに見えていた課題に解決の糸口を見出したのも、データサイエンスの力があってこそだと言えます。

また、画像解析技術やAIと言ったデータサイエンスを用いて、遠隔手術の実現にもトライ。まだ実用段階には至っていないものの(2021年7月現在)、医師が遠隔で操作するロボットによる手術が実現する日は、もうそこまで迫っているようです。

データサイエンティストの収入やキャリアパス、将来性

引く手あまたの状況が続いているデジタル人材ですが、データサイエンティストの年収やキャリアパス、将来性についてはどのような状況になっているのでしょうか。

データサイエンティストの平均年収

平均400~500万円の年収とされている一般的なエンジニアに比べ、データサイエンティストの平均年収は600~700万円とされています。月額にすると40万円前後となり、専門的な知識が求められる分、他の職種に比べるとやや高い水準であることがわかります。

より高いスキルや専門的な知識のある人に対しては、年収1,000万円以上を提示する企業も。データサイエンティストを確保したい企業は少なくないため、知識とスキルが身に付けば安定した収入が得られる職業であると言えます。

データサイエンティストの将来性

AI戦略を立てたり、DX推進を計ったりとデジタルに力を入れ始めている日本。AIやビッグデータなどの活用のためには、データサイエンティストの存在が必要不可欠です。経済産業省の試算では、IT人材は専門性の高い職業であることから他職種からの流入が見込めず、需要ギャップを埋めることが難しいとされていることから、これからもデータサイエンティストの存在は貴重なものになると考えられます。

このような背景から、高等教育機関ではデータサイエンスにまつわる専門学部を立ち上げるところも。2013年には「日本データサイエンス協会」も発足し、日本国内でも積極的にデータサイエンティストを増やそうという動きがみられます。

また、アメリカではデータサイエンティストが“将来性のある職業ランキング”の1位を獲得。日本はもちろん、世界的にみても将来性のある職業であると言えるのではないでしょうか。

データサイエンティストのキャリアパス

データサイエンティストとして仕事ができるようになると、キャリアパスの選択肢も増えていきます。よく挙げられるものとしては、PM(プロジェクトマネージャー)やITコンサルタント、グロースハッカー、経営コンサルタントなど。ITに関する知識とスキルはもちろん、データサイエンティストとして働くためにはビジネスに関する知識も求められるため、ITを始めとした分野で重宝されることは間違いありません。

データサイエンティストは比較的新しい職種であることから、代表的な例として挙げたキャリアパス意外にも選択肢が増えていく可能性は高いと言えます。自分で新しい道を切り開きたいという人にも、やりがいのある仕事です。

まとめ

ただITの部分に向き合うだけでなく、ビジネスの部分とも密接な関係にあるのがデータサイエンティストという職業の特徴。まだまだ発展の余地がある職種であるため、未知数の可能性を秘めている職業だと言えるのではないでしょうか。

これからもしばらくは、貴重な存在となるであろうデータサイエンティスト。他の職種ではできないようなおもしろい仕事に挑戦できる職種であることは、間違いありません。

Fabeee編集部

Fabeee編集部

こちらの記事はFabeee編集部が執筆しております。