ビッグデータ社会の有望な職業に求められるスキル
ビッグデータ社会に求められる職業として挙げられるのは、
データサイエンティスト、データアナリスト、データアーキテクト、プログラマー等です。
求められるスキルとして、「R」と「Python」があります。
どちらもデータ分析(アナリシス)の分野で人気のオープンソースのプログラミング言語。
データサイエンティスト、データアナリスト、データアーキテクト、プログラマー等です。
求められるスキルとして、「R」と「Python」があります。
どちらもデータ分析(アナリシス)の分野で人気のオープンソースのプログラミング言語。
2013年のデータサイエンス年収調査によると、オープンソースツールの知識/経験ありの
データサイエンティストの年収は、$13万(米ドル)、市販ソフトの経験者は$9万ドル(米ドル)と
年収に4万ドルの開きがありました。
オープンソースを学ばない手はありません。
データサイエンティストたちも、RとPythonのどちらを選択すべきか悩むところです。
そこで、両方の特長をまとめてみました。
データサイエンティストの年収は、$13万(米ドル)、市販ソフトの経験者は$9万ドル(米ドル)と
年収に4万ドルの開きがありました。
オープンソースを学ばない手はありません。
データサイエンティストたちも、RとPythonのどちらを選択すべきか悩むところです。
そこで、両方の特長をまとめてみました。
Rの特長:
- ユーザーフレンドリーなデータ分析(アナリシス)、統計、グラフィックモデルを重視。
- 動きが重い。
- もともとは研究機間や大学で使われていましたが、ビジネス業界へと浸透してきました。統計やリサーチ、データサイエンスの分野に深く入り込めば入り込むほど、R贔屓(びいき)になってくる言われています。
- サポートコミュニティーが充実。研究者(リサーチャー)、データサイエンティスト、統計学者、金融市場アナリストが中心。
- 一旦、基本を理解すると、上級レベルへの応用が楽にできますが、最初は本気で学ぶ努力が必要。
- 統計、データ分析、マシーン ラーニング (ML:人工知能の一種)に特化。
Pythonの特長:
- 生産性(軽い)とコードの分かりやすさ。
- データアナリシスや統計分野に応用したいプログラマーたちが、データサイエンス分野で利用しています。
- 一般的なコーディングに関するサポートが充実。プログラマー/開発者中心。コーディングやデバグが簡単。
- プログラマーとしてデビューするには、お勧め言語とも言われています。
- ウェブアプリと統合してデータを分析しなければならない場合は、一般的にPythonが用いられています。統計コードを本番データベースに組み入れる場合も同様です。
- データアナリシスに使えるようにするには、NumpyやPandasと使わなければなりません。
- データサイエンティストの採用や育成に余裕のない企業の導入が盛んです。(現状は、データ サイエンティスト自体が不足しています。)
お勧めコース
Udemyの数多いコースの中から、コース内容、レベル、構成、講師、聴き取り易さ、受講生の評価(レビュー)から厳選しました。
講師につきましては、実社会でのデータサイエンティスト、統計分野のプロとしての経験や講師経験を考慮しました。
Udemyコースは、外出先からでも、iPhoneやAndroidから簡単にアクセスできます。
どのコースも、購入後、30日間はキャンセル可能。全額返金されます。
また、その道のプロが指導していますので、無駄無く効果的に学べるようにデザインされています。
また、ビデオですので、途中でポーズを入れたり、自分のペースで進めることができます。
講師のソーシャルサイト(LinkedIn:プロフェショナルのソーシャルネットワークサイト)と繋がり、
その道のプロたちと世界にネットワークを広げていくことができます。
Udemyの数多いコースの中から、コース内容、レベル、構成、講師、聴き取り易さ、受講生の評価(レビュー)から厳選しました。
講師につきましては、実社会でのデータサイエンティスト、統計分野のプロとしての経験や講師経験を考慮しました。
Udemyコースは、外出先からでも、iPhoneやAndroidから簡単にアクセスできます。
どのコースも、購入後、30日間はキャンセル可能。全額返金されます。
また、その道のプロが指導していますので、無駄無く効果的に学べるようにデザインされています。
また、ビデオですので、途中でポーズを入れたり、自分のペースで進めることができます。
講師のソーシャルサイト(LinkedIn:プロフェショナルのソーシャルネットワークサイト)と繋がり、
その道のプロたちと世界にネットワークを広げていくことができます。
講師たちもその道の経験者です。誰にでも第一歩の時がありました。
ネット上に溢れるオープンソースに関する情報は、効率良く学べるように構成されていません。
その経験を活かし、学習効果を高めた無駄のないコースに構成されています。
各コースともレクチャー毎に所要時間も記載されています。
最初の30日間を有効に利用して、その期間内にしっかりコースとの相性を判断してください。
コース内で使用している言語が英語のコースを紹介したいのは経験上のことです。
このようなコースに興味をお持ちの方は、キャリアアップ志向が高い、既にIT業界でお仕事中、あるいは、英語が分かり新しい分野で活躍したいと思っておられる方々と考えられます。
特に、IT系の仕事に携わっていらっしゃる方にとっては、専門分野ですので、想像した以上にすんなりと英語が理解できるものです。
専門用語も聞きなれた英語が数多く出てきます。
キャリアアップと共に、プロジェクトチームとのコミュニケーションも英語が普通になってきます。
学ぶ時点から英語でインプットすると、今後の英語でのコミュニケーションが楽になります。
まずプロフェショナルとして必要になってくるのは、技術的なレベルのコミュニケーションです。
英会話スクールで学ぶ英語の場合は、英会話講師陣に、現場で必要な専門分野(データサイエンス等)の英語によるコミュニケーションを期待できません。
ネット上に溢れるオープンソースに関する情報は、効率良く学べるように構成されていません。
その経験を活かし、学習効果を高めた無駄のないコースに構成されています。
各コースともレクチャー毎に所要時間も記載されています。
最初の30日間を有効に利用して、その期間内にしっかりコースとの相性を判断してください。
コース内で使用している言語が英語のコースを紹介したいのは経験上のことです。
このようなコースに興味をお持ちの方は、キャリアアップ志向が高い、既にIT業界でお仕事中、あるいは、英語が分かり新しい分野で活躍したいと思っておられる方々と考えられます。
特に、IT系の仕事に携わっていらっしゃる方にとっては、専門分野ですので、想像した以上にすんなりと英語が理解できるものです。
専門用語も聞きなれた英語が数多く出てきます。
キャリアアップと共に、プロジェクトチームとのコミュニケーションも英語が普通になってきます。
学ぶ時点から英語でインプットすると、今後の英語でのコミュニケーションが楽になります。
まずプロフェショナルとして必要になってくるのは、技術的なレベルのコミュニケーションです。
英会話スクールで学ぶ英語の場合は、英会話講師陣に、現場で必要な専門分野(データサイエンス等)の英語によるコミュニケーションを期待できません。
Python中級者レベルを目指したい人(データ アナリシスとビジュアライゼーション)
プログラミングの未経験者から上級者までを対象にした、Python中級レベルを目指すコースです。
- コース名:Learning python for Data Analysis and Visualization
- 講師:Jose Portilla(データサイエンティスト)。Santa Clara University(学士と修士) メカニカルエンジニアリング卒業。在学中、同大学で3年間のティーチングアシスタント(教授アシスタント講師)経験。
- 受講者対象レベル:プログラミング初心者から上級者まで。
- 受講者数:11036人
- レビュー(評価者140人):5点満点中4.8点
- レクチャー数:106(19.5時間)
- 合計時間:20時間
- $199(米ドル)
受講に必要な条件:
- 数学の基礎知識
- コンピューター(Mac、Windows、Linuxのいずれか)
- 学びたい意欲
このコースで学ぶこと:
- 中級レベルのPythonプログラミングのスキルを習得。
- Python用iPython Notebook環境を利用。
- Numpyライブラリーを使ってアレーを作成して操作。
- PandasモジュールとPythonを用いてデータの作成と構成。
- Pythonでのフォーマットの異なるデータ(JSON、HTML、MS Excelワークシート)の使い方
- Pythonでmatplotlib seabornモジュールを使って、データビジュアライゼーションの作成
- いろいろなデータ アナリシス プロジェクトのポートフォリオを作る
対象者:
- Python、データサイエンス、データビジュアライゼーションについて学びたい人。
- プログラミングの経験が全くない人から、Pythonの知識がある人まで。
- 急速に成長しているデータサイエンスの世界に興味のある人。
Python初心者コース
いきなり中級レベルまで目指したくない、あるいはその必要がない人向けです。
- コース名:Python Programming for Beginners
- 講師名: Stone River eLearning - Online Technology Bootcamp
- 受講者対象レベル:これから新しく学びたい初心者向け
- 受講者数:23270
- レビュー(評価者185人):4.4点/5点満点
- レクチャー数:26(3.5時間)
- 合計時間:4時間
- $99(米ドル)
このコースで学ぶこと:
- Pythonコードの基本を理解して実行する。
- プログラミング概念の基礎知識を得る。
- リアルな世界のPythonプログラムを作り実行する。
対象者:
- プログラマー
- プログラミングを学びたい人
- ウェブアプリケーションを作りたい人
- Python開発者
データサイエンスの分野に足を踏み入れた人たちが、R寄りになる結果が下記のグラフに表れています。
Pythonは、2000年初期からほぼ、横ばいの数値ですが、Rに関しては、ジワジワと検索が増加の傾向を辿っています。
現状は、データサイエンティストが不足しています。
それを補うようにプログラマー等のコンピューター系の技術者たちがPythonを修得しています。
そして、データサイエンスの業界に参入し、経験を積むにつれ、Rに興味を持ち出していると解釈されます。
Pythonは、2000年初期からほぼ、横ばいの数値ですが、Rに関しては、ジワジワと検索が増加の傾向を辿っています。
現状は、データサイエンティストが不足しています。
それを補うようにプログラマー等のコンピューター系の技術者たちがPythonを修得しています。
そして、データサイエンスの業界に参入し、経験を積むにつれ、Rに興味を持ち出していると解釈されます。
Rの基礎コース
実社会で即戦力をつける基礎コースです。
実社会で即戦力をつける基礎コースです。
このコースで学ぶこと:
- 実際に受講生のコンピューターにRをダウンロードしてインストールする方法。
- アナリティクスでのRの使い方。データマイニング/分析業務に用いる各オブジェクトタイプについて。
- 統計データにおけるRの使い方。
- グラフィックスでは、二次元的(平面的)グラフのプロットのフォーマットについて。
- Rのエキスポートとファンクションの作成。
- 各レッスンは、動画(ビデオ)、エキササイズ(練習)シート、エキササイズ動画と解答から構成。
- R初心者にわかり易い表現で説明し、Rの基本として十分な内容を網羅。
- 約140問の練習問題は、実社会のデータに基づいており、即戦力をつけます。
受講に必要な条件:
対象者:
- Windows/Mac/Linuxのいずれか
- 数学(ベクトル、行列、代数)の基礎知識
- 統計学(確率分布、一次モデリング等)の基礎知識
対象者:
- 企業内のデータアナリスト
- 学生
- データマイニング、統計学、データ ビジュアライゼーションに興味のある人