書評: Pythonによるあたらしいデータ分析の教科

とあるキャンペーンにて、物理本を無料でプレゼントで頂いたので。

(一応電子版は自費で買った)

 

Pythonによるあたらしいデータ分析の教科書 (AI&TECHNOLOGY)
 

 

目次
第1章 データ分析とは
第2章 Pythonと環境
第3章 数学の基礎
第4章 ツールの基礎
第5章 応用:データ収集と加工

 

 

対象読者

Pythonの文法がある程度わかっている人。

 

学べること。

科学技術計算でよく使われている以下のライブラリについて、基本的な使い方が学べる。

Numpy : 効率的な多次元配列の計算

Pandas: 表形式のデータの加工

Scikit-learn: 機械学習

 

良いところ

・環境構築についてはPython標準の仮想環境の作り方が丁寧に書いてあって結構好感が持てた。

 この手の教科書で多いのが、「Anacondaで一発」とか「Colabでok!」なので。

 

・最初にNumpy, Pandas, Scikit-learnを学ぶのだったら、これぐらいの内容を知っておけば、あとはググったり、ドキュメントを読めばなんとかなるかなあ…ぐらいの内容がコンパクトにまとまっている。

 

・情報量がそこまで多くないので、Numpy~Pandas にあまり詳しくない人が、頭から順番に読んでいくとGood。(ある程度詳しい人が読むと、情報量が少なくて辞書的な使い方もできないので、少し残念になる)

 

・「Python3エンジニア認定データ分析試験」の教科書。

  →一応、受かった。

 

ちょっと残念なところ

・「Pythonの文法」と「数学の基礎」の情報が断片的過ぎて、使いどころがよく分からない。

三角関数」、「微積」、「統計(正規分布など)」、「グラフの種類」 etc.のような情報を20ページほどでまとめても、知っている人(高校で数3Cを勉強した人)には簡単すぎるし、知らない人には、別の教材を使って勉強したほうが、わかりやすいと思う。

 

・Scikit learnのデータセットがiris or 乱数

     一応bostonのデータセットも扱っていてはいたけど。

     digitsとかwineとかもう少し色々使ってみてもよい気がする。

 

・Scipyに関する話題がほぼゼロ。

 Scipy重要だと思うんだけどなあ。できることが多すぎて、説明が大変かもしれないけど。

 

総括

numpy初めてだけど~、みたいな人には良い教科書だと思います。

資格試験の教科書ということで、改訂版とかそのうち出ると思うので、ぜひより良い内容になってほしいと思います。

 

ちょっとだけ追記

会社で紹介したら、プログラミング初心者?の方々には好評で、2、3名ほどpythonでforとかifまでを覚えた後、これを使って勉強しました。