書評: Pythonによるあたらしいデータ分析の教科
とあるキャンペーンにて、物理本を無料でプレゼントで頂いたので。
(一応電子版は自費で買った)
対象読者
Pythonの文法がある程度わかっている人。
学べること。
科学技術計算でよく使われている以下のライブラリについて、基本的な使い方が学べる。
Numpy : 効率的な多次元配列の計算
Pandas: 表形式のデータの加工
Scikit-learn: 機械学習
良いところ
・環境構築についてはPython標準の仮想環境の作り方が丁寧に書いてあって結構好感が持てた。
この手の教科書で多いのが、「Anacondaで一発」とか「Colabでok!」なので。
・最初にNumpy, Pandas, Scikit-learnを学ぶのだったら、これぐらいの内容を知っておけば、あとはググったり、ドキュメントを読めばなんとかなるかなあ…ぐらいの内容がコンパクトにまとまっている。
・情報量がそこまで多くないので、Numpy~Pandas にあまり詳しくない人が、頭から順番に読んでいくとGood。(ある程度詳しい人が読むと、情報量が少なくて辞書的な使い方もできないので、少し残念になる)
・「Python3エンジニア認定データ分析試験」の教科書。
→一応、受かった。
ちょっと残念なところ
・「Pythonの文法」と「数学の基礎」の情報が断片的過ぎて、使いどころがよく分からない。
「三角関数」、「微積」、「統計(正規分布など)」、「グラフの種類」 etc.のような情報を20ページほどでまとめても、知っている人(高校で数3Cを勉強した人)には簡単すぎるし、知らない人には、別の教材を使って勉強したほうが、わかりやすいと思う。
・Scikit learnのデータセットがiris or 乱数
一応bostonのデータセットも扱っていてはいたけど。
digitsとかwineとかもう少し色々使ってみてもよい気がする。
・Scipyに関する話題がほぼゼロ。
Scipy重要だと思うんだけどなあ。できることが多すぎて、説明が大変かもしれないけど。
総括
numpy初めてだけど~、みたいな人には良い教科書だと思います。
資格試験の教科書ということで、改訂版とかそのうち出ると思うので、ぜひより良い内容になってほしいと思います。
ちょっとだけ追記
会社で紹介したら、プログラミング初心者?の方々には好評で、2、3名ほどpythonでforとかifまでを覚えた後、これを使って勉強しました。