当サイトは、書籍「最短コースでわかるPythonプログラミングとデータ分析」のサポートサイトです。
本書は、人気のプログラミング言語「Python」で、データ分析プログラミングができるようになる本です。
Python文法の初歩から解説しているので、初心者でも他書に頼らず、本書1冊で Python によるデータ分析技術をマスターできます!
本書の実習コードは、Google Colabで動かすことを前提に、すべてGithub(当サポートサイト)で公開しています。
本書は、以下の3つ+1つの「ツボ」により「最短コースでデータ分析技術を習得をできる『高速道路』」を読者に提供します。
- 必要十分な知識項目の精査 (データ分析の「出る単)
本書では、学習対象の知識項目を必要最小限に抑え、相互の関連性に基づき体系的に学べるようにしています。
1章と2章の約200ページで、プログラミング経験のない読者も、データ分析で最低限必要な3つのライブラリNumpy, Matplotlib, pandasまで使いこなせるようになります。
最小限といっても、大事な概念を省略しているわけではありません。 最初から目標をデータ分析に絞り込み必要十分な内容を精選し、かつ初心者が理解しにくい重要概念は必ず図をつけて丁寧に解説しています。
- ** 「演習問題」でプログラミングスキルの実地訓練**
初心者にとってプログラミング習得時の高いハードルの一つは、「要件」をプログラムコードとしての「実装」に落とし込むことのイメージが持てない点です。
本書では、各節の最後にある演習問題を通じて、抽象的な「要件」を具体的な「実装」に落とし込む訓練を繰り返すことにより、この課題に対応します。
- 試行錯誤によろライブラリ関数機能の体得
データ分析で必要なライブラリ関数の細かい挙動を理解するためには、トライアンドエラーを繰り返して実験・体験により理解するのが第一です。
本書ではGoogle Colabで動かすことを前提に、すぐに利用可能な実習コードが用意されていて、気軽に試行錯誤の実験ができます。
- 分析シナリオで洞察導出(プラス・アルファのツボ)
3章・4章では、公開データセットの活用で、実業務に近い分析シナリオを提示しています。
これらの例題を通じて、実際のデータ分析で最も重要な洞察の抽出がどんなものであるかのイメージを持つことが可能です。
以下に、本書の具体的な内容の一部を紹介します。
- データ分析のためのポイントを囲み記事で紹介(全体)
本書は、「データ分析」を最終的な目的とした書籍です。そこで、各章の説明の中で、特にデータ分析との関係で重要な点を下記のような囲み記事の形でまとめました。
- 演習問題はヒント付き(全体)
演習問題は、コメントにヒントがついていて、その節で学習したことが理解できていればギリギリ対応できる形にレベル設定されています。
- 重要な文法は囲み記事で解説(1章)
1章のPythonプログラミング入門では、重要な文法は囲み記事で一つ一つの要素の意味を丁寧に解説します。
- NumPyブロードキャスト機能も図で説明(2章)
2章の「ライブラリ入門」の1節でNumPyを解説しています。
NumPyの特徴的な機能であるブロードキャスト機能も、その動作メカニズムを図で解説しています。
- 公開データセット用いたシナリオベースの分析(3章)
3章では、実習の題材に極力公開データセットを用いて、実業務の分析シナリオに近いストーリーを作っています。
下記に「銀行マーケティング・データセット」から、営業対象の顧客層を分析した結果と、「ピッツバーグ・ブリッジ・データセット」のデータを箱ひげ図で分析し、保守対象の橋の選定をしている事例を示しました。
- タイタニック・データセットを総合的に分析(4章)
4章では、それまでの学習の総まとめとして「タイタニック・データセット」を徹底的に分析します。下記左は、生存率を「客室クラス」「性別」の2軸で分析した結果、右は「性別」「救命ボード」「生存状況」の3つの項目間の関係を整理した結果です。
本書は、次のような読者を想定しています。
-
データ分析をするためにPython文法から学習したい
-
Pythonの文法は理解したが、ライブラリの学習で止まっている
-
ライブラリまで一通り学習したが、実際の分析テーマに対してどのように進めたらいいかがわからない
ソース | タイトルとリンク | 補足 |
---|---|---|
@makaishi2 | 著者のツイッターアカウント。書籍に関連した情報発信とretweetが中心です。 | |
IBM Blog | AI関連書籍三冊目を出版したIBM赤石雅典に聞く「AIと仕事と執筆」 | IBM勤務時代、会社のブログにインタビュー記事が紹介されています。 |