Skip to content

Commit

Permalink
[add]Update
Browse files Browse the repository at this point in the history
  • Loading branch information
uribo committed Jun 29, 2022
1 parent fff89ce commit cb8e869
Show file tree
Hide file tree
Showing 6 changed files with 54 additions and 7 deletions.
2 changes: 1 addition & 1 deletion .gitignore
Original file line number Diff line number Diff line change
Expand Up @@ -3,8 +3,8 @@
.RData
.Ruserdata
*.xlsx

/.quarto/
_book/
data-raw/redlist_search_raw.rds
data-raw/redlist_occ_country_raw.rds
.DS_Store
Binary file added images/my_activity.jpeg
Loading
Sorry, something went wrong. Reload?
Sorry, we cannot display this file.
Sorry, this file is invalid so it cannot be displayed.
46 changes: 41 additions & 5 deletions intro.qmd
Original file line number Diff line number Diff line change
Expand Up @@ -28,9 +28,13 @@ title: "はじめに"
この方法について、コースの中でも[第2章](summary_statistics.qmd)[第4章](visualization.qmd)で扱います。

2つ目の目的として、データがもつ意味やデータに含まれる値の関係性を説明することがあります。
例えば身長と体重を記録したデータから何が言えるでしょうか。
例えば全国の都道府県で身長と体重を記録したデータから何が言えるでしょうか。
次のデータは文部科学省が毎年行う「」を示しています。



<ruby>比較<rt>ひかく</rt></ruby>(2つあるいは3つ以上のものを比べ、そこにある違いを考えること)

### データ分析のプロセス

課題や適切なデータを見つける、データを解析する、解析結果を利用する
Expand All @@ -42,20 +46,47 @@ title: "はじめに"
データに含まれる誤差やバイアスといった性質を正しく理解した上で、
**データから有益な情報(価値)を引き出すための学問分野をデータサイエンス**と呼びます。

データから得られた情報が活用された例を示として、
18XX年に
大流行したコレラ
があります。

::: {.callout-note .tokupon_none}

ジョン・スノウによる

がされる前は

:::


データサイエンスでは情報学と統計学の技能を生かして

また、データサイエンスにより企業や研究に貢献する人々のことをデータサイエンティストと言います。

## データ、グラフに騙されない

私たちの身の回りには数値やグラフがたくさんあります。
普段の生活の中で、数値やグラフを目にする機会がたくさんあります。
天気予報や学校のテストの成績、スマートフォンやスマートウォッチで記録される歩数(@fig-my_activity)などです。

![スマートフォンに記録される活動量。数値を時間ごとにグラフ化し、一日の活動量と時間帯の関係がわかる](images/my_activity.jpeg){#fig-my_activity}

このような数字を見た時に感じる印象は人それぞれですが、
多くの人が共通して感じる数字も存在します。

数字にはある種の説得力があると言えます。

目に見える数字が示す内容を鵜呑みにすると痛い目を見ることがあります。

データを見て、何を強調して示したいか(作り手の意図。同じデータであっても何をどう示すかで見方が変わる

こうした**データ、グラフに騙されないための素養(リテラシー)が重要**になります。
こうした**データ、グラフに騙されないための素養が重要**になります。
読み書きをする能力のことをリテラシーと言いますが、データに対するリテラシーを備えておくことが求められています。

<!-- https://en.wikipedia.org/wiki/Rabbit–duck_illusion -->

## 統計

## データ分析で扱う問題

データ分析では「モデル」と呼ばれる考え方
Expand All @@ -78,8 +109,13 @@ Rのインストール方法、簡単な使い方を紹介するよ。

<!-- Pythonについても一言 -->

## まとめ
## まとめと課題

- 身の回りにあるデータやグラフを探してみよう。それはどんなものかな?

## 参考文献・URL

- [@ezaki20]
- [@nishiuchi13]
- [@ezaki20]
- 小・中学生のための統計学習 まなぼう統計 https://www.toukei.metro.tokyo.lg.jp/manabou/ma-index.htm
- なるほど統計学園 https://www.stat.go.jp/naruhodo/ ... 総務省統計局による、統計について興味・関心を持ってもらうための統計学習サイト
7 changes: 7 additions & 0 deletions references.bib
Original file line number Diff line number Diff line change
Expand Up @@ -15,6 +15,13 @@ @article{knuth84
pages = {97–111},
numpages = {15}
}
@book { nishiuchi13,
author = "西内啓",
title = "統計学が最強の学問である : データ社会を生き抜くための武器と教養",
publisher = "ダイヤモンド社",
year = "2013",
URL = "http://id.ndl.go.jp/bib/024193446"
}
@book { ezaki20,
author = "江崎貴裕",
title = "分析者のためのデータ解釈学入門 : データの本質をとらえる技術",
Expand Down
2 changes: 1 addition & 1 deletion summary_statistics.qmd
Original file line number Diff line number Diff line change
Expand Up @@ -155,7 +155,7 @@ median(df_zoo$body_length_cm, na.rm = TRUE)

## データのばらつき

パーセンタイル
パーセンタイル、誤差


### 箱ヒゲ図
Expand Down
4 changes: 4 additions & 0 deletions visualization.qmd
Original file line number Diff line number Diff line change
Expand Up @@ -23,6 +23,8 @@ library(ggplot2)

## 棒グラフ

**棒グラフはデータの大小を棒の高さで比較する**グラフの種類です。

## 散布図

[相関](correlation.qmd)
Expand Down Expand Up @@ -53,6 +55,8 @@ anscombe_long <-

## 地図表現

<!-- スノウのコレラの話 -->

```{r}
library(sf)
library(rnaturalearth)
Expand Down

0 comments on commit cb8e869

Please sign in to comment.