@@ -7,19 +7,73 @@ Kurssimateriaalia ja esimerkkejä data-analyysin projektikurssilla.
77Ohjeet ovat enimmäkseen Ubuntu Linuxille. Useimmat ohjelmistot asennetaan
88` apt-get ` -työkalulla.
99
10- * [ csvkit] ( https://csvkit.readthedocs.io/en/latest/ )
10+ * [ csvkit] ( https://csvkit.readthedocs.io/en/latest/ ) (asennus esim.
11+ ` sudo apt-get install csvkit ` )
12+ * [ curl] ( https://curl.se/ ) (todennäköisesti on jo mukana Linux-asennuksessa)
1113
14+ ## Python
15+
16+ Esimerkeissä on käytetty Pythonin versiota 3.10.6. Tarkista oma Python 3-versiosi:
17+
18+ python3 -V
19+
20+ Pythonin versiota 2 ei kannata enää käyttää uusissa projekteissa.
21+
22+ ### Virtuaaliympäristö
23+
24+ Perustietoa Pythonin virtuaaliympäristöistä löytyy esimerkiksi
25+ Real Python -sivuston artikkelista [ Python Virtual Environments: A Primer] ( https://realpython.com/python-virtual-environments-a-primer/ ) .
26+
27+ Tee projektin hakemistoon uusi virtuaaliympäristö nimeltä ` venv ` :
28+
29+ python3 -m venv venv
30+
31+ Komento ajaa Python-moduulin nimeltä ` venv ` ja luo uuden virtuaaliympäristön.
32+
33+ Aktivoi virtuaaliympäristö:
34+
35+ source venv/bin/activate
36+
37+ Graafisten kuvaajien tekemistä varten pitää asentaa Matplotlib:
38+
39+ pip install matplotlib
40+
41+ Lisää tietoa ` pip ` -ohjelman käytöstä löytyy esimerkiksi Real Python -sivuston
42+ artikkelista [ What is Pip] ( https://realpython.com/what-is-pip/ ) .
43+
44+ Kun olet lopettanut projektin työstämisen, anna komento ` deactivate ` . Sen jälkeen
45+ ` python3 ` -komento ajaa taas järjestelmän oman Python 3 -tulkin. Aktiivinen
46+ virtuaaliympäristö näkyy komentokehotteessa, mutta voit tarkistaa tilanteen
47+ komennolla ` which python3 ` .
48+
1249## Traficomin avoin data
1350
1451Ajoneuvotiedot ovat [ Traficomin avointa dataa] ( https://www.traficom.fi/fi/ajankohtaista/avoin-data?toggle=Ajoneuvojen%20avoin%20data ) .
1552
1653## Sähköautojen ensirekisteröintien kehitys
1754
1855Erottele Traficomin ajoneuvodatasta tarvittavat sarakkeet
19- komentojonolla ` esipesu.sh ` .
56+ komentojonolla ` esipesu.sh ` :
57+
58+ bash esipesu.sh
2059
2160Keräile rekisteröintitiedot vuosilta 2016-2021 Python-ohjelmalla
22- ` ev_counts.py ` .
61+ ` ev_counts.py ` . Varmista, että esipesun tuottama tiedosto on
62+ samassa hakemistossa, ja aja sitten ohjelma:
63+
64+ python3 ev_counts.py
65+
66+ Ohjelma pysyy käynnissä kunnes pylväsdiagrammin sisältävä
67+ ikkuna suljetaan.
68+
69+ HUOM.! Jos saat ilmoituksen:
70+
71+ > UserWarning: Matplotlib is currently using agg, which is a non-GUI backend, so cannot show the figure.
72+
73+ niin ratkaisu on asentaa Tkinter-kirjasto Pythonille:
74+
75+ sudo apt-get install python3-tk
76+
2377
2478### Datan pilkkominen vuosimääristä kuukausimääriksi
2579
@@ -33,6 +87,15 @@ vuodelle 2023 on ennustettu lineaarisen regressiomallin avulla,
3387käyttäen Scikit-learn-kirjastoa. Tämä versio on tiedostossa
3488` ev_counts_regression.py ` .
3589
90+ Aktivoi ensin Python-virtuaaliympäristö ja asenna Scikit-learn:
91+
92+ source venv/bin/activate
93+ pip install scikit-learn
94+
95+ Sen jälkeen aja ohjelma:
96+
97+ python3 ev_counts_regression.py
98+
3699Tuloksia voi verrata esimerkiksi Tilastokeskuksen tiedotteeseen
37100[ Tammikuussa 2023 ensirekisteröitiin 7 175 uutta henkilöautoa] ( https://www.stat.fi/julkaisu/cl8cq3s51778x09w2jlxa1tyh ) .
38101
0 commit comments