Viikko 6
Allaolevien tehtävien deadline on maanantai 9.12. klo 23:59
Apua tehtävien tekoon kurssin Discord-kanavalla, kampuksella pajassa BK107:
- ma 14-16
- to 13-15
- pe 12-14
Muista myös tämän viikon monivalintatehtävät, joiden deadline on ei tehtäviä .
Tehtävässä 1 jatketaan Gitin harjoittelua, tehtävä ei näy palautuksissa mitenkään.
Tehtävät 2-5 liittyvät materiaalin ohjelmistosuunnittelua käsittelevän osan 4 niihin lukuihin, joihin on merkitty [viikko 5] tai [viikko 6].
Tehtävässä 6 tutustutaan GitHubin pull request -mekanismiin ja tehdään sen avulla pull request johonkin miniprojektiin. Tehtävä tehdään suoraan GitHubiin.
Tämän viikon monivalintatehtävät.
Typoja tai epäselvyyksiä tehtävissä?
Tee korjausehdotus editoimalla tätä tiedostoa GitHubissa.
Kurssipalaute
Kurssilla on käytössä normaalin lopussa kerättävän palautteen lisäksi ns. jatkuva palaute: voit antaa milloin vain kurssihenkilökunnalle anonyymiä palautetta osoitteessa https://norppa.helsinki.fi/targets/83083419/feedback
Ongelmia Poetryn kanssa?
Muutamia ohjeita täällä
Tehtävien palauttaminen
Tehtävät palautetaan GitHubiin, sekä merkitsemällä tehdyt tehtävät palautussovellukseen https://study.cs.helsinki.fi/stats/courses/ohtu2024 välilehdelle “my submission”.
Tämän viikon tehtävät 2-5 palautetaan jo edellisillä viikoilla käyttämääsi palautusrepositorioon, sinne tehtävän hakemiston viikko6 sisälle.
Katso tarkempi ohje palautusrepositorioita koskien täältä.
1. Git: rebase [versionhallinta]
Tätä tehtävää ei palauteta mihinkään!
Olemme jo törmänneet parissa aiemmassa tehtävässä (viikko 1, tehtävä 11 ja ja viikko 2 tehtävä 9) Gitin käsitteeseen rebase. Otetaan nyt selvää tarkemmin mistä on kysymys.
Lue https://www.atlassian.com/git/tutorials/rewriting-history/git-rebase tai/ja http://git-scm.com/book/en/Git-Branching-Rebasing.
Aikaansaa seuraavankaltainen tilanne:
------- main
\
\--- haara
“Rebeissaa” haara mainiin, eli aikaansaa seuraava tilanne:
------- main
\
\--- haara
Varmista komennolla gitk --all
että tilanne on haluttu.
“Mergeä” main vielä haaraan:
\ main
\--- haara
Lopputuloksena pitäisi siis olla lineaarinen historia ja main sekä haara samassa. Varmista jälleen komennolla gitk --all
että kaikki on kunnossa.
Poista branch haara. Etsi googlaamalla komento, jolla saat tuhottua branchin.
Mikä on rebase-komennon käyttötarkoitus? Atlassianin git-ohje perustelee asiaa näin
The primary reason for rebasing is to maintain a linear project history. For example, consider a situation where the main branch has progressed since you started working on a feature branch. You want to get the latest updates to the main branch in your feature branch, but you want to keep your branch’s history clean so it appears as if you’ve been working off the latest main branch. This gives the later benefit of a clean merge of your feature branch back into the main branch. Why do we want to maintain a “clean history”? The benefits of having a clean history become tangible when performing Git operations to investigate the introduction of a regression.
2. Kyselykieli NHL-tilastoihin, osa 1
Kurssirepositorion hakemistosta viikko6/query-language löytyy jälleen yksi versio tutusta NHL-tilastojen tarkasteluun tarkoitetusta ohjelmasta.
- Kopioi projekti palatusrepositorioosi, hakemiston viikko6 sisälle.
- Tätä tehtävää tehdessä luentomateriaalin Gutenberg-lukija voi olla eräs inspiraation lähde.
Tällä kertaa olemme kiinnostuneita tekemään hieman monimutkaisempia “kyselyjä” pelaajatietoihin, esim. listaa kaikki joukkueen PHI pelaajat, joilla on vähintään 5 maalia ja vähintään 20 syöttöä.
Koodiin onkin luotu hieman valmista kalustoa, josta pääset liikkeelle. Yllä olevan kyselyn voi suorittaa seuraavasti:
def main():
url = "https://studies.cs.helsinki.fi/nhlstats/2023-24/players.txt"
reader = PlayerReader(url)
stats = Statistics(reader)
matcher = And(
HasAtLeast(5, "goals"),
HasAtLeast(20, "assists"),
PlaysIn("PHI")
)
for player in stats.matches(matcher):
print(player)
Luokalle Statistics
on tehty metodi matches
, joka palauttaa listan niistä pelaajista, joille parametrina annettun olion metodi test
palauttaa True
.
Tutustu ohjelman rakenteeseen.
- Huomioi miten
HasAtLeast
-luokan metoditest
käyttää funktiota getattr saadakseen parametrina annetun attribuutin arvon - Toinen huomioinarvoinen piirre on
And
-luokan konstruktorissa käytetty vaihtuvamittainen parametrilista, jonka tunnista*
-etuliitteestä. Syntaksin avulla*matchers
sisältää listan konstruktorille annetuista argumenteista
Toteuta test
-metodin toteuttavat luokat, joiden avulla voit tehdä seuraavat operaatiot:
- All (tosi kaikille pelaajille)
- Not (parametrina olevan ehdon negaatio)
- HasFewerThan (HasAtLeast-komennon negaatio eli esim. on vähemmän kuin 10 maalia)
Kaikille pelaajille tosi ehto All ei ole vielä tämän tehtävän kannalta kovin mielenkiintoinen, sitä pystyy kuitenkin hyödyntämään neljännessä tehtävässä.
Voit tarkistaa toteutuksesi toimivuuden tekemällä kyselyn:
matcher = And(
Not(HasAtLeast(2, "goals")),
PlaysIn("NYR")
)
Vastauksena pitäisi olla joukkueen NYR pelaajista ne, joilla ei ole vähintään kahta maalia, eli 0 tai 1 maalia tehneet:
Brandon Scanlin NYR 0 + 0 = 0 Nick Bonino NYR 1 + 4 = 5 Riley Nash NYR 0 + 0 = 0 Jake Leschyshyn NYR 0 + 0 = 0 Brennan Othmann NYR 0 + 0 = 0 Jake Leschyshyn NYR 0 + 0 = 0 Matt Rempe NYR 1 + 1 = 2 Connor Mackey NYR 0 + 0 = 0 Tyler Pitlick NYR 1 + 3 = 4 Filip Chytil NYR 0 + 6 = 6 Anton Blidh NYR 0 + 0 = 0
- Kaikissa esimerkitulostuksissa on käytetty vuoden 2023-24 tilastoja. Tilastoissa käytettävän vuoden voi valita tilastojen URL:ista, joka on koodipohjassa https://studies.cs.helsinki.fi/nhlstats/2023-24/players.txt
Kyselyn
matcher = And(
HasFewerThan(2, "goals"),
PlaysIn("NYR")
)
tulisi palauttaa täsmälleen sama lista.
Ehdon All pitäisi palauttaa kaikki pelaajat. Seuraavan koodin
filtered_with_all = stats.matches(All())
print(len(filtered_with_all))
pitäisi tulostaa 958
3. Kyselykieli NHL-tilastoihin, osa 2
Toteuta test
-metodin toteuttava luokka Or
, joka on tosi silloin jos ainakin yksi sen parametrina saamista ehdoista on tosi.
Kyselyn
matcher = Or(
HasAtLeast(45, "goals"),
HasAtLeast(70, "assists")
)
tulee palauttaa ne, joilla on vähintään 45 maalia tai 70 syöttöä, eli seuraava lista
Filip Forsberg NSH 48 + 46 = 94
Sam Reinhart FLA 57 + 37 = 94
Quinn Hughes VAN 17 + 75 = 92
Connor McDavid EDM 32 + 100 = 132
Auston Matthews TOR 69 + 38 = 107
David Pastrnak BOS 47 + 63 = 110
Nathan MacKinnon COL 51 + 89 = 140
Zach Hyman EDM 54 + 23 = 77
Artemi Panarin NYR 49 + 71 = 120
Brayden Point TBL 46 + 44 = 90
Nikita Kucherov TBL 44 + 100 = 144
Kirill Kaprizov MIN 46 + 50 = 96
Kyselyn
matcher = And(
HasAtLeast(70, "points"),
Or(
PlaysIn("NYR"),
PlaysIn("FLA"),
PlaysIn("BOS")
)
)
tulee palauttaa kaikki vähintään 70 pistettä tehneet jotka pelaavat jossain seuraavista joukkueista NYR, FLA tai BOS. Lista näyttää seuraavalta:
Sam Reinhart FLA 57 + 37 = 94
Vincent Trocheck NYR 25 + 52 = 77
Matthew Tkachuk FLA 26 + 62 = 88
David Pastrnak BOS 47 + 63 = 110
Carter Verhaeghe FLA 34 + 38 = 72
Chris Kreider NYR 39 + 36 = 75
Adam Fox NYR 17 + 56 = 73
Artemi Panarin NYR 49 + 71 = 120
Aleksander Barkov FLA 23 + 57 = 80
Mika Zibanejad NYR 26 + 46 = 72
Kyselyt perustuvat rakenteeltaan decorator-suunnittelumalliin, vastaavasti kuten materiaalin osan 4 esimerkissä dekoroitu pino. And- ja OR-muotoiset kyselyt on muodostettu myös erään suunnittelumallin, compositen hengessä, ne ovat Matcher-rajapinnan toteuttavia olioita, jotka sisältävät itse monta Matcher-olioa. Niiden käyttäjä ei kuitenkaan tiedä sisäisestä rakenteesta mitään.
4. Parannettu kyselykieli, osa 1
Matcher-olioiden avulla tehtyä kyselykieltä vaivaa se, että kyselyjen rakentaminen on ikävää, sillä jokaista kyselyn osaa kohti on luotava uusi olio. Toinen ikävä puoli on se, että kyselyjä käyttävällä koodilla on suora riippuvuus sen käyttämiin Matcher-olioihin.
Tee materiaalin osassa 4 esitellyn pinorakentajan hengessä kyselyrakentaja, jonka avulla voit luoda Matcher-olioita.
Rakentaja voi toimia esim. seuraavaan tapaan.
Ensin kysely, joka palauttaa jokaisen pelaajan:
def main():
url = "https://studies.cs.helsinki.fi//nhlstats/2023-24/players.txt"
reader = PlayerReader(url)
stats = Statistics(reader)
query = QueryBuilder()
matcher = query.build()
for player in stats.matches(matcher):
print(player)
Tässä kyselyssä voi ja kannattaa hyödyntää edellisen tehtävän All
-matcheria.
Seuraavaksi kysely, missä tulostetaan pelaajat, joiden joukkue on NYR:
def main():
url = "https://studies.cs.helsinki.fi//nhlstats/2023-24/players.txt"
reader = PlayerReader(url)
stats = Statistics(reader)
query = QueryBuilder()
matcher = query.plays_in("NYR").build()
for player in stats.matches(matcher):
print(player)
Seuraavaksi kysely, missä tulostetaan pelaajat joiden joukkue on NYR, joilla on vähintään 10 mutta kuitenkin vähemmän kuin 20 maalia:
def main():
url = "https://studies.cs.helsinki.fi//nhlstats/2023-24/players.txt"
reader = PlayerReader(url)
stats = Statistics(reader)
query = QueryBuilder()
matcher = query.plays_in("NYR").has_at_least(10, "goals").has_fewer_than(20, "goals").build()
for player in stats.matches(matcher):
print(player)
Pelaajien lista on seuraava:
Will Cuylle NYR 13 + 8 = 21
Jimmy Vesey NYR 13 + 13 = 26
Kaapo Kakko NYR 13 + 6 = 19
Adam Fox NYR 17 + 56 = 73
Peräkkäin ketjutetut ehdot siis toimivat “and”-periaatteella.
Tässä tehtävässä riittää, että kyselyrakentaja osaa muodostaa and-periaatteella yhdistettyjä ehtoja.
Pitkät metodikutsuketjut, esim.
matcher = query.plays_in("NYR").has_at_least(10, "goals").has_fewer_than(20, "goals").build()
ovat luettavuudeltaan hieman ikäviä, jos ne kirjoitetaan monelle riville. Usein ne onkin tapana jakaa “kutsu per rivi”-periaatteella:
matcher = (
query
.plays_in("NYR")
.has_at_least(10, "goals")
.has_fewer_than(20, "goals")
.build()
)
Python ikävä kyllä edellyttää tässä “ylimääräisten” sulkujen käyttöä.
5. Parannettu kyselykieli, osa 2
Laajennetaan kyselyrakentajaa siten, että sen avulla voi muodostaa myös or-ehdolla muodostettuja kyselyjä. Or-ehdon sisältävä kysely voi olla muodostettu esim. seuraavasti:
m1 = (
query
.plays_in("PHI")
.has_at_least(10, "assists")
.has_fewer_than(10, "goals")
.build()
)
m2 = (
query
.plays_in("EDM")
.has_at_least(50, "points")
.build()
)
matcher = query.one_of(m1, m2).build()
Pelaajalistan tulisi olla:
Leon Draisaitl EDM 41 + 65 = 106
Connor McDavid EDM 32 + 100 = 132
Garnet Hathaway PHI 7 + 10 = 17
Zach Hyman EDM 54 + 23 = 77
Garnet Hathaway PHI 7 + 10 = 17
Noah Cates PHI 6 + 12 = 18
Nick Seeler PHI 1 + 12 = 13
Egor Zamula PHI 5 + 16 = 21
Evan Bouchard EDM 18 + 64 = 82
Ryan Nugent-Hopkins EDM 18 + 49 = 67
Tai sama ilman apumuuttujia:
matcher = (
query
.one_of(
query.plays_in("PHI")
.has_at_least(10, "assists")
.has_fewer_than(10, "goals")
.build(),
query.plays_in("EDM")
.has_at_least(50, "points")
.build()
)
.build()
)
6. Pull request ja refaktorointia (tätä tehtävää ei lasketa versionhallintatehtäväksi)
HUOM tee tämä tehtävä aikaisintaan perjantaina 29.11.
Isoa projektia on vaikea ylläpitää yksin ja vielä vaikeampaa on löytää oikeat ratkaisut jokaiseen ongelmaan, kun ohjelmisto kasvaa. On vaikeaa hallita itse kaikkea ja jotkin osa-alueet eivät välttämättä edes miellytä jolloin niihin on vaikea paneutua. Saatat löytää itsesi ajattelemasta vaikkapa: “Lukisipa joku tietorakenteiden asiantuntija tämän osuuden läpi ja tsekkaisi, että HashSet on nyt varmasti se tehokkain ratkaisu…”.
Ehkäpä et edes ajatellut asiaa, mutta joku silti näyttää, että binäärihakupuu onkin tilanteessa tehokkaampi ratkaisu, koodaa korjaukset puolestasi lähdekoodiin sekä tekee muutoksista pull requestin. Onneksi julkaisit projektisi Open Sourcena!
GitHub on täynnä Open Source -projekteja, jotka kaipaavat panostasi. Mikäs sen kivempaa, kuin käyttää muutama tunti suosikkirepositioriosi lähdekoodin parissa ja korvata sieltä huomaamasi epäelegantti ratkaisu paremmalla. Useilla repositorioilla on valmiit ohjeet muutosehdotusten tekemiseen repositorion juuresta löytyvässä tiedostossa Contributing.md. Tässä esimerkiksi bluebird.js:än CONTRIBUTING.md.
Tehtävänäsi on harjoitella muutosehdotuksen tekemistä “open source -projektiin” sekä vieraan koodin lukemista ja refaktorointia.
- Valitse yksi repositorio miniprojektien joukosta
- Mielellään sellaisen ryhmän repositorio, jolla ei ole jo viittä pull requestia.
- Ja luonnollisesti sellainen, jonka koodiin haluat tehdä jotain muutoksia
- Forkkaa repositorio
- Tee forkattuun repositorioon uusi branch nimellä “muutoksia”
- Tee luomaasi branchiin “tyhjä” pull request: lisää esimerkiksi yksi tyhjä rivi README.md-tiedostoon, pushaa uusi branch GitHubiin ja tee branchista pull request.
- Tyhjän pull requestin tarkoituksena on varata sinulle paikka kyseisen repositorion muutoksentekijöiden joukosta. Haluamme, että kaikki ryhmät saavat suunnilleen tasaisesti pull requesteja, eli jos repositoriossa on niitä jo runsaasti, etsi mielellään jokin muu repositorio.
- Etsi ryhmän lähdekoodista jotain refaktoroitavaa
- Kyseessä ei tarvitse olla iso muutos, esimerkiksi muuttujan/metodin uudelleennimeäminenkin riittää
- Refaktoroi ja committaa
- Käy katsomassa tekemääsi tyhjää pull requestia. Mitä tapahtui?
- Rebeissaa (ks. tämän viikon ensimmäinen tehtävä) luomasi branch paikalliseen main-branchin päälle. Pushaa. Tapahtuiko pull requestissa muutoksia?
- Otsikoi tekemäsi pull request niin, että se kuvaa tekemiäsi muutoksia. Tarkenna otsikon alle mitä teit ja miksi.
- Jos ryhmä pyytää sinua tekemään muutoksia pull requestiisi, tee halutessasi tarvittavat muutokset ja committaa. Päivittyikö pull request?
- Kun ryhmä on hyväksynyt muutoksesi, voit poistaa luomasi branchin
Laita palautusrepositorioosi tiedosto PULL.md ja sen sisällöksi linkki pull requestiin.
Tehtävien palautus
Pushaa kaikki tekemäsi tehtävät (paitsi ne, joissa mainitaan, että tehtävää ei palauteta mihinkään) GitHubiin palautusrepositorioosi ja merkkaa tekemäsi tehtävät palautussovellukseen https://study.cs.helsinki.fi/stats/courses/ohtu2024