Oud examens voor

Datawetenschap

2024-2025 - Semester 2

Vragen theorie

1) Simpson's Paradox

  • Vraag: Leg uit wat de Simpson's paradox inhoudt en geef een voorbeeld.

2) Jaccard Index ($J_{i,j}$)

3) Invloed van $\gamma$ ...

4) Referential Integrity (Referentiële Integriteit)

  • Vraag: Wat is referentiële integriteit en hoe kan men dit bewaken/behouden in een dataset?

5) Berekening Precision, Recall en F1-score

  • Vraag: Geef de berekeningen op basis van de volgende Confusion Matrix:
Voorspeld: PositiefVoorspeld: Negatief
Werkelijk: Positief20 (TP)10 (FN)
Werkelijk: Negatief5 (FP)(?) (TN)

6) Invloed van standaardiseren op de accuraatheid

  • Vraag: Bespreek de invloed van data-standaardisatie op de volgende algoritmen:
    • a) KNN (K-Nearest Neighbors)
    • b) Random Forest