Section outline

    • 1 - Spark tutorial

      This Jupyter notebook is based on the lecture "CS246: Mining Massive Datasets: Crash Course in Spark" by Daniel Templeton.

    • 2 - Frequent itemsets and Association rules

    • This document provides a clear, step-by-step explanation of the PCY algorithm, demonstrating its ability to prune candidate pairs by using a compact dataset and a simple hash function.

    • 3 - Locality sensitive hashing

    • Visualization of the effect of threshold, band size, and # of rows in LSH by Trenton Chang.

    • 4 - Clustering

    • Potrebe po izboljšanju odkrivanja skupin vedno bolj zahtevajo možnost interakcije z domenskimi eksperti, kar je vodilo do razvoja algoritmov odkrivanja skupin z omejitvami (angl. constrained clustering). Ti algoritmi uporabljajo domensko znanje v obliki pozitivnih (angl. must-link) in negativnih omejitev (angl. cannot-link) na pare učnih primerov, kar omogoča izboljšanje procesa odkrivanja skupin...

    • 5 - Dimensionality reduction

    • 6 - Recommender systems

    • 7 - Link Analysis

    • A template for the hubs-and-authorities algorithm - HITS (hyperlink-induced topic search).

    • 8 - Graphs

    • V magistrskem delu, ki je rezultiralo v objavi spodnjega članka v ugledni znanstveni reviji Mathematics, uporabimo moderne pristope strojnega učenja na grafih za pohitritev dinamičnega algoritma za iskanje maksimalne klike.

      Kristjan Reba, Matej Guid, Kati Rozman, Dušanka Janežič, and Janez Konc. 
      Exact maximum clique algorithm for different graph types using machine learning. 
      Mathematics 10, no. 1 (2022): 97.
    • avtor William L. Hamilton, McGill University

    • Videoposnetki pri predmetu CS224W: Machine Learning with Graphs na Stanford University, ki ga vodi in poučuje prof. Jure Leskovec.

    • 9 - Classification