Algoritmy pro rozsáhlá data Mgr. Adéla Laštovičková
Zápočet
- Pro splnění zápočtu je nutné vypracovat tři úkoly.
První zápočtový úkol
Máte soubor o velikosti cca 200GB obsahujíc miliardu uživatelských komentářů tvaru { comment-id: 289459745,
article-id: 772445,
user-id: 007,
text: I’m Bond, James Bond.,
views: 29397,
likes: 59 } .
Navrhněte algoritmus, jenž:
- v souboru najde nejčastěji se vyskytující komentář.
- v souboru najde zadaný komentář.
- zjistí, kolik různých komentářů soubor obsahuje.
Své řešení odevzdejte na cvičení napsané rukou a čitelně do 15.10.2025.
Druhý zápočtový úkol
Podrobně si prostudujte- Bloomovy filtry nebo Kvocientové filtry,
- Count-Min Sketch,
- HyperLogLog
Řešení odevzdejte na cvičení nejpozději v zápočtovém týdnu. (17.12.2025)
Třetí zápočtový úkol
Podívejte se na operace prováděné s B-stromy. Poté simulujte průběh přidání klíče 111 a následně smazání klíče 18 z B-stromu řádu 3 zaslaného mailem.Své řešení odevzdejte na papíře nejpozději na cvičení v zápočtovém týdnu. (17.12.2025)
Správce stránky: Adéla Laštovičková