advanced
Optymalizacja algorytmów uczenia maszynowego dla dużych zbiorów danych
Techniki optymalizacji algorytmów ML dla skalowalnych rozwiązań na dużych zbiorach danych
📝 محتوى الأمر
Zaprojektuj strategię skalowania algorytmów uczenia maszynowego dla zbioru danych o wielkości 10 TB. Opisz szczegółowo: 1) Metody reprezentacji danych minimalizujące zużycie pamięci, 2) Techniki przyrostowego uczenia, 3) Strategie przetwarzania rozproszonego, 4) Metody radzenia sobie z drastycznie niezbalansowanymi klasami. Dla każdej z tych metod dostarcz kod w Pythonie/R wykorzystujący odpowiednie biblioteki (np. Spark MLlib, Dask, TensorFlow). Zakończ analizą kompromisów między szybkością a dokładnością oraz propozycją architektury rozwiązania.