Jako, że temat sesji jest jeszcze ciepły dzisiaj będzie trochę bardziej nastrojowo i refleksyjnie.
Jakiś czas temu trafiła do nas studentka, która miała problem z pakietem R i nikt nie był jej w stanie pomóc. Zaciekawieni? Przeczytajcie zatem historię osoby, która wrzucona w odmęty edukacji musiała przebyć długą drogę by na końcu dotrzeć do portu ‘zdałam’.
Historia z życia wzięta
Wspomniana studentka trafiła do nas dość późno i trochę zdesperowana. Rozmowa pokazała, że wiele osób było skłonnych pomóc jej z pakietem R, ale po zapoznaniu się z listami zadań wycofywali się. Zapytacie zapewne jako to możliwe? Zapamiętajmy to pytanie, bo będziemy do niego wracać, ale po kolei.
Przedmiot nazywał się analiza w pakiecie R czy jakoś tak, co nie jest tu w ogóle istotne. Kluczowe jest to, że było to połączenie rachunku prawdopodobieństwa, statystyki, programowania i analizy w R, które ktoś wrzucił do blendera, a powstałą papkę serwował studentom by Ci, jak koneserzy, wyłapywali istotne struktury. Łatwe? Spróbujcie zmiksować marchewkę z pomidorem, a następnie jedząc to degustować się samą marchewką… Nic więc dziwnego, że wspomniana osoba czuła się zagubiona. Bo jak znaleźć osoby z takimi szerokimi kompetencjami?
Pierwsze listy pokazywały już, że mamy trochę rachunku prawdopodobieństwa, analizy, potem statystyki, znowu rachunku prawdopodobieństwa i tak dalej. Co zatem okazało się kluczem do sukcesu?
Rachunek prawdopodobieństwa vs. Statystyka
Zdobyte doświadczenie pedagogiczne i mentoringowe uczy, że trzeba zacząć od definicji i zrozumienia. Przykład? Spróbujmy odpowiedzieć na pytanie czym różni się rachunek prawdopodobieństwa od statystyki. Nie mam tu na myśli regułki (choć od tego nie sposób uciec) tylko taką zdroworozsądkową ‘prosto mówioną’ definicję.
Rachunek prawdopodobieństwa to taka ‘czarna skrzynka’, która w losowy sposób zwraca nam pewien rezultat. Co bardzo istotne znamy wszystkie jej parametry, a nie znamy tylko wyniku. Przykładowo kiedy wiemy, że rzucamy symetryczną monetą (mamy 50% szans na orła i 50% szans na reszkę) i powtarzamy to dostatecznie dużo razy prędzej czy później wyniki będą zbliżone do połowy orłów i połowy reszek.
Statystyka zmienia trochę reguły gry. Znowu mamy taką czarną skrzynkę, która coś nam zwraca. Różnica jest teraz taka, że wiemy co skrzynka zwróciła, ale nie wiemy jak są ustawione parametry jej pracy. Dopiero obserwując wyniki (próba) możemy ‘odgadnąć’ (oszacować, estymować) te parametry. Przykładowo, jeśli po stu rzutach monetą mamy same orły można mieć wątpliwości co do tego, że moneta jest symetryczna. Prawda?
Wszystko po kolei
Wracając do głównej myśli, zrozumienie rachunku prawdopodobieństwa (gęstość rozkładu normalnego, wartość oczekiwana itp.) pozwala zrozumieć statystykę, która stara się oszacować te wszystkie wielkości dane tam wprost. Przykładowo średnia z próby w rozkładzie normalnym jest oszacowaniem wartości oczekiwanej (średniej) teoretycznej. Dzięki temu zaczynamy dostrzegać po co liczmy np. współczynnik korelacji Pearsona czy Kandala, albo dlaczego każą nam rysować wykres rozrzutu.
Dopiero mając to wszystko, można podejść do takiego narzędzia jak pakiet R. Rozumiejąc co i dlaczego chcemy zrobić, łatwo nam jest nawet samodzielnie wyszukać odpowiednie funkcje, biblioteki czy fragmenty kodu.
Puenta
I tak oto wracamy do pytania postawionego na początku. Jak to możliwe? Otóż jeśli proces uczenia ma na celu zdobycie jakiejś kompetencji lub zrozumienie jak coś działa, wtedy zdobywanie wiedzy wyrwanej z kontekstu jest stratą czasu. Nawet jeśli chwilowo wydaje się to efektywne, to w ostatecznym rozrachunku okazuje się, że tej wiedzy nie potrafimy wykorzystać.
Opisany przypadek pokazuje jak młoda zdolna osoba, która ma wszystko, żeby poznać jakiś nowy obszar wiedzy (nawet jeśli to nie jest ‘jej bajka’), gubi się bo uczy się wszystkiego naraz i po trochu … Brzmi znajomo?