No opinions, facts only. [No English version today, since there are only some charts with comments. If you would like to receive them in English, just let me know.]
Nie będę tym razem wyrażał tu swojej opinii, pisał żadnych komentarzy o tym, że liczy się perspektywa i jak należy podawać i patrzeć na dane. Pokażę Wam tylko kilka rzeczy. Zapraszam!
1. Podstawowe dane
To wykres pokazujący dzienny przyrost liczby zakażonych koronawirusem (łącznej, nie aktualnej) od 4 maja do 8 sierpnia. Dane na nim (i wszystkich kolejnych) pochodzą głównie z Twittera Łukasza Boka, a w pojedynczych przypadkach także z Ministerstwa Zdrowia, portali Polsat News, isbzdrowie.pl oraz użytkownika Twittera @nikazuzuu. Widzimy dzienne wahania przez cały analizowany okres, ale też względnie stabilny poziom zakażeń w okresie maj-czerwiec, po czym niemal ciągły wzrost w ciągu lipca i na początku sierpnia.
Wykresy mają jednak to do siebie, że można nimi mocno manipulować. Wystarczy kilka drobnych zmian, by pokazać, że...
2. Ten wzrost jest jeszcze większy!
Widzicie? Nagle okazuje się, że wahania i wzrost od początku lipca są jeszcze większe niż na pierwszym wykresie. Jak to, skoro to wykres pochodzący dokładnie z tych samych danych? Ano wystarczy odpowiednio przeskalować oś Y (pionową), by zaczynała się tuż pod najniższą z wartości w analizowanym okresie, a kończyła tuż nad najwyższą. Wtedy wykres staje się rozciągnięty, bo na tym samym obszarze nie rozpisujemy pionowo 901 wartości (0-900), ale 656 (190-845). Gdyby odpowiednio zmienić skalę w drugą stronę, można by równie dobrze przedstawić powyższy wykres jako zbliżony do niemal płaskiej krzywej. Gdy więc patrzycie na jakiś wykres, w pierwszej kolejności spójrzcie na przyjętą skalę.
To jednak nie ma nawet aż takiego znaczenia, ponieważ dwa powyższe wykresy mają pewną istotną wadę, a mianowicie dotyczą samej liczby przyrostu pozytywnych testów. Tymczasem gdyby szkolnictwo funkcjonowało na jakichś sensownych zasadach, to każdy by wiedział, że...
3. Liczby bezwzględne same z siebie nic nie znaczą!
A co to za wykres? Ten sam, co wcześniej. Nooo... Prawie. Tutaj też została wprowadzona jedna drobna zmiana. Jaka? Otóż dzienny przyrost zakażeń podzielono przez ilość testów wykonaną danego dnia. W uproszczeniu mamy tu zatem do czynienia z procentową wykrywalnością wirusa na przestrzeni ostatnich 3 miesięcy. I co się okazuje? Otóż w całym okresie kształtuje się ona w przedziale 0,8-4,5%. Wygląda na to, że od początku lipca wartość ta wzrasta i tak rzeczywiście jest, ale dynamika tego wzrostu jest wyraźnie niższa niż zakażeń w liczbach bezwzględnych. Co więcej, średni procent za okres 4 maja - 30 czerwca to 2,0%, a za okres 1 lipca - 8 sierpnia to 1,8%.
Nie chcę wyciągać żadnych wniosków z tych danych, ale nie ma co mówić, że teraz jest 3-4 razy więcej zakażeń niż kiedyś. To wprowadza w błąd. A tak poza tym to...
4. Tu też można manipulować!
To taki smaczek na koniec. To ten sam wykres, co w punkcie 3, ale przeskalowany z podziałki 0-5% na 0-20%. Tylko 20%. Gdybym jako maksymalną wartość przyjął 100%, całość wyglądałaby już bardzo podobnie do prostej linii. Jaka skala byłaby więc najlepsza? Ciężko mi powiedzieć, dlatego chcę tym porównaniem tylko podkreślić, że poza kształtem wykresu znaczenie ma też to, jaki jest rząd wielkości zjawiska. Po prostu. Dane i statystyka to potężne, ale tylko narzędzia i można z nich zrobić niemal dowolny użytek. Jeśli odpowiednio się je wybierze i zaprezentuje, na ogół można, przynajmniej pozornie, uargumentować niemal każdą tezę. Dlatego właśnie trzeba pamiętać o tym, by zawsze spoglądać na nie krytycznie.
A utwór na dziś to piosenka, która jest w porządku, ale nie oszałamia. Za to teledysk... Cóż, doskonale obrazuje, że rzeczy nie zawsze są takimi, jakimi się wydają. Zobaczcie sami:
To by było na tyle. Ponieważ, jak wspomniałem wcześniej, nie ma tu dziś miejsca na opinie, na koniec zostawiam jeden fakt: ja nadal do sklepów chodzę koniecznie w maseczce, a jeśli tylko to możliwe, także w rękawiczkach.
Brak komentarzy:
Prześlij komentarz