Kilka miesięcy temu pokazałem, jak zbudować prostą prognozę urodzeń. Tym razem opiszę, jak można wykonać podobną prognozę zgonów. Na koniec połączymy obie prognozy w prognozę ludności Polski. Podobnie jak poprzednim razem, prognoza ta ma charakter edukacyjny i nie jest pozbawiona pewnych uproszczeń i wad, nad którymi pochylę się w dalszej części wpisu.
Za dane wejściowe posłużą nam:
- Tabele trwania życia GUS w podziale na płeć
- Stan ludności na koniec 2022 roku w podziale na wiek i płeć z Bazy Demografia GUS.
- Moja poprzednia prognoza urodzeń
Jak obliczałem prognozowane zgony?
Z tabel trwania życia skorzystałem z danych za 2018 i 2019 rok, konkretnie ze współczynnika ryzyka zgonu. Obliczyłem średnią arytmetyczną ryzyka zgonu dla wszystkich rocznika i każdej z płci z osobna. Ryzyka zgonu GUS podaje od wieku 0 do wieku 100 lat, podobnie jak stany ludności, gdzie wiek 100 lat jest granicą, więc w tym aspekcie dane do siebie pasują. Tak wyliczone współczynniki użyłem dalej w prognozie w kolejnych latach: zakładam tu, iż trwanie życia pozostanie na tym samym poziomie. Wybrałem roczniki 2018 i 2019 jako źródło danych, gdyż to ostatnie lata przed pandemią, a wierzę, iż w kolejnym latach wpływ pandemii będzie bardzo niewielki.
Wpisałem do arkusza kalkulacyjnego stan ludności na koniec 2022 w podziale na wiek, mężczyzn i kobiety, i przemnożyłem ryzyko zgonu przez liczbę osób w danym wieku, przy tym dodam do wieku rok i zapiszę jako wynik roku 2023. Czyli np. noworodki z 2022 roku liczę jako dzieci jednoroczne w 2023 i przemnażam przez odpowiedni współczynnik ryzyka zgonu, by po zaokrągleniu otrzymać liczbę zgonów w tej grupie. Odejmując liczbę zgonów od liczby noworodków z 2022 roku, otrzymam liczbę dzieci jednorocznych na koniec 2023 roku. Podobnie postąpię z osobami w wieku 1 rok, 2 lata, ...., 98 lat.
Dla osób w wieku 99 lat muszę zrobić mały wyjątek: w kolejnym roku będą one miały 100 lat, więc wliczę je do grupy 100+.
Drugim wyjątkiem będą przewidywane urodzenia, począwszy od roku 2023, które wpiszę do arkusza w kolumnie stanu ludności. Zaznaczyłem te pola w arkuszu na zielono. Obliczyłem liczbę urodzonych chłopców jako 51,3303539495869% urodzeń, tak jak było to w 2021 roku, który posłużył mi do danych w prognozie urodzeń. Resztę urodzeń stanowić będą dziewczynki. Arbitralnie przyjąłem taki sam podział noworodków z prognozy w kolejnych latach. Dla tej grupy obliczę zgony wg współczynnika dla wieku 0, ale odejmę je na koniec w podsumowaniu liczby ludności danego rocznika. Ta pozorna komplikacja sprawi, iż arkusz będzie wyglądał czytelnie i w razie potrzeby łatwo będzie zmienić prognozę urodzeń w kolejnych latach.
Bo kolejny krok to potraktowanie wyniku dla roku 2023 jako danych wejściowych tak jak tych z roku 2022, i obliczenie zgonów i stanu ludności na koniec 2024 roku. I tak dalej, i tak dalej, aż do roku 2040, bo taki okres obejmowała prognoza urodzeń.
Wyniki.
To było sporo pracy, ale gdy już się uda powielić obliczenia, można pokusić się o tabelkę z podsumowaniem: ile w danym roku było urodzeń, zgonów, jaki jest stan ludności. Takie liczby pomagają też odnaleźć błędy, a kilka ich po drodze zrobiłem; mam nadzieję, iż do chwili publikacji wpisu wyeliminuję wszystkie. Mając dane w jednym miejscu, łatwo wykonać jest wykres. I oto on!
Urodzenia i zgony rozjeżdżają się w odmiennych trendach, tworząc dwie dość płynne linie. Już wiemy z poprzedniego wpisu, iż to skutek uproszczenia, które polega na zaniechaniu rysowania przebiegów probabilistycznych odchylających losowo współczynniki.
Ujemny przyrost naturalny będzie się pogłębiał od przedziału 130-140 tys. osób do niemal 300 tys. Warto zauważyć, iż prognoza omija całkowicie migrację. Gdyby ją zamodelować, należałoby przewidzieć wpływ migracji w rozbiciu na wiek i płeć, a to zadanie arcytrudne. Z drugiej strony wiemy, iż migracja może zarówno dodawać urodzeń, jak i zgonów, a dodatnia migracja zneutralizowałaby ujemny przyrost naturalny. Tylko czy to możliwe, co roku ściągać coraz więcej osób, choćby 300 tys.?
Jak będzie wyglądać bazowo liczba ludności w powyższej prognozie?
Przy takim, bazowym modelu, ludność Polski spadnie do około 33,5 mln osób w 2040 roku. Do 2030 spadek będzie przyspieszał, bo rośnie luka przyrostu naturalnego.
Warto spostrzec, iż oprócz migracji ten model nie bierze pod uwagę zmieniającego się trwania życia. Pandemia skracała trwanie życia, ale ono generalnie rośnie, dzięki postępowi w medycynie i kulturze życia. Dość pesymistycznie założyłem stałość współczynników ryzyka zgonu; gdyby założyć ich spadek, to liczba zgonów nieco wyhamuje. Jednak w krótkim terminie, jakim jest okres do roku 2040, trudno takie założenia robić, na razie odrabiamy to, co zabrała nam ze zdrowia pandemia.
Uzyskana prognoza może znacznie różnić się od realnych wyników, jednak mając ją, można dyskutować, co jest źródłem różnicy: zastosowane uproszczenia, odchylenie związane z losowością, czy może jakieś zjawisko, którego w ogóle nie brałem pod uwagę. To mogą być tematy przyszłych dyskusji, w których wrócę do wpisu. Z wyników można też wyciągnąć wiele dodatkowych wniosków. Np. grupa stulatków, w tej chwili niecałe 6 tys. osób, rośnie w prognozie do ponad 14 tys. seniorów!
To nie koniec!
Być może chcielibyście sami poeksperymentować z liczbami lub sprawdzić, czy nie ma błędów. Dlatego postanowiłem (!!! gdzie drugi taki blogger, co odkrywa swoje narzędzia?) udostępnić cały plik z danymi w trybie do odczytu, ale możecie wykonać swoje kopie i wykorzystać, tworząc bardziej złożone modele lub eksperymentować z liczbami. Mam tylko prośbę, gdyby ktoś wykorzystał moją pracę w swojej, by w takim wypadku powołać się na ten wpis i arkusz jako bazowy.
Link do arkusza Google Docs prognozy zgonów i ludności.
Plik zawiera dwa arkusze: jeden oblicza ryzyka zgonu z danych GUS. Drugi zawiera prognozowane zgony i liczby ludności (kolejne lata horyzontalnie) według wieku, a poniżej podsumowanie i wykresy. Miłej zabawy!