Автори:
Олександр Човган, заслужений журналіст України
Павло Кулаков, доктор технічних наук, професор
Ще 7 днів тому все в точності повторювалося як в Іспанії за аналогічний період. Сьогодні відстаємо у 6 разів (1319 випадків проти 7988, дивіться таблицю нижче). З них 0,76% — на Хмельниччині (переважно у Хмельницькому). При тому, що лікарні тестами вже забезпечені.
Для того, щоб планувати майбутнє (а не сидіти Ждуном в очікуванні примарного завершення карантину), ми за допомогою декількох загальновідомих стандартних методик екстраполювали залежності, які відображають кількість випадків захворювання в Іспанії та Україні. Слід відзначити, що наведені результати не є результатами наукового дослідження в галузі медицини, вони є виключно результатами статистичної обробки даних.
Нижче ми опишемо, яким чином були розраховані оптимістичний та песимістичний прогнози (для залучення широкої аудиторії експертів, які можуть покращити наші розрахунки — в коментарях та інших чином). За нашими розрахунками, на 24 квітня будемо мати в Україні від 8 до 58 тисяч хворих.
Якщо сьогодні на Хмельниччині приблизно 0,76% від всієї кількості хворих в Україні, при рівні госпіталізації 82%, у нас вже в цьому місяці має бути готово щонайменше 61×0,82 ≈ 50 ліжко-місць. Наразі їх майже вп’ятеро більше, але це відповідає тільки найбільш оптимістичному сценарію. Якщо сценарій буде песимістичним, необхідно буде 58000×0,0076×0,82 ≈ 361 ліжко-місце станом на 24 квітня.
До речі, рівень смертності, за нашим оціночним судженням, буде як в Італії (13%), оскільки фактор віку італійців приблизно компенсується фактором поганої медицини (включаючи недостатню кількість апаратів ШВЛ). Проте таку (та ще більшу) смертність ми будемо бачити в статистичних даних в червні.
Ось наш прогноз на наступні три тижні:
Позитивний та негативний сценарій (графік побудований 2 квітня):
Випадки |
Випадки |
|||
Дата |
Україна: позитивний сценарій |
Україна: негативний сценарій |
Дата |
Іспанія: факт |
14.03.2020 |
4 |
4 |
21.02.2020 |
2 |
15.03.2020 |
5 |
5 |
22.02.2020 |
2 |
16.03.2020 |
8 |
8 |
23.02.2020 |
2 |
17.03.2020 |
16 |
16 |
24.02.2020 |
3 |
18.03.2020 |
19 |
19 |
25.02.2020 |
9 |
19.03.2020 |
29 |
29 |
26.02.2020 |
13 |
20.03.2020 |
53 |
53 |
27.02.2020 |
25 |
21.03.2020 |
68 |
68 |
28.02.2020 |
33 |
22.03.2020 |
77 |
77 |
29.02.2020 |
58 |
23.03.2020 |
97 |
97 |
01.03.2020 |
84 |
24.03.2020 |
131 |
131 |
02.03.2020 |
120 |
25.03.2020 |
188 |
188 |
03.03.2020 |
165 |
26.03.2020 |
256 |
256 |
04.03.2020 |
228 |
27.03.2020 |
329 |
329 |
05.03.2020 |
282 |
28.03.2020 |
426 |
426 |
06.03.2020 |
401 |
29.03.2020 |
488 |
488 |
07.03.2020 |
525 |
30.03.2020 |
562 |
562 |
08.03.2020 |
674 |
31.03.2020 |
686 |
686 |
09.03.2020 |
1 231 |
01.04.2020 |
804 |
804 |
10.03.2020 |
1 695 |
02.04.2020 |
973 |
872 |
11.03.2020 |
2 277 |
03.04.2020 |
1 186 |
964 |
12.03.2020 |
3 146 |
04.04.2020 |
1 454 |
1 027 |
13.03.2020 |
5 232 |
05.04.2020 |
1 786 |
1 108 |
14.03.2020 |
6 391 |
06.04.2020 |
2 118 |
1 176 |
15.03.2020 |
7 988 |
07.04.2020 |
2 449 |
1 242 |
16.03.2020 |
9 942 |
08.04.2020 |
2 781 |
1 696 |
17.03.2020 |
11 826 |
09.04.2020 |
3 113 |
2 281 |
18.03.2020 |
14 796 |
10.04.2020 |
3 445 |
3 151 |
19.03.2020 |
18 077 |
11.04.2020 |
3 777 |
5 242 |
20.03.2020 |
21 571 |
12.04.2020 |
4 109 |
6 387 |
21.03.2020 |
25 496 |
13.04.2020 |
4 440 |
7 994 |
22.03.2020 |
28 768 |
14.04.2020 |
4 772 |
9 956 |
23.03.2020 |
35 136 |
15.04.2020 |
5 104 |
11 826 |
24.03.2020 |
42 058 |
16.04.2020 |
5 436 |
14 814 |
25.03.2020 |
49 515 |
17.04.2020 |
5 768 |
18 106 |
26.03.2020 |
57 786 |
18.04.2020 |
6 100 |
21 280 |
27.03.2020 |
65 719 |
19.04.2020 |
6 431 |
25 511 |
28.03.2020 |
73 235 |
20.04.2020 |
6 763 |
28 774 |
29.03.2020 |
80 110 |
21.04.2020 |
7 095 |
35 142 |
30.03.2020 |
87 956 |
22.04.2020 |
7 427 |
42 051 |
31.03.2020 |
95 923 |
23.04.2020 |
7 759 |
49 510 |
01.04.2020 |
104 118 |
24.04.2020 |
8 091 |
57 752 |
02.04.2020 |
112 065 |
Останнім часом в інтернеті багато порівнянь різних сценаріїв розвитку захворювання на COVID-19 в Україні, які базуються на статистичних даних з інших країн. Журналісти RIA отримали загальнодоступні дані для порівняння сценаріїв Іспанії і України за короткий період та вирішили їх перевірити:
В першу чергу, ми перевірили дані на сайті національної служби здоров’я України та на сайті із статистикою по захворюваннях в Іспанії. Дані по Україні були не актуальні, тому ми їх замінили для подального аналізу. Дані по Іспанії були точними.
Випадки |
Випадки |
||
Дата |
Україна: прогноз |
Дата |
Іспанія: факт |
21.03.2020 |
68 |
28.02.2020 |
33 |
22.03.2020 |
77 |
29.02.2020 |
58 |
23.03.2020 |
97 |
01.03.2020 |
84 |
24.03.2020 |
131 |
02.03.2020 |
120 |
25.03.2020 |
188 |
03.03.2020 |
165 |
26.03.2020 |
256 |
04.03.2020 |
228 |
27.03.2020 |
329 |
05.03.2020 |
282 |
28.03.2020 |
426 |
06.03.2020 |
401 |
29.03.2020 |
488 |
07.03.2020 |
525 |
30.03.2020 |
562 |
08.03.2020 |
674 |
31.03.2020 |
686 |
09.03.2020 |
1 231 |
01.04.2020 |
804 |
10.03.2020 |
1 695 |
02.04.2020 |
11.03.2020 |
2 277 |
|
03.04.2020 |
12.03.2020 |
3 146 |
|
04.04.2020 |
13.03.2020 |
5 232 |
|
05.04.2020 |
14.03.2020 |
6 391 |
|
06.04.2020 |
15.03.2020 |
7 988 |
|
07.04.2020 |
16.03.2020 |
9 942 |
|
08.04.2020 |
17.03.2020 |
11 826 |
|
09.04.2020 |
18.03.2020 |
14 796 |
|
10.04.2020 |
19.03.2020 |
18 077 |
|
11.04.2020 |
20.03.2020 |
21 571 |
|
12.04.2020 |
21.03.2020 |
25 496 |
Спираючись на графіки цих двох ресурсів, можна на перший погляд побачити однакову тенденцію зростання кількості випадків захворювання:
В Україні була схожа тенденція захворювання на COVID-19, але за рахунок швидкого запровадження карантину Україна, скоріше за все, не буде мати таку велику кількість випадків захворювання, як в Іспанії, хоча в перші два тижні спостерігалася велика кореляція по експоненційному зростанню. В зв'язку із дотриманням карантинних заходів в Україні не буде «іспанського сценарію». Кількість захворювань буде в ~16 разів меншою, що дозволить лікарням забезпечити лікування хворих, і лікарні не будуть катастрофічно переповнені. До 24 квітня, у відповідності з оптимістичним сценарієм, буде 8091 хворий.
Для розрахунку позитивного сценарію ми використали апроксимацію функції кількості випадків захворювання від дати (за початкову точку взяли 14 березня). Ми вважали, що в Україні, як і в Іспанії, спочатку крива зростання була наближена до експоненційної функції, потім, на наш погляд, найкращою моделлю для її опису стала квадратична регресія, а через 2—5 днів крива перейшла до лінійного зростання.
Будемо вважати, що x — порядковий номер дня спостереження, а y — кількість випадків. Візьмемо теоретичну ситуацію, де x = 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, відповідно y = 1, 4, 9, 16, 25, 36, 49, 64, 81, 100.
Для розрахунку ми користувалися онлайн-калькулятором для апроксимації функції однієї змінної https://planetcalc.ru/5992.
Декілька визначень:
Коефіцієнт кореляції — це статистичний показник залежності двох випадкових величин. Коефіцієнт кореляції може приймати значення від -1 до +1. Якщо обидві величини розвиваються у одному напрямі, то коефіцієнт кореляції позитивний, якщо у протилежному напрямі — то величини контрваріантні і коефіцієнт кореляції негативний. Якщо між величинами будь-яка залежність відсутня — коефіцієнт кореляції дорівнює нулю.
Коефіцієнт детермінації — статистичний показник, що використовується в статистичних моделях як міра залежності варіації залежної змінної від варіації незалежних змінних. Вказує, на скільки отримані спостереження підтверджують модель. Моделі з коефіцієнтом детермінації вище 80% у більшості випадків визнають адекватними.
Середня помилка апроксимації — середнє значення відхилення апроксимуючої функції від фактичних значень.
Розглянемо показник захворюваності в Іспанії і спробуємо описати його найбільш адекватною моделлю.
Ось що нам дає квадратична регресія
Показники кореляції і детермінації хороші, проте вони не зовсім відповідають реальному стану, оскільки потрібно враховувати і середню помилку апроксимації.
При пошуку підходящої апроксимуючої функції виявилося, що найкраще на цю роль підходить кубічна регресія, однак середня помилка апроксимації говорить про те, що ця модель не може адекватно описати зростання захворюваності:
Дата |
Факт |
Прогноз |
21.02.2020 |
2 |
-401 |
22.02.2020 |
2 |
43 |
23.02.2020 |
2 |
335 |
24.02.2020 |
3 |
494 |
25.02.2020 |
9 |
543 |
26.02.2020 |
13 |
502 |
27.02.2020 |
25 |
392 |
28.02.2020 |
33 |
235 |
29.02.2020 |
58 |
51 |
01.03.2020 |
84 |
-139 |
02.03.2020 |
120 |
-314 |
03.03.2020 |
165 |
-452 |
04.03.2020 |
228 |
-533 |
05.03.2020 |
282 |
-535 |
06.03.2020 |
401 |
-437 |
07.03.2020 |
525 |
-220 |
08.03.2020 |
674 |
140 |
09.03.2020 |
1 231 |
662 |
10.03.2020 |
1 695 |
1 367 |
11.03.2020 |
2 277 |
2 277 |
12.03.2020 |
3 146 |
3 413 |
13.03.2020 |
5 232 |
4 796 |
14.03.2020 |
6 391 |
6 446 |
15.03.2020 |
7 988 |
8 386 |
16.03.2020 |
9 942 |
10 635 |
17.03.2020 |
11 826 |
13 214 |
18.03.2020 |
14 796 |
16 146 |
19.03.2020 |
18 077 |
19 451 |
20.03.2020 |
21 571 |
23 149 |
21.03.2020 |
25 496 |
27 263 |
22.03.2020 |
28 768 |
31 812 |
23.03.2020 |
35 136 |
36 819 |
24.03.2020 |
42 058 |
42 303 |
25.03.2020 |
49 515 |
48 287 |
26.03.2020 |
57 786 |
54 791 |
27.03.2020 |
65 719 |
61 836 |
28.03.2020 |
73 235 |
69 443 |
29.03.2020 |
80 110 |
77 634 |
30.03.2020 |
87 956 |
86 428 |
31.03.2020 |
95 923 |
95 848 |
01.04.2020 |
104 118 |
105 915 |
02.04.2020 |
112 065 |
116 648 |
Звідси випливає, що необхідно розбити досліджуваний період на менші частини, оскільки для кожного буде працювати своя модель.
Спочатку все було відносно гладко (до 25 лютого зростання практично не було або воно було мінімальним, однак потім почався прямо таки бум захворюваності).
При аналізі було встановлено, що цей сплеск найкраще апроксимує експоненційна регресія (період 25 лютого — 14 березня):
Порівняємо прогнозні показники за цей період з реальними:
Дата |
Факт |
Прогноз |
25.02.2020 |
9 |
12 |
26.02.2020 |
13 |
17 |
27.02.2020 |
25 |
24 |
28.02.2020 |
33 |
34 |
29.02.2020 |
58 |
48 |
01.03.2020 |
84 |
69 |
02.03.2020 |
120 |
98 |
03.03.2020 |
165 |
140 |
04.03.2020 |
228 |
200 |
05.03.2020 |
282 |
285 |
06.03.2020 |
401 |
406 |
07.03.2020 |
525 |
578 |
08.03.2020 |
674 |
824 |
09.03.2020 |
1 231 |
1 175 |
10.03.2020 |
1 695 |
1 674 |
11.03.2020 |
2 277 |
2 386 |
12.03.2020 |
3 146 |
3 401 |
13.03.2020 |
5 232 |
4 848 |
14.03.2020 |
6 391 |
6 910 |
Видно, що модель дуже добре лягає на реальну картину. Далі почав працювати карантин і заходи щодо стримування і зупинки захворюваності. Це видно з графіка, тому що прогнозна модель стала все більше відрізнятися від від реальної картини.
Наступною моделлю, яку ми використали, є кубічна регресія (15 березня — 22 березня):
15.03.2020 |
7 988 |
8 101 |
16.03.2020 |
9 942 |
9 668 |
17.03.2020 |
11 826 |
11 963 |
18.03.2020 |
14 796 |
14 829 |
19.03.2020 |
18 077 |
18 110 |
20.03.2020 |
21 571 |
21 647 |
21.03.2020 |
25 496 |
25 284 |
22.03.2020 |
28 768 |
28 863 |
І, нарешті, період 23 березня — 2 квітня. Тут все можна описати звичайною лінійною регресією, оскільки запроваджені заходи стали працювати ще краще і зростання сповільнилося ще більше:
23.03.2020 |
35 136 |
34 564 |
24.03.2020 |
42 058 |
42 262 |
25.03.2020 |
49 515 |
49 961 |
26.03.2020 |
57 786 |
57 659 |
27.03.2020 |
65 719 |
65 358 |
28.03.2020 |
73 235 |
73 056 |
29.03.2020 |
80 110 |
80 755 |
30.03.2020 |
87 956 |
88 454 |
31.03.2020 |
95 923 |
96 152 |
01.04.2020 |
104 118 |
103 851 |
02.04.2020 |
112 065 |
111 549 |
Складемо всі графіки воєдино, щоб побачити повну картину:
Дата |
Факт |
Прогноз |
21.02.2020 |
2 |
2 |
22.02.2020 |
2 |
2 |
23.02.2020 |
2 |
2 |
24.02.2020 |
3 |
3 |
25.02.2020 |
9 |
12 |
26.02.2020 |
13 |
17 |
27.02.2020 |
25 |
24 |
28.02.2020 |
33 |
34 |
29.02.2020 |
58 |
48 |
01.03.2020 |
84 |
69 |
02.03.2020 |
120 |
98 |
03.03.2020 |
165 |
140 |
04.03.2020 |
228 |
200 |
05.03.2020 |
282 |
285 |
06.03.2020 |
401 |
406 |
07.03.2020 |
525 |
578 |
08.03.2020 |
674 |
824 |
09.03.2020 |
1 231 |
1 175 |
10.03.2020 |
1 695 |
1 674 |
11.03.2020 |
2 277 |
2 386 |
12.03.2020 |
3 146 |
3 401 |
13.03.2020 |
5 232 |
4 848 |
14.03.2020 |
6 391 |
6 910 |
15.03.2020 |
7 988 |
8 101 |
16.03.2020 |
9 942 |
9 668 |
17.03.2020 |
11 826 |
11 963 |
18.03.2020 |
14 796 |
14 829 |
19.03.2020 |
18 077 |
18 110 |
20.03.2020 |
21 571 |
21 647 |
21.03.2020 |
25 496 |
25 284 |
22.03.2020 |
28 768 |
28 863 |
23.03.2020 |
35 136 |
34 564 |
24.03.2020 |
42 058 |
42 262 |
25.03.2020 |
49 515 |
49 961 |
26.03.2020 |
57 786 |
57 659 |
27.03.2020 |
65 719 |
65 358 |
28.03.2020 |
73 235 |
73 056 |
29.03.2020 |
80 110 |
80 755 |
30.03.2020 |
87 956 |
88 454 |
31.03.2020 |
95 923 |
96 152 |
01.04.2020 |
104 118 |
103 851 |
02.04.2020 |
112 065 |
111 549 |
У найгіршому випадку, при істинності гіпотези про подібність динаміки збільшення випадків COVID-19 в Україні та Іспанії, через місяць можемо мати теперішній рівень Іспанії. 24 квітня буде 57 752 хворих.
Для розрахунку параметрів песимістичного сценарію була проведена інтерполяція даних з сайтів https://www.worldometers.info/coronavirus/, https://www.ft.com/coronavirus-latest та https://nszu.gov.ua/covid/dashboard за період з 21.02.2020 по 02.04.2020, отримані для України і Іспанії результати були порівняні.
Інтерполяцію даних ми провели з використанням кубічних сплайнів, тому що у багатьох випадках якісні результати інтерполяції досягаються при використанні кубічної сплайнової функції, яка складається зі шматків кубічних поліномів, при використанні яких неможливі пульсації інтерполянта. Кубічні сплайни — це кубічні параболи, які в кожному випадку точно проходять через дві опорні точки, що визначаються за експериментальними даними. При наявності опорних точок сплайнова функція складається з окремих поліномів. У місцях стиків значення шматків кубічних поліномів збігаються між собою та із значеннями функції, що інтерполюється, також збігаються значення їх першої та другої похідної.
Вхідні результати для проведення інтерполяції є дискретними — один результат відповідає одній добі. При наявності дискретних вхідних, що унеможливлює оцінювання кількості поточних випадків захворювання у довільний момент часу. Отримання аналітичного виразу та графіка інтерполянта дозволяє з певною точністю оцінити кількість випадків захворювання у будь-який момент будь-якої доби.
Для проведення інтерполяції даних за допомогою кубічних сплайнів використовувалося спеціалізоване математичне програмне забезпечення Maple (Official web site of Maple's software developer — [Electronic resource]. — Access mode: http://www.maplesoft.com.
Номер доби на графіках, що наведені нижче, відкладений по горизонтальній вісі системи координат (вісі абсцис), перша доба відповідає даті 21.02.2020.
Результати інтерполяції наведені нижче:
Як слідує з графіків на малюнках 1—3, динаміка збільшення випадків COVID-19 в Україні та Іспанії має певну подібність, збільшення випадків в Україні почалося пізніше, ніж в Іспанії, але характер збільшення на початковому етапі майже однаковий.
Якщо за основу взяти гіпотезу про подібність динаміки збільшення випадків COVID-19 в Україні та Іспанії, яка певним чином підтверджується результатами інтерполяції, то прогнозоване збільшення кількості випадків COVID-19 в Україні може виглядати так:
Тобто у найгіршому випадку при істинності гіпотези про подібність динаміки збільшення випадків COVID-19 в Україні та Іспанії, через місяць можемо мати рівень Іспанії, як зазначено в таблиці.
Слідкуйте за новинами Хмельницького у Facebook, Telegram, Instagram, Viber та YouTube.
Слідкуйте за новинами Хмельницького у Telegram.