Дубілета звинуватили у фальсифікації «електронного перепису»

|
Версия для печатиВерсия для печати

Дані статево-вікової структури у «переписі» п. Дубілета отримані шляхом простого множення даних Держстату на 0,888 (або 88,8%).

Про це повідомляє громадська організація "Український центр громадських даних".

Нещодавно Кабмін з великою помпою оприлюднив дані про чисельність населення України, з розбивкою за регіонами, з деталізацією за віком і статтю і тд. Одним із аргументів на користь такої «оцінки», а не традиційного перепису за стандартами ООН, було здешевлення та використання сучасних технологій, поєднання даних різних реєстрів і тд. 

Так, 23 січня 2020 р. міністр Кабінету міністрів України Дмитро Дубілет у своєму телеграм-каналі опублікував PDF-файл (https://t.me/dmytro_dubilet/578) з презентацією «Оцінки чисельності наявного населення». Більше даних, або більш детального пояснення застосованих методів оцінки опубліковано не було.

Одним із методів було заявлено «Комбінований метод оцінки чисельності наявного населення (дані статево-вікової структури населення + дані реєстрів)». 

01https://socialdata.org.ua/wp-content/uploads/2020/02/01-768x364.jpg 768w, https://socialdata.org.ua/wp-content/uploads/2020/02/01.jpg 965w" sizes="(max-width: 965px) 100vw, 965px" />

Що про цей метод відомо: 

  1. Вираховувалися частки населення за статево-віковою структурою за даними Держстата та державних реєстрів

  2. Із даних Державного реєстру загальнообов’язкового державного соціального страхування визначалася чисельність осіб віком 60+ з урахуванням пенсіонерів із ОРДЛО, які приїжджають по пенсії

  3. Дані щодо чисельності осіб віком 60+ екстраполювалися на дані статево-вікової структури

02https://socialdata.org.ua/wp-content/uploads/2020/02/02.jpg 759w" sizes="(max-width: 759px) 100vw, 759px" />

Важко пояснити причину такого бажання, але вирішили ми подивитися, наскільки статево-вікова структура населення, представлена в «Оцінці…», корелює із даними, що опубліковані на сайті Державної служби статистики України.

Отримавши дані, що лежать у вільному доступі на сайт Держстату (Таблиця: 0204. Розподіл постійного населення за статтю, віковими групами та типом місцевості), ми їх згрупували за віковими групами, зазначеними у презентації п. Дубілета:

  • Діти: 0-14 років

  • Ранній працездатний вік: 15-24 роки

  • Основний працездатний вік: 25-54 роки

  • Зрілий працездатний вік: 55-64 роки

  • Літні люди: 65 років і старше

Результат можна побачити у таблиці:

https://docs.google.com/spreadsheets/d/1il-RCOHuy6kozVcR-V0de1vf50gQC6gieVp5Zgt7gvg/edit?usp=sharing

Потім узагальнені за віковими групами дані ми співставили із показниками з презентації Дубілета. Відразу якось дивно вразило практичне однакове співвідношення між статево-віковими групами — що становить близько 88,8% (дані Дубілета від даних Держстату).

03https://socialdata.org.ua/wp-content/uploads/2020/02/03.jpg 761w" sizes="(max-width: 761px) 100vw, 761px" />

І тут закралася підозра. А, що якщо ніякої «екстраполяції» насправді не було? А було тупо множення даних Держстату на коефіцієнт 0,888 (або 88,8%)? А незначні розбіжності у співвідношеннях — це лише результат округлень (бо не комільфо зазначати у висновках, у що нас 8 110 378,392 (триста дев’яносто дві тисячних) осіб підраховано).

Маючи сподівання, що це все-ж таки плід нашої уяви, і не може ж все бути так тупо, ми спробували відтворити можливе застосування коефіцієнта 0,888 до даних Держстату. Після кількох ітерацій (що зайняло з півгодини часу), нам вдалося із практично 100% точністю згенерувати дані, що їх опублікував п. Дубілет, як буцімто результат «екстраполяції» даних пенсійного реєстру на дані Держстату.

04https://socialdata.org.ua/wp-content/uploads/2020/02/04.jpg 656w" sizes="(max-width: 656px) 100vw, 656px" />

Звертаємо увагу, що на другому кроці округлення до сотень було здійснено через ROUNDUP — до найближчого більшого значення (не питайте, чому, це загадка для нас). Також ці розрахунки може повторити кожен охочий, а для зручності ми також виклали табличку з нашими розрахунками у вільний доступ: https://docs.google.com/spreadsheets/d/1il-RCOHuy6kozVcR-V0de1vf50gQC6gieVp5Zgt7gvg/edit#gid=1131691965
05https://socialdata.org.ua/wp-content/uploads/2020/02/05.jpg 621w" sizes="(max-width: 621px) 100vw, 621px" />

Як видно із табличок, лише для однієї статево-вікової групи (жінки, 15-24 роки) результат наших примітивних розрахунків не збігся із супер-сучасними методами обробки і аналізу «big data» п. Дубілета. Так, замість 1740 тис осіб, у нас вийшло 1741 тис осіб.

Але, при цьому, варто відзначити, що у п. Дубілета також не сходяться суми за віковими групами. Так, якщо просумувати усіх чоловіків у його презентації, то виходить 17 млн 281 тис, а не 17 млн 280 тис осіб. 

«Аргумент»


 

В тему:

 

Читайте «Аргумент» в Facebook и Twitter

Если вы заметили ошибку, выделите ее мышкой и нажмите Ctrl+Enter.

Важно

Как эффективно контролировать местную власть

Алгоритм из 6 шагов поможет каждому контролировать любых чиновников.

Как эффективно контролировать местную власть

© 2011 «АРГУМЕНТ»
Републикация материалов: для интернет-изданий обязательной является прямая гиперссылка, для печатных изданий - по запросу через электронную почту. Ссылки или гиперссылки, должны быть расположены при использовании текста - в начале используемой информации, при использовании графической информации - непосредственно под объектом заимствования. При републикации в электронных изданиях в каждом случае использования вставлять гиперссылку на главную страницу сайта www.argumentua.com и на страницу размещения соответствующего материала. При любом использовании материалов не допускается изменение оригинального текста. Сокращение или перекомпоновка частей материала допускается, но только в той мере, в какой это не приводит к искажению его смысла.
Редакция не несет ответственности за достоверность рекламных объявлений, размещенных на сайте а также за содержание веб-сайтов, на которые даны гиперссылки. 
Контакт:  uargumentum@gmail.com