Обговорення Зворотній зв'язок
Оновлення 835-ї Постанови, час якої настав.
15.08.2024
Поки ми досі чекаємо від МінЦифри на системну роботу щодо відкритих даних в умовах війни, давайте обговоримо зміни 835-ої Постанови, які вже давно назріли.
Майже 6-ть років як триває дискусія про необхідність змінити набір форматів відкритих даних.
Проблема у тому, що цей набір містить формати, які взагалі не відповідають визначенню машиночитності відкритих даних. Мова про "графічні дані", включаючи GeoTIFF, "відеодані", "аудіодані", Macromedia Flash, DMF, які не є форматами структурованих даних. Сюди ж входять і "текстові дані", зокрема PDF, які у загальному випадку теж не є структурованими даними. У будь-якому разі, якщо у текстових даних є структура, то існує можливість, і згідно Постанови розпорядник зобов'язаний, перетворити таку інформацію у форму відкритих даних.
Хибний перелік форматів призводить до того, що розпорядники свідомо, або через брак знань, публікують купи формально відкритих, але неякісних, даних. Вони вимагають надмірної роботи зі структуризації, або взагалі не годяться для роботи.
Окремо у Постанові треба уточнити, що формати "архів даних" використовуються тільки для цілей спрощення оприлюднення відкритих даних: зменшення об'ємів файлів(наборів) даних, об'єднання кількох окремих файлів в один файл-архів. Такі формати повинні містити тільки інші формати відкритих даних, щоб не було спокуси вкласти в архів, наприклад, скан-зображення або той самий PDF.
Щоб підкреслити особливість архівів даних, було б добре описати їх окремим пунктом Постанови.
Під час одного із нещодавніх обговорень пролунала ідея прибрати із форматів XLS(X). Але враховуючи досвід, ми поки-що виступаємо проти такої кардинальної зміни. Є чимало налагоджених процесів поширення відкритих даних, де сумлінні розпорядники використовують саме XLS(X). Буде контр-продуктивно зобов'язувати їх змінювати процеси суто заради зміни формату.
Для несумлінних же розпорядників, які можуть зловживати XLS(X)-форматом, варто окремими пунктом Постанови додати обмеження на вміст наборів даних, щоб там не було мультимедіа(аудіо, відео, зображення і т.д.). Ця норма буде корисною не тільки для регулювання використання XLS(X), але й буде гарним загальним запобіжником для інших форматів, у тому числі для тих, що можуть з'явитись у майбутньому. Наприклад, окрім XLS(X) ще є ODS(Open Document Spreadsheet). Головна різниця між ними у тому, що перший - є пропрієтарним і похідним від другого, якщо говорити про XLSX.
Пріоритетним же форматом ми пропонуємо обрати CSV замість JSON, оскільки у першого ширша підтримка "із коробки" тими ж таки табличними процесорами.
Інша проблема була закладена вихідною ідеєю розробки Постанови. Це мав бути "чарівний копняк" для розпорядників, без якого вони не почнуть публікувати набори даних. Як наслідок, структура документу часто викликає у них хибне враження, що інші набори відкритих даних, окрім як перелічені у додатку до Постанови, оприлюднювати не потрібно. Дарма, що про зворотне говорить Закон про доступ до публічної інформації, оскільки у розпорядників часто може не бути повного знання і розуміння законодавства. Але нести витрати на доведення неправомірності відмов у наданні відкритих даних у таких випадках вимушений запитувач.
Тому пропонується зробити структуру Постанови більш очевиднішою, і явно виокремити два розділи "Загальні положення" та "Порядок публікації пріоритетних наборів даних". У другий розділ переноситься все, що стосується вимог до публікації пріоритетних(особливої цінності) наборів даних: строки, паспорти, державний веб-портал і т.д., включно із їх переліком. Для більшої надійності сюди варто додати пункт, що перелік не є виключним, і інші набори надаються згідно Закону і загальних положень Постанови.
Найбільшу проблему зараз становить п.3 Постанови, який обмежує область дії на "... набір даних, визначений у переліку наборів даних, які підлягають оприлюдненню у формі відкритих даних, згідно з додатком". Т.ч., зокрема, обов'язок перетворення публічної інформації у форму відкритих даних НЕ стосуватиметься запитів даних.
Інші публікації.
blog comments powered by Disqus