Инфраструктура

Как да планираме София като умен град?

Споделяне

Създаването на единна общинска база данни е важна стъпка в тази посока

Жоро Пенчев, експерт софтуерни системи и данни в ОП „Софияплан“

В последните години твърдението, че данните са златото на XXI век, е започнало вече да се превръща в клише. Данни за навиците ни захранват бизнесите на огромните корпорации от Силициевата долина. Данни за настроенията ни решават избори и определят политически кампании. Данни за храненето ни позволяват на учените да подобряват здравето ни, а данни за пазаруването ни позволяват на магазините да преценят колко стока да поръчат занапред. Данни, разбира се, е имало винаги. Но с развитието на софтуерните системи все по-сложни модели, често с помощта на технологии от сферата на изкуствения интелект, могат да анализират тези данни и да правят прогнози на тяхна база.

По същия начин данните за града ни позволяват да планираме по-добре и да създаваме по-ефективни политики. Например знанието за това в какви часове и по какви направления се придвижват пешеходците в града би могло да ни помогне да организираме по-добре пешеходната инфраструктура, така че да е по-удобна за гражданите. Информацията за дейностите, които влияят най-много върху качеството на въздуха, ни позволява да приоритизираме политика и мерки, които се борят със съответния най-сериозен причинител. Данните за потреблението на градския транспорт помагат да оптимизираме линиите, за да харчим по-малко гориво и да повишим скоростта му.

Това именно е „умният“ град, за който говорим толкова много през последните години. Градът, който следи състоянието си в реално време, следи резултатите от политиките, които провежда, и може да прави бързи и навременни промени за по-добри резултати. Или както е записана във „Визия за София“, задачата на града е да „използва ефективно ресурсите си за постигане на стратегическите си цели“.

Общинското предприятие „Софияплан“ е ангажирано с мащабната задача да реорганизира правенето на политики в града на базата на данни и анализи, използвайки съвременни софтуерни технологии. Това отразява препоръките на „Визия за София“ планирането да бъде координирано, за да предотврати обичайния за града ефект на много стратегии и действия в различните направления на общината, които не съответстват едни на други и не работят в синхрон.

Данните, разбира се, не са панацея. За да може да бъде извлечено знание от тях и да служат за адекватни прогнози, трябва да съществуват добри модели, които да бъдат захранвани с тези данни. А това струва време и средства. Как точно се тълкуват данните също може да бъде проблем, тъй като винаги съществува риск интерпретацията да е подчинена на конкретни политически цели. Проблем е и анонимизацията. В градовете по света, където smart city концепциите са най-напреднали, стават все по-сериозни опасенията за правото на лично пространство, когато целият живот на обитателите им бива превърнат в данни от сензори. Затова е необходима сериозна регулация по защита на личните данни, а анализи трябва да се правят само върху агрегирани и анонимизирани такива.

Разбира се, решения на тези предизвикателства съществуват и са свързани най-вече с добра законодателна рамка. В София обаче има далеч по-голям проблем пред по-умното планиране. Данните просто липсват. От една страна, защото няма ресурси за по-активното им събиране - това би изисквало хардуерни сензори, камери, преброявания. Но по-съществено, защото наличните данни рядко са технически използваеми.

Как протича опит за анализ върху набор от данни в ОП „Софияплан“ в момента?

Идентифицира се потенциалният им източник. Това може да е администрация в общината или частна компания. Ако е частна компания, трябва да се водят преговори и да се търси общ интерес. Ако е администрация, трябва да се пише официално писмо с искане и мотивация. Комуникацията става бавно и в двата случая. При добро стечение на обстоятелствата се изпращат данни. Но истинското предизвикателство започва оттук насетне. Тези данни често са сканирани таблици или дори свободен текст (!), защото данните съществуват само на хартия. Или са обобщена информация на ниво, което не върши никаква работа за анализа. Или в остарял формат. Или им липсват съществени метаданни, като например към коя дата са актуални. Или адресите са написани по особен начин. Или просто противоречат логически на други данни. Служителите на ОП „Софияплан“ прекарват значително време да „изчистят“ тези данни, след което евентуално те успяват да достигнат до солидния вече архив от градска информация на предприятието и оттук нататък могат да бъдат ползвани за реален анализ.

Не е необходимо човек да е специалист по софтуерни системи или административни процеси, за да види с просто око, че всичко това е изключително неефективно. А това струва на града време, човешки труд и пари. Време, в което София би могла да започне да изглежда по-добре, човешки труд, който би могъл да е насочен към стратегии и иновация, и пари, които биха могли да бъдат похарчени за доста по-амбициозни задачи. При това ОП „Софияплан“ е само един от ползвателите на данни в администрацията. Всъщност всички нейни звена създават и изпълняват политики, които биха били по-добри, по-умни и най-вече по-ефективни, ако беше лесно да се достъпват градски данни и да се ползват за анализ и прогноза.

Тук е ролята на предложението за създаване на Единна общинска база данни (ЕОБД)

Идеята е сред ключовите мерки, които „Визия за София“ предложи в посока дигитализация на администрацията и оптимизация на процесите в нея. Накратко, това означава всички данни, с които общината работи и произвежда, да бъдат достъпни по унифициран, стандартен начин от всеки, който има нужда от тях при работата си в администрацията.

Предложената система трябва да играе ролята на мост, или в технически термини -  „интерфейс“, между ползвателите на данни и източниците на данни. Тя трябва на първо място да предлага каталог, което да спести стъпката по издирването на конкретен набор данни, който е нужен за даден анализ. После системата трябва да осигурява достъп до поисканите данни, като желателно е той да може да бъде по-сложен, т.е. да позволява комбиниране на данни от различни набори по начин, който е полезен на ползвателя. Накрая, при определени и строго дефинирани условия, системата трябва да дава възможност за заявки за промяна на данните, където това е необходимо, например при грешки в тях.

Важно е да отбележим, че ЕОБД не е задължително класическа база данни, която просто да съхранява цялата административна и градска информация. Това е така, защото в законодателната рамка съществува понятието „първичен източник“ на данни, т.е. това е администрацията, която е натоварена да събира и организира тези данни под формата на някакъв регистър. Този първичен източник играе ролята и на източник на истина, т.е. той би трябвало да съхранява най-новата и актуална информация и при разлики между две копия на данните да бъде консултиран кое е достоверното. Единната общинска база данни не може да бъде такъв източник, защото нейната цел е да обхване достъпа до данните на много първични източници. Ролята й е да предлага унифициран достъп, а не толкова да бъде място, където физически се съхраняват данните, въпреки че и това е възможно.

Въпросът с източника на истина се решава именно чрез осигуряването на достъп в реално време до всички данни, независимо от кого са произведени. Това спестява нуждата от поддържане на копия и „снимки“ на информацията, които бързо стават неактуални. Така анализите също стават по-бързи и достоверни. В допълнение, много градски данни всъщност не са подходящи за класическа база и трябва да бъдат физически съхранявани по друг начин. Затова и по света често тази структура се нарича data lake, или „езеро от данни“, за да отрази гъвкавите начини, по които данните се достъпват от нея.

Какви са предимствата на такава система?

Освен каталогизацията на данни, което спестява търсенето им с писма и телефонни разговори, основното предимство е унифицирането на достъпа. Понастоящем данните се съхраняват в много различни системи (някои от тях са класическата „система“ на хартия в папка), които не са познати на ползвателите. Затова се налага те да делегират заявката си на звеното, което поддържа конкретната база данни, но това често усложнява процеса.

При унифицирания (софтуерен) достъп след съответно обучение служителите получават възможност да ползват всички данни, предоставяни от системата. Много по-важно обаче е, че унифицираният достъп предлага възможност не хора, а програми много лесно да боравят с данните. Тоест, когато общината си поръча изработката на конкретен модел за анализ или го разработи сама, не се налага софтуерът за този модел да поддържа десет различни начини за сдобиване с различните данни, а само един, добре известен и документиран. Разбира се, това е по-евтино и по-бързо. Допълнително единната точка на достъп дава възможност да се приложат и унифицирани стандарти за сигурност, за журнал на достъпа до данните, за потребителски роли и за потребителско преживяване. Особено от гледна точка на сигурност, това е ключово.

Звучи добре. Но какви са предизвикателствата пред изработването ѝ?

В общината и прилежащите ѝ администрации се съхраняват много данни от различни екипи по различни начини. Когато казваме, че единната общинска база данни трябва да уеднакви достъпа до тях, за да не се налага програми и хора да знаят всички различни подходи, ние на практика делегираме на създателите на системата задачата да информират за тези начини и да ги „маскират“ чрез единния достъп. Това е много трудоемка задача. В рамките на „Визия за София“ екип от експерти проведе проучване в опит да каталогизира данните по звена и да направи техническа оценка на състоянието им, но то успя да обхване едва половината администрации и поради времеви ограничения нямаше възможност да влезе навсякъде в необходимия технически детайл. Това усилие трябва да бъде довършено, за да може да се осигури програматично „мост“ между единната система и различните източници на данни. Разбира се, като част от този процес най-ефективно би било самите източници на данни, т.е. съответните звена в администрацията, да започнат да следват единни подходи по съхранението, достъпа, формата, метаданните и т.н. Дори ако това означава физически да съхраняват данните си на предоставено от ЕОБД и общината място. Именно с цел такова уеднаквяване на процеси и политики е и предложението на „Визия за София“ за „главен служител по информацията“ (CIO). Това е офис, присъстващ в много градове в Европа и по света, който налага общи политики, стандарти и механизми по всички въпроси от сферата на информационните системи. В София за съжаление такъв офис с хоризонтални права над всички администрации все така не съществува въпреки наличието от 2020 г. на направление по дигитализация, което може да изпълнява част от тази задача. Промяната на процесите е бавна задача. Ето защо хибриден подход, при който се работи и по тази промяна, и по временни софтуерни „мостове“ между източници на данни и единната система, изглежда най-подходящ.

Това същото ли е като отворените данни?

Не точно. Отворените данни са стандарт, по който данни се предоставят за свободен достъп в машинно четим вид с цел автоматизирано ползване. Данните, които ще предоставя ЕОБД, трябва да отговарят на този стандарт, т.е. да бъдат машинно четими и с необходимите метаданни (описания за самите данни), но не всички те ще са задължително „отворени“ в смисъла на достъпни за свободно ползване. Основната задача, която ЕОБД решава, е хаосът с потреблението на данни вътре в администрацията.

Докъде сме стигнали с изработката на единната система?

На този етап тя е все още е предложение. Направлението по дигитализация и иновации в общината припознава проекта. От миналата година задачата присъства и сред целите в Стратегията за дигитална трансформация на София". Амбицията е да го задвижи в рамките на мандата си. Възможен е постепенен подход, при който се обхващат само част от източниците пилотно или не са налични всички функционалности. Предстои техническа оценка на такова усилие. Сигурно е обаче, че задачата трябва да се извърши внимателно от гледна точка на системна архитектура, за да може действително да реши проблемите с достъпа до градски данни. Създаването на единната общинска база данни ще бъде голяма стъпка към превръщането на София в умен град.

Пълният текст - в брой 2 на сп.ГРАДЪТ