Къде можем да намерим алтернативни данни, за какво са полезни и кои са основните предизвикателства, разказва Александър Иванов – Head of Quantitative Research and Innovation в ISI Emerging Markets Group
Александър Иванов – Head of Quantitative Research and Innovation в ISI Emerging Markets Group. Cнимка:Economy.bg
ISI Group е мултинационален изцяло дигитален абонаментен бизнес. Kомпанията е водещ доставчик на макроикономическа и бизнес информация за развиващите се пазари.
Днес ви срещаме с Александър Иванов – Head of Quantitative Research and Innovation в ISI Emerging Markets Group, който разказва какво е Alternative Data. От него ще разберем къде можем да намерим алтернативни данни, за какво са полезни, кои са основните предизвикателства и по какво се различават от традиционната информация.
Александър, какво представлява Alternative Data и как се различава от традиционната информация?
Събирането, обработката и разпространението на икономически данни винаги е било централизиран процес, който се извършва от националните статистически институти или официални организации. Обикновено те следват препоръките на международни институции, което прави процеса още по-централизиран. Това е и една от двете основни разлики с алтернативните данни. За разлика от традиционните, алтернативните икономически данни са част от големия процес на децентрализация на информацията, който тече в последното десетилетие. Събирането и разпространението на този тип данни се извършва от много на брой организации, които в повечето случаи са частни компании. Другата основна разлика е начинът, по който се събират данните.
Докато традиционните данни се събират на база на периодични статистически изследвания, които обхващат предварително избрана извадка или цялата съвкупност от фирмите и домакинствата, алтернативните данни се събират с помощта на дигиталния отпечатък, който оставя всяка една икономическа дейност. Когато плащаме с карта, пътуваме до офиса или пишем публикация в интернет, ние генерираме данни за икономическата дейност, която извършваме, независимо дали го осъзнаваме в този момент. Това може да са данни от трансакции с банкови карти или ПОС терминали, данни за движението ни от сателитни снимки или GPS, текстови данни от публикации в уеб сайтове, форуми и социални мрежи и много други. Същото е и с бизнес дейностите. Движение на товарни камиони по пътищата, натовареност на пристанищата, публикуване на обяви за работа в интернет, всичко това отразява динамиката на бизнеса в една икономика. Това е валидно и на макрониво.
Много популярен пример за използването на алтернативни данни като показател за икономическото развитие са сателитните снимки, направени през нощта. Всички сме виждали тъмното петно, което образува Северна Корея от сателитна снимка на фона на светещите съседни Южна Корея и Япония. Или светлините на силно развитите южни и източни региони на Китай в сравнение с бедните централни и западни провинции. По-тъмното петно на сателитната снимка е и индикатор за по-нисък БВП на глава от населението, по-малко инвестиции, по-ниски доходи, по-висока бедност и т.н.
Откъде води началото си Alternative Data?
Алтернативните икономически данни са следствие от развитието на големите данни (big data). Големите данни и новите технологии правят възможно тази информация да се събира, съхранява и обработва. В същото време развитието на изкуствения интелект и в частност machine-learning моделите направиха възможно тези данни да се анализират. Това е особено важно в сферата на икономиката, защото традиционните иконометрични модели, които доминират икономическата наука и практика, не са създадени за анализ на толкова големи масиви от данни.
Докато в традиционните макроикономически анализи са по-консервативни откъм данните, които използват, алтернативни данни се използват от инвестиционни фондове за моделиране на движението на финансовите пазари от много години. Но това, което наистина разшири обхвата на приложението на тези данни, беше COVID кризата.
В първите месеци на пандемията алтернативните данни бяха всичко, с което разполагахме, за да оценим икономическия ѝ ефект, защото традиционните данни се публикуват със закъснение. За да се убедите в това, достатъчно е само да погледнете прогнозите за икономическия ефект на COVID, които се правеха в първите седмици и дори месеци на пандемията и колко неточни се оказаха няколко месеца по-късно, когато започнаха да излизат официалните статистически данни. В това време ние предоставяхме на клиентите ни дневни и седмични показатели като движение на хора, трафик по магистралите на Китай в първите седмици на пандемията или по основните пристанища и летища в света, данни за интернет търговия и банкови трансакции и много други индикатори, които им помогнаха да следят ефекта на COVID в реално време.
През този период приложението на алтернативни данни стана толкова популярно, че дори започнахме да виждаме такива данни в доклади на централните банки, които традиционно са консервативни откъм данните, които използват.
За какво са полезни алтернативните данни?
Дори след пандемията, когато икономиките се върнаха в нормалното си състояние, интересът към алтернативни данни продължава да расте, защото анализаторите се убедиха в полезността им, а и адаптираха моделите си към тях, което беше една от трудностите в началото.
Разбира се, най-голямото предимство на алтернативните данни е честотата, с която се публикуват, и това, че са по-актуални от традиционните. Нека ви дам един пример. Данните за БВП на България през първото тримесечие ще излязат в средата на май, т.е. месец и половина след края на отчетния период, като това са експресни оценки, които подлежат на сериозни ревизии. Подобно е закъснението при повечето европейски страни, а при други, особено при развиващи се икономики, забавянето е още по-голямо.
От друга страна, алтернативните данни позволяват икономиката да се следи в реално време и така да могат да се вземат инвестиционни или бизнес решения на базата на моментната картина. Много от нашите клиенти споделят, че когато са публикувани икономическите данни от традиционните източници, за тях вече е късно и решенията им се базират по-скоро на прогнози, в които има голяма доза несигурност.
Освен актуалността друго голямо предимство на алтернативните данни, особено при развиващите се пазари, е запълване на липсата на информация от официалните източници. В големите развиващи се икономики като Индия или Китай някои макроикономически индикатори или не се публикуват поради невъзможността да се съберат данните, или данните, които се публикуват, не са достатъчно достоверни или представителни. Инвеститорите винаги са подлагали на съмнение достоверността на данните за Китай заради непрозрачността в изготвянето и публикуването им и предпочитат да използват свои алтернативни индикатори, с които да сверяват информацията от официалната статистика.
От началото на войната в Украйна руските статистически източници спряха да публикуват данни за основни икономически индикатори. Всичко това допълнително кара инвеститори и анализатори да търсят алтернативни данни, с които да следят реалната икономическа картина в тези страни.
Къде можем да намерим алтернативни данни?
В повечето случаи тези данни се предоставят от частни компании, за много от които събирането и разпространението на данни всъщност не е основната им дейност. Те по-скоро ги събират или генерират при извършване на дейността си и в един момент виждат бизнес възможност, като ги предлагат на трети страни. Компаниите за разплащания или платформите за онлайн търговия ежедневно генерират данни за милиони трансакции по целия свят. След като има интерес към такива данни, компаниите започват да ги продават, като в много от случаите дори развиват свои аналитични продукти с тях, за да увеличат добавената им стойност.
Компании, които събират данни за трафик от сателитни снимки, смарт телефони или часовници или GPS системи, са също сред популярните източници на алтернативни данни. В последните години набира скорост използването на данни за ключови думи от интернет търсачки, които инвеститорите използват за оценки на икономическите нагласи и инвестиционния климат.
Разбира се, повечето данни са трудно достъпни поради високата им цена или суровия вид, в който се предлагат, а и за потребителите е трудно да се ориентират къде да ги намерят и кои източници са достоверни. Тук идва и нашата роля като компания, която агрегира алтернативни данни, но преди да ги предоставим на клиeнтите през платформата ни, ние се уверяваме в качеството им, като даваме и насоки как могат да се използват.
Кои са основните предизвикателства, когато се работи с Alternative Data?
При традиционните данни обикновено е достатъчно просто да ги качим в платформата ни и да кажем на клиентите, че са там. След това в повечето случаи те знаят как и за какво да ги използват. При алтернативните данни ролята ни е съвсем друга, защото работата с тях е свързана с някои особености, за които клиентите ни имат нужда от съдействие. На първо място, анализатори, които имат опит предимно с традиционни данни, в много от случаите не знаят какви точно алтернативни данни биха им били полезни и къде да ги намерят.
После идва форматът на данните, тъй като, за разлика от традиционните, алтернативните данни обикновено не са структурирани. Представете си как данни от сателитни снимки трябва да се превърнат във времеви серии, което е най-често използваният формат за работа с икономически данни. Още по-често срещан проблем е, че в алтернативните данни обикновено има много повече информация, отколкото е необходима на потребителите.
Например нашите клиенти се интересуват предимно от тенденциите на макроикономическо, секторно или регионално ниво, но алтернативните данни в повечето случаи са много по-детайлни, на ниво отделен продукт, бранд, конкретна локация и т.н. В тези случаи от нас се изисква едно предварително пресяване или агрегиране на суровите данни, преди да достигнат до потребителите така, че да могат да ги интегрират директно в моделите си.
Друга особеност е тяхната волатилност във времето, както е с повечето данни с висока честота. Тук ролята ни е да помогнем на клиентите да различат сигналите, които дават за икономиката, от т. нар. шум. И не на последно място са моделите. При икономическите прогнози и анализи все още доминират традиционните иконометрични модели, разработени предимно през 80-те години, които не са създадени за работа с толкова големи масиви от данни, нито пък статистическите софтуери са пригодени за тях.
Как ISI Emerging Markets Group използва алтернативни данни?
Алтернативните данни, които предоставяме, идват от три места. Най-голямата част от тях са местни източници, които събират данни за страната или за региона, в който са базирани. Освен това през последните няколко месеца сключихме партньорства и с глобални доставчици на алтернативни данни, с което можем по-бързо и по-ефективно да увеличим географското покритие на определен тип данни, отколкото да ги събираме страна по страна.
Глобалните източници на данни осигуряват съпоставимост в методологиите, което прави данните сравними между отделните страни. Това е много важно за анализатори и инвеститори, които следят развитието на икономики или сектори за различни страни или региони.
Третият източник са нашите собствени данни, като в момента сме се фокусирали върху използването на алтернативни данни, за да дадем по-навременни оценки на основни икономически индикатори, които да се обновяват по-често, отколкото при официалните източници.
Към момента имаме модел на седмични оценки на инфлацията, базиран изцяло на алтернативни данни, който се приема много добре от клиентите ни, тъй като официалните данни за инфлацията са месечни и се публикуват с няколко седмици закъснение.
Как според Вас AI ще повлияе като цяло на бизнеса и начина, по който ще се използва информация в бъдеще?
AI вече променя не само бизнеса, но и начина, по който живеем, и това е необратим процес, който е изцяло в положителна посока. Не разбирам и не споделям негативните реакции и опасенията за работни места или професии, които повече няма да съществуват. Това ми напомня на движението на лудитите, които в началото на Индустриалната революция през 19-ти век са протестирали срещу механизацията на производството, за да не останат без работа.
AI ще позволи на бизнеса да елиминира процеси, които са излишни, за да направи останалите по-ефективни, по-бързи и по-добри, и ние трябва да се адаптираме към тази промяна. Ако се върнем на алтернативните данни, използването им в икономически и инвестиционни анализи нямаше да е възможно, ако не беше приложението на machine learning в икономическите модели, тъй като доминиращата досега иконометрия не е създадена за големи данни.
Клиентите ни се адаптират към тази промяна и до голяма степен възприемат нашата визия, че алтернативните данни са част от бъдещето на икономическите и инвестиционните анализи. Към момента клиентите ни казват, че около 80% от данните, които използват, са традиционни и около 20% са алтернативни. Сигурен съм, че тези пропорции в най-скоро време ще се изравнят и в бъдеще това разграничение между традиционни и алтернативни данни ще се размие. Ще бъдат просто данни.
Вижте профила и актуалните позиции за работа на INTERNET SECURITIES BULGARIA EOOD в JOBS.bg