6 модерни тенденции в стека на данни, които да търсите през 2021 година

Данните се превърнаха в името на играта за почти всяко предприятие, тъй като компаниите и организациите търсят повече начини да изпреварят кривата и да идентифицират минали грешки.

TechRepublic разговаря с лидери в индустрията и експерти, които обсъдиха шест теми и идеи, които ще се появят през 2021 г., свързани със съвременния набор от данни.

Дебанджан Саха, вицепрезидент по анализ на данни в Google Cloud, припомни: “Бях мрежов инженер, когато се случи голямата интернет революция и се чувствам истински късметлия да бъда в средата на тази революция в облака и данните.”

Саха добави: “Мисля, че през следващата година и следващите пет години ще настъпи цифрова трансформация, задвижвана от революцията на данните.” Той предположи, че средният живот на компания от Fortune 500 или S&P 500 става по-кратък, тъй като бизнесът се развива и актуализира по-бързо от всякога. “Единственият начин да се адаптираме и променим е да използваме данни и да гледаме зад ъгъла, използвайки прогнозни модели и AI / ML. Тези фактори разграничават печелившите и губещите в новата цифрова икономика.”

Вицепрезидентът и главен анализатор на Forrester Микеле Гьоц заяви, че управлението на данните се превръща от първата стратегия за анализ в стратегия, базирана на резултати, което означава, че данните вече са динамични, ориентирани към потока и оркестрират чрез процеси и модели на машинно обучение.

“Forrester вижда, че стекът данни се простира отвъд структурата на данните в мрежи за данни. Управлението на данните ще бъде централизирано и хиперлокално, за да се създаде интелигентност и опит в момента”, каза Гьоц. “Архитектурите на решения все повече разчитат на съобщения, шлюзове, API и микроуслуги в една екосистема и колекции от възможности. Интелигентността на рояците и случаите на използване на интелигентен град са примери за това. Мрежовите архитектури стават утрешната архитектура на данните.”

Демократизация на стека от данни

Джордж Фрейзър, главен изпълнителен директор на компанията за интеграция на данни Fivetran, заяви, че скорошната вълна от опростяване на управлението на данни е много важна тенденция, която ще продължи и през 2021 година.

Той обясни, че само преди пет години компании, които се интересуват от по-добро управление на големи количества данни като Netflix, са трябвали да извършат много тежки тежести, наемайки легиони инженери по данни и инвестирайки милиони във впечатляващи технологии с отворен код.

В наши дни голяма част от това може да бъде постигнато чрез абонаменти за един от висококачествените хранилища за данни.

“Управлението на данните става все по-лесно. Технологиите често вървят в друга посока, стават по-сложни. Но ние наблюдаваме обезсмисляне и мисля, че това е значително и хубаво нещо. Цената на основните компоненти спадна, но също така е вярно че хората правят повече с данни “, каза той.

“Няколко анализатори могат да постигнат това, което преди пет години Netflix би трябвало да инвестира 10 милиона долара, което е страхотно. Това го прави достъпен за компании с по-малко изтънченост и компании, които не са на брега или наемат най-фантастичните екипи с най-добрите Профили в LinkedIn. По-скоро обикновените смъртни могат да правят тези неща, което е добре. ”

Компаниите преминават към облака и прегръщат мултиклауд

Донал Тобин, главен изпълнителен директор на компанията за интеграция на данни Xplenty, заяви, че все повече и повече големи компании проявяват интерес към облака, особено за неща като анализи.

“Това, което виждаме, е мултиклауд, определено също представлява интерес. Наличието на способността да завъртите платформата си в някой от големите играчи в облака става все по-голямо изискване”, каза Тобин. „Клиентите искат това и не им харесва идеята да бъдат обвързани с някакво решение с тази или с една платформа.“

Направено е преминаване към облак към индустрията, обясни техническият директор на EnterpriseDB Марк Линстър, тъй като облакът позволява бързо огъване на капацитета и намалява продължителните цикли на осигуряване, както и предварителните инвестиции в лицензи. Способността да се приспособи капацитетът за привеждане в съответствие с нуждите е от ключово значение за бързата реакция като част от стратегията за цифрова трансформация.

Саха от Google Cloud каза, че стартиращи компании и дигитални родни компании са първите, които са приели Cloud, но с преминаването към 2021 г. все повече традиционни предприятия приемат облачни платформи.

„Хората мразят да управляват своите центрове за данни, защото са скъпи“, каза той. „Те всъщност се чувстват по-сигурни, че облаците имат много повече инвестиции в сигурността, поверителността и управлението на данни.

За съжаление пандемията на коронавируса не дава на предприятията от всяка индустрия друг избор, освен да възприемат цифровите системи и облачните платформи, за да отговорят на търсенето.

„По същество ускори това предизвикателство за дигитална трансформация и мисля, че занапред, каквото и колебание имаха хората, в този момент сме доста минали“, каза Саха.

Колин Зима, главен аналитик в подкрепената от Google компания за анализ на данни Looker, каза, че много клиенти искат компаниите да могат да работят с много различни видове набори от данни и доставчици в облак.

Но освен регионалните разпоредби, повечето компании просто се интересуваха да съхраняват данните си на няколко места.

“Не можете просто да поставите всичко на едно място, защото имате нужда от резервни копия и имате нужда от излишък. Така че дори в Looker, преди да бъдем придобити от Google, имахме резервни копия в Amazon. Имаме резервни копия в Google, други резервни копия в Microsoft и това вид взаимосвързаност става нормална “, каза Зима.

Анди Магуайър, старши инженер за машинно обучение в Netdata, каза, че това, което наистина е било необходимо, е обединено езеро за данни, което може да обхваща множество облаци.

„Например, ако сте разполагали с данните си за клик в нещо като Google BigQuery и основните си производствени приложения и регистрационни файлове в Amazon Web Services (AWS), тогава може да е твърде скъпо от гледна точка на навлизане и излизане от мрежата за централизиране на всички данни в или Google Cloud Platform (GCP), или AWS, или на платформата на някой доставчик. Вместо това трябва да се научим да живеем със сложността на мултиклауд и как най-добре да навигираме в него “, каза той.

Проучване на предсказуемата стойност на данните

Предприятията без опит в данните все повече осъзнават колко полезни могат да бъдат за прогнозни действия. Джо Магуайър, старши изследователски директор в Gartner, каза, че все повече през 2020 г. и със сигурност през 2021 г. предприятията без вътрешни набори от умения за AI / ML ще се възползват от функциите на AI / ML, вградени в продуктите на доставчиците.

„Подравняването на данните, науката за данни и ML конвейрите заедно с процеса на внедряване на приложението е от основно значение за непрекъснатата доставка и непрекъснатата интеграция на периодично подобрени модели на ML в решения, базирани на AI. Това изисква използване на DataOps, MLOps и Platform Ops за AI за мащабиране на Архитектура на ИИ. Следователно се появяват платформи за оркестрация на ИИ за оперативно използване на ИИ “, каза той.

Саха на Google Cloud каза, че не става въпрос само за преглед на вашите данни за последното тримесечие или миналата седмица и за опит да разбере какво се е случило в миналото.

“Става въпрос за разглеждане на потока от събития, който идва и за действие в реално време”, каза той. “Наличието на анализи в реално време ще бъде наистина важно. Хората са много заинтересовани да се огледат зад ъгъла и да предскажат какво ще се случи. Ако можете да получите стойност от данните по-бързо от други и създадете реална диференцираща стойност. Ето защо хората толкова се интересуват от прогнозна аналитика и прогнозни модели. ”

Повишено използване на изкуствен интелект и машинно обучение

Али Сидики, главен продуктов директор в BMC Software, отбеляза, че ключов елемент от бъдещето на съвременния стек от данни ще бъде включването на управлявани от AI / ML интелигентни и предсказуеми аналитични възможности, използващи широк спектър от данни както в исторически, така и в реално време .

В пространството за управление на ИТ операции това включва анализ на данни, включително метрики, събития, регистрационни файлове, топология, инциденти и промени и изисква платформи, които са отворени и могат да интегрират данни от безброй инструменти и технологии, каза той и добави, че стекът ще също така трябва да подкрепя хибридни клиенти с данни от локалната инфраструктура и приложения за центрове за данни, както и множество облачни активи.

„Тъй като бизнесът се развива в автономни цифрови предприятия, става въпрос за нещо повече от просто допълнителна представа от анализа на данните, но все повече за дейността – и възможността да се предприемат автоматизирани действия, когато е възможно“, каза Сидики.

“С една година на непредсказуемост зад гърба си, предприятията ще трябва да очакват неочакваното, когато става въпрос за превръщането на технологичните стекове в безпогрешни и активни. Ще видим, че търсенето на AIOps продължава да расте, тъй като може да се справи и да предвиди тези неочаквани сценарии с помощта на AI, ML и прогнозна аналитика. ”

Вливането на изкуствен интелект и машинно обучение стана част от всичко, каза Саха за Google Cloud. Инструментите се използват широко за управление на инфраструктура чрез извършване на автоматично мащабиране, автоматично излекуване, автоматична оптимизация и др.

„Начинът, по който хората, обикновените бизнес потребители, използват AI / ML, за да правят необикновени неща, ще промени начина, по който бизнесът работи в бъдеще“, каза той и добави, че Google търси начини за по-нататъшна демократизация на AI и машинното обучение, така че тези без фон на данни могат да имат достъп до него чрез прости електронни таблици.

“Следващата година ще има още разширени анализи, където ще видите все повече и повече AI и машинно обучение да бъдат интегрирани в естествените бизнес процеси на хората. Съвременната BI е свързана със създаването на API за данни върху вашите активи за данни и след това с интегриране таблото ви за управление и работата ви се влива във вашите бизнес приложения. ”

Зима заяви, че интересът към изкуствения интелект и машинното обучение вече е обещаващ и ще бъде още по-широко разпространен през 2021 година.

„Започваме да виждаме как хората всъщност изграждат тези продукти за данни за вътрешна употреба. Работим с няколко стрийминг услуги и един от тях е изградил продукт за данни и аз го използвам като цяло, тъй като това е ефективно табло под листите, но вие всъщност преглеждайте заглавията, както бихте направили в услуга за стрийминг. Така че има икони на всички лога на продуктите и е активирано с докосване, но кликнете върху него и пробивате, за да получите показатели за това “, каза Зима

“Те предоставят подобно на продукта изживяване и виждам, че това се случва все повече и повече. Изграждането на такива неща е по-скъпо. Но мисля, че все повече ще виждате продукти с данни, които са създадени за вътрешна употреба.”

Загриженост относно заключените данни

Някои експерти изразиха опасения, че през 2021 г. някои от най-големите имена в данните ще започнат да блокират данните си от конкурентни платформи.

“Големият страх, който винаги имам, е, че хората използват все повече и повече от тези SaaS инструменти. Средната компания разполага с тон SaaS инструменти и всички те имат заключени данни. Така че Salesforce има някои от вашите данни за продажби, но Slack има данни в чата и имате всички тези системи, които държат набори от данни “, каза Зима.

“Най-големият ми страх е, че тези услуги ще започнат да се опитват да заключат повече данните си. Salesforce току-що купи Slack и има Tableau. И винаги се страхувам, че тези данни няма да бъдат достъпни за други продукти или услуги. ”

Робсън Грийв, главен изпълнителен директор в OutSystems, повтори тези опасения и каза, че тъй като приложенията на SaaS са универсални за всички и не позволяват никакъв вид диференциация или персонализация, може да видим вълна от бъдещи компании – такива, които по-модерни подходи на платформата за приложения – оставете този остарял модел да създава свои собствени приложения, за да станат наистина диференцирани и да спестят много пари в процеса.

Но макар страхът да е реален, други експерти заявиха, че притесненията на клиентите, че ще бъдат затворени при определени доставчици, ще ги принудят да пазят до известна степен своите данни.

„Инструментите за анализ, които се опитват да се превърнат на едно гише за всички основни нужди от съхранение на данни и облачни данни, също ще отговорят на предизвикателствата, тъй като клиентите ще бъдат предпазливи при блокирането на доставчици“, каза Луис Кар, старши директор на продуктовия маркетинг в Actian. „За да работи съвременният стек от данни, той трябва да е отворен за всички източници на произход, дестинации за анализ и визуализация.“

Нужди от сигурност на стека от данни

Почти всяка индустрия разполага с изчисления за киберсигурност и управлението на данни не е по-различно. Саха от Google Cloud каза, че все повече и повече клиенти искат унифицирана цялостна структура за управление на данни в различни части на данните със закъснение.

Донал Тобин, главен изпълнителен директор на компанията за интеграция на данни Xplenty, каза, че компаниите “по същество създават тиктакаща бомба във вашия склад за данни”. Той каза, че клиентите търсят повече информация за сигурността на данните, така че компании като Xplenty сега подчертават своите възможности за криптиране като начин да гарантират на клиентите, че техните данни ще бъдат в безопасност.

„Мисля, че това е една от най-големите промени, които очаквате, е, че хората точно сега, както през последните три три до шест месеца, започват да осъзнават това и да го приемат сериозно“, каза той.

Leave a Reply

Your email address will not be published. Required fields are marked *