Power BI и DirectQuery на Microsoft: Улесняване на анализа и визуализацията на данните

Инструментът за анализ на Power BI на Microsoft може да не получи публичността на останалата част от платформата Power, но тъй като компанията продължава да инвестира в своите бизнес приложения и платформа за автоматизация, тя продължава да получава редовни актуализации с нови функции. Най-новата партида улеснява много персонализирането на модели и работата с повече източници на данни и дори използването на Power BI анализи в инструменти за анализ и визуализация на трети страни.

Една от най-важните функции в Power BI е DirectQuery, която осигурява механизъм за свързване към външни източници на данни, без да импортирате данните в собственото си локално хранилище за анализ. Въпреки че импортирането на данни винаги ще бъде по-ефективно от работата с отдалечени източници на данни, може да сте в позиция, при която не можете да въведете данни във вашия екземпляр на Power BI. Това може да е поради регулаторни причини или причини за собственост на данни, или когато данните се променят бързо и няма обхват за импортиране, или ако просто нямате капацитет за съхранение, за да репликирате данни.

Използване на DirectQuery

DirectQuery връзките се държат по различен начин от стандартния импорт. Изграждате заявки по същия начин, както бихте направили за всяка друга връзка, като избирате източници и таблици. Там, където нещата се различават, е, че не се импортират данни и когато създавате или актуализирате визуализация, Power BI отправя запитване към отдалечения източник на данни като част от процеса на изграждане на отчети. Това може да отнеме известно време, особено ако работите с много големи набори от данни, които може да не поддържат заявки в паметта или други оптимизации на Power BI.

Не всеки поддържан конектор предлага DirectQuery, въпреки че ще откриете, че повечето от тях са други инструменти за бизнес анализ или са мащабни складове. Това има смисъл: не искате да сте прекарали цялото това време в изграждането на масивен склад на Teradata или настройването на SQL Server Analysis Services, за да репликирате всичко, което работи в Power BI. Изграждайки вашите модели с помощта на познати инструменти и след това използвайки Power BI като слой за визуализация и отчитане, вие най-добре използвате наличните ресурси и набори от умения, като анализът се извършва в мащаб на сървърите и визуализацията и изследването на компютрите.

Използвайки DirectQuery, можете да започнете да изграждате около съществуващите модели, като ги комбинирате с допълнителни данни, за да изградите бързо персонализиран анализ. Може би имате склад за данни за продажби за голям магазин и искате да го обвържете с данни от вашата ERP система, без да претоварвате нито една система със сложни заявки, нито да пълните сървърите за отчитане с терабайти скъпи данни. Microsoft обещава още DirectQuery конектори в бъдещи версии, фокусирайки се върху системи като тези, които са проектирани да работят интерактивно.

Изграждане на отчети от данни на живо с DirectQuery

Тъй като моделите от съществуващите аналитични услуги често се изграждат по собствени мерки, те вече използват обобщени данни. DirectQuery може да работи с тези мерки, а не с основните данни, така че не дублирате усилията, добавяйки ненужна сложност към вашите заявки. Вече можете да работите с инструменти за анализ на големи данни, като Apache Spark, позволявайки на специализирани инструменти да управляват неструктурирани данни и да се възползват от техните специализирани функции от Power BI, без да се налага да проектирате свои собствени сложни заявки.

След като изградите визуализация или отчет, който се основава на DirectQuery връзка, визуализацията първоначално ще бъде статична, въз основа на последната заявка, направена спрямо източника. Ако опресните изгледа, той ще се презареди. Ако ги използвате като плочки в таблото, ще трябва да настроите график за опресняване – обикновено на час. Когато отворите отчет, ще видите последното състояние на опресняване и ако искате актуални данни извън графика за актуализиране на отчета, ще трябва да опресните данните ръчно.

Има още една добра причина за използване на DirectQuery: ако вашите данни трябва да бъдат защитени, тогава прилагането на слой за управление на правата за достъп към изходните данни означава, че в Power BI се доставят само одобрени данни. Връзката DirectQuery предава идентификационни данни от Power BI към източника, което позволява защитените данни да бъдат освободени до оторизирани потребители. Заявките за разделяне по този начин гарантират, че таблата за изпълнителни директори и финансови директори могат да бъдат тествани от екипите за разработка, без да се компрометират чувствителни данни.

Важно е да се отбележи, че DirectQuery ограничава някои функции на Power BI, както при изграждане на модели, така и при изпълнение на отчети. Те не са съществени проблеми, но ако разчитате например на изчислени таблици, тогава може да предпочетете да използвате традиционна връзка. Не можете да използвате някои от функциите, базирани на машинно обучение, на Power BI, като Quick Insights и Q&A, тъй като те разчитат на наличието на локални набори от данни за скорост или за изграждане на ML модели.

Изграждане на верижен анализ с DirectQuery и Power BI

Там, където нещата стават интересни, е използването на DirectQuery с набори от данни на Power BI и Azure Analysis Services. Наскоро пуснат за предварителен преглед, това ви позволява да комбинирате данни от вашите собствени модели с други данни, от съществуващи връзки DirectQuery или от други източници на данни. Може би имате груб набор от данни в Excel и искате да видите как влияе на прогнозите или други анализи. Можете бързо да настроите връзка на живо със съществуващите си модели на Power BI и да започнете да правите промени.

Този подход ви дава възможност за свързване на модели и набори от данни, като започнете, да речем, модел на Azure Analysis Services, който включва множество източници в Azure Data Lake. С DirectQuery връзка в Power BI можете да комбинирате това с други източници, за да създадете нов модел. Може би използвате данни от IoT от вятърна ферма, за да покажете изходната мощност при различни скорости на вятъра и смесвайки това с прогнозите за времето, за да създадете модел Power BI, който предсказва работата на вятърната ферма. Превързването на този модел в друг, който предсказва ценообразуване, ви позволява да изградите система, която предполага времето и количеството продукция, необходими за получаване на най-добрата цена.

Понастоящем можете да свържете до три модела – всеки повече ще ви даде грешка. Също така трябва да знаете, че данните от един модел могат да се влеят в друг, евентуално позволявайки неволно изтичане на информация – особено ако един от междинните набори от данни е стандартна заявка.

Не е трудно да се разбере колко важни са тези нови функции. Microsoft въвежда функции за анализ, които преди изискват значителни обеми на разработка, в инструментите си за настолно бизнес разузнаване. Смесването на набори от данни за генериране на сложни прозрения може да помогне дори на най-малката организация да извлече най-голяма бизнес стойност от своите данни, преминавайки от големи данни в Azure до целеви табла за управление на работните плотове в няколко запитвания. Получената информация ще помогне на тези ръководители да вземат по-добри решения по много по-навременен начин. В един несигурен свят това е нещо, което си струва да се изгради.

Leave a Reply

Your email address will not be published. Required fields are marked *