Klasifikační strom

, Author

4 Klasifikační kritéria a klasifikační strom

Dva hlavní problémy při vytváření nové taxonomie jsou: klasifikační kritéria a klasifikační strom. Zde byla zvolena klasifikační kritéria, která odrážejí podstatu základního hlediska výzkumu. Klasifikační strom byl získán postupnou aplikací zvolených kritérií. Listy klasifikačního stromu jsou příklady (výzkumné snahy), které jsou stručně rozvedeny později, v části Prezentace existujících řešení tohoto článku.

V této studii jsme zahrnuli také architektury, které se nezabývají sémantikou dat, ale jejichž architektury ovlivnily výzkum určitým směrem. Kromě toho jsme ukázali, jak sémantické obohacení dat zvyšuje efektivitu použitého přístupu.

Protože úlohou integrační platformy senzorových sítí je fungovat jako rozhraní mezi senzorovými sítěmi a aplikacemi uživatelů, mohou výzkumníci řešit problém buď na úrovni senzorových sítí, tj. přístup zdola nahoru, nebo na úrovni aplikací, tj. přístup shora dolů. Proto jako hlavní kritérium klasifikace zkoumaných architektur uvádíme klasifikaci architektur podle zvoleného přístupu, která může zahrnovat: přístup orientovaný na senzorové sítě a přístup orientovaný na aplikace. V prvním přístupu se výzkumníci snaží řešit heterogenitu senzorových sítí, technické vlastnosti senzorových sítí, omezení, protokoly a produkovaná pozorování a měření tím, že navrhují optimální způsob zpracování, reprezentace, ukládání a agregace dostupných zdrojů senzorových dat pro vyšší vrstvy v systému, a tedy pro aplikace. Ve druhém přístupu mají výzkumníci tendenci umožnit co nejkonformnější rozhraní a mechanismus interakce pro uživatele a aplikace, které jim umožní získat informace, o které mají zájem, z integrovaných sítí senzorů tím, že je osvobodí od složitosti a specifik těchto sítí senzorů.

V rámci první třídy můžeme identifikovat tři podskupiny: architektury zaměřené na databáze, přístupy založené na překladu dotazů a přístupy založené na virtualizaci senzorů. Všechny tyto podskupiny lze dále rozdělit na přístupy se zaměstnáním a bez zaměstnání sémantiky dat.

Řešení zaměřená na databázi jsou charakterizována databází jako centrálním centrem všech shromážděných dat senzorů, a tudíž veškeré vyhledávání a manipulace s daty senzorů se provádí nad databází. Je výzvou namapovat heterogenní data senzorů na jedinečné databázové schéma. Je třeba zajistit další mechanismus pro podporu dat v reálném čase, protože tento typ dat lze vzhledem k jejich velkému objemu jen stěží přímo ukládat do mezipaměti. Hlavním problémem tohoto přístupu je škálovatelnost, protože databázový server by měl zvládat jak vkládání dat pocházejících ze senzorových uzlů, tak provádět dotazy aplikace. Tento přístup může těžit z možnosti umožnit podporu technik dolování dat a strojového učení nad uloženým fondem dat ze senzorů.

Přístup překladu dotazů využívá přirozenou podobu dat ze senzorů a související dotazovací jazyky za účelem transformace dotazu uživatele do cílového dotazovacího jazyka určitého zdroje. Tento přístup předpokládá potřebu udržovat informace o dostupných zdrojích dat, především o přirozeném dotazovacím jazyce určitého zdroje dat, formátu a povaze produkovaných dat, ale může zahrnovat i informace o schopnostech senzorů, topologii sítě, výkonových omezeních pro lepší optimalizaci dotazu. Výsledky nativních dotazů by měly být sestaveny do cílového formátu dat. Potenciální výkonnostní nevýhoda spočívá v tom, že za běhu musí být provedeny dvě konverze na každý uživatelský požadavek: když je dotaz přeložen na nativní dotaz a znovu, když mají být výsledky dotazu převedeny do cílového formátu.

V přístupu virtualizace senzorů jsou senzory a další zařízení reprezentovány abstraktním datovým modelem a aplikacím je poskytnuta možnost přímé interakce s touto abstrakcí pomocí rozhraní. Bez ohledu na to, zda je implementace definovaného rozhraní dosažena na komponentách senzorických uzlů sinks nebo gateways, musí vytvořené datové toky odpovídat obecně přijímanému formátu, který by měl umožnit interoperabilitu. Obecně lze pro reprezentaci dat použít jakýkoli společný datový formát, který využívá sémantický datový model, nebo dokonce může paralelně existovat více datových formátů zaměřených na různé úrovně datových abstrakcí v závislosti na potřebách uživatele. Tento přístup je slibný a nabízí dobrou škálovatelnost, vysoký výkon a efektivní fúzi dat v heterogenních senzorových sítích, stejně jako flexibilitu při agregaci datových toků atd.

Jak bylo uvedeno výše, aplikačně orientované přístupy se snaží nabídnout uživatelským aplikacím co nejefektivnější způsob, jak získat potřebné informace z integrovaných senzorových sítí. Zaměření na zajištění interakce na vysoké úrovni mezi aplikacemi a základním systémem s umožněním funkcí odvozování znalostí však někdy trpí výkonnostními aspekty, které brání širšímu přijetí těchto řešení. Identifikovali jsme čtyři podskupiny, které sdílejí stejný základní princip přístupu shora dolů: přístupy orientované na architekturu služeb, přístupy založené na skládání služeb, přístupy založené na transformaci dat podle pravidel a systémy založené na agentech.

Přístupy orientované na architekturu služeb poskytují standardní rozhraní služeb s definovanými metodami a kódováním dat pro získávání pozorování a měření z požadovaných senzorů. Dále může nabízet funkce, jako je získávání informací o vlastnostech senzorů, možnost přihlásit se k odběru hodnot dat vybraných senzorů, zadávání dotazů, případně aktualizační funkce atd. Dominantní interakcí v těchto architekturách je model požadavek-odpověď, v menší míře pak doručování dat ze senzorů na základě událostí. Nevýhodou tohoto přístupu je, že nemá možnost slučovat data senzorů založená na proudu spolu s archivovanými nebo akvizičními typy dat. Ačkoli neexistují explicitní omezení pro konkrétní implementaci, tento přístup bývá vertikálně orientovaný a pokrývá pouze jednu aplikační oblast.

Přístupy orientované na kompozici služeb umožňují uživatelům definovat libovolné služby nebo datové toky se specifickou charakteristikou zájmu. Systém se pokusí sestavit takový datový tok použitím specifického zpracování nad příslušnými zdroji dat, jehož výsledkem bude vytvoření datového toku, který odpovídá požadované specifikaci. Plné expresivity uživatelských požadavků by mohlo být dosaženo umožněním popisu požadovaných datových toků a možností zpracování na základě sémantického modelu: při hledání optimální kompozice dostupných komponent by se mohlo využít uvažování na základě sémantiky. Zdá se, že tento přístup nabízí z hlediska aplikací nejpružnější řešení, ačkoli výkonnost může být snížena v důsledku zjišťování kompozice služeb v reálném čase.

Transformace dat založená na pravidlech se jeví jako nejběžnější přístup pro využití sémantických datových modelů. Odvození nových znalostí nebo detekce událostí vysoké úrovně se dosahuje pomocí mapovacích funkcí, které se opírají o vztahy mezi pojmy zachycenými v ontologické reprezentaci doménového modelu a pozorováními a měřeními dat ze senzorů. Prostřednictvím architektury může docházet k vícenásobným transformacím podle různých vrstev informačního modelu. Data jsou transformována z formátů nižší úrovně do reprezentací založených na sémantice, které umožňují aplikaci sémantického vyhledávání a argumentačních algoritmů.

Agentové systémy se skládají z několika typů agentů. Agenti jsou softwarové komponenty schopné vykonávat specifické úkoly. Společně dosahují požadovaných funkcí. Pro vnitřní komunikaci agentů lze použít některou ze standardních agentových platforem nebo specifickou implementaci. Agenti obvykle patří do jedné z několika vrstev podle typu funkcí, za které odpovídají. Také v jedné logické vrstvě může být několik typů agentů. Agenti z vyšších vrstev využívají agenty z nižších vrstev. To, zda agenti využívají sémantiku senzorových dat, nebo zda se pro popis schopností zpracování agentů používají sémantické modely, závisí na konkrétní implementaci.

Klasifikační strom, odvozený z výše uvedených klasifikačních kritérií, je uveden na obr. 1 a skládá se ze sedmi listů. Každému listu klasifikačního stromu je přiřazeno jméno, jak je popsáno výše. U každého listu (třídy) je uveden seznam existujících řešení (příkladů) podle použité klasifikace. V samostatném odstavci jsme uvedli pouze názvy přístupů a hlavní odkazy, abychom zájemcům umožnili prostudovat další podrobnosti. Pro zjednodušení uvádíme libovolný název řešení, které nemá explicitní název uvedený autory. Používáme buď název instituce, z níž autoři pocházejí, nebo název hlavního strategického problému charakteristického pro dané řešení.

Obr. 1. Klasifikační strom architektur senzorického webu.

Řešení zaměřená na databáze zahrnují nesémantické přístupy, jako je databázový systém Cougar , jedna z prvních výzkumných prací směřujících k integraci senzorických sítí, a SenseWeb , který je příkladem maximálního využití popsaného přístupu. ES3N je příkladem sémanticky zaměřeného databázového přístupu.

Všechna řešení týkající se přístupů k překladu dotazů využívají sémantické technologie a zahrnují: sémantickou senzorovou síť CSIRO , přístup založený na SPARQLSTREAM a SemSorGrid4Env , což je nejkomplexnější řešení v této skupině.

Nejnovější výzkumné snahy v této oblasti patří k přístupům virtualizace senzorů. Nesémantický přístup se používá v GSN , zatímco řešení navržená v rozsáhlých projektech financovaných EU, jako je SENSEI a internet věcí (IoT), využívají sémantiku dat.

Mezi architektury orientované na služby patří jednoduchá a přitom účinná nesémantická řešení, jako je TinyREST a specifikace referenční architektury OGC SWE implementované různými stranami . Přístup založený na sémantice se používá v SemSOS .

Přístupy založené na službách obvykle nabízejí uživatelům nejpružnější interakci a Hourglass jsou příkladem nesémantického řešení. Výkonnější řešení využívají sémantické přístupy a patří k nim SONGS a architektura vyvinutá v IBM .

Nejběžnější architektury, které využívají sémantické technologie, patří k přístupům založeným na transformaci dat na základě pravidel a patří k nim: systém fúze senzorových dat založený na sémantice vyvinutý na Torontské univerzitě , zásuvná architektura navržená na Národní technické univerzitě v Aténách a SWASN , součást vize CommonSense společnosti Ericsson .

Nakonec přístupy založené na agentech mají jak nesémantické, tak sémantické zástupce: prvním z nich je infrastruktura senzorů v internetovém měřítku nazvaná IrisNet , zatímco druhým je SWAP , multiagentní systém pro architektury senzorického webu.

.

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna.