Klassificeringsträd

, Author

4 Klassificeringskriterier och klassificeringsträd

De två största problemen vid skapandet av en ny taxonomi är: klassificeringskriterierna och klassificeringsträdet. Här har klassificeringskriterierna valts för att återspegla kärnan i forskningens grundläggande synvinkel. Klassificeringsträdet har erhållits genom successiv tillämpning av de valda kriterierna. Bladen i klassificeringsträdet är de exempel (forskningsinsatser) som beskrivs kortfattat senare i avsnittet Presentation av befintliga lösningar i detta dokument.

I denna studie har vi också inkluderat arkitekturer som inte handlar om datasemantik, men vars arkitekturer har påverkat forskningen i en viss riktning. Dessutom har vi visat hur berikning av semantiska data förbättrar effektiviteten i det använda tillvägagångssättet.

Då integrations plattformen för sensornätverk har till uppgift att fungera som ett gränssnitt mellan sensornätverken och användarnas tillämpningar kan forskarna angripa problemet antingen på sensornätverksnivå, dvs. nedifrån och upp, eller på tillämpningsnivå, dvs. uppifrån och ned. Som huvudklassificeringskriterium för de undersökta arkitekturerna klassificerar vi därför arkitekturerna enligt det valda tillvägagångssättet, vilket kan inkludera: sensornätverksorienterat tillvägagångssätt och tillämpningsorienterat tillvägagångssätt. I det första tillvägagångssättet försöker forskarna lösa problemet med sensornätverkens heterogenitet, sensornätverkens tekniska egenskaper, begränsningar, protokoll och producerade observationer och mätningar genom att föreslå ett optimalt sätt att hantera, representera, lagra och aggregera de tillgängliga sensordatakällorna till de övre lagren i systemet, och därmed till tillämpningarna. I det andra tillvägagångssättet tenderar forskarna att möjliggöra ett gränssnitt och en interaktionsmekanism för användare och tillämpningar som gör det möjligt för dem att få den information de är intresserade av från de integrerade sensornätverken, genom att befria dem från dessa sensornätverks komplexitet och särdrag.

Inom den första klassen kan vi identifiera tre undergrupper: databaserade arkitekturer, tillvägagångssätt som bygger på översättning av förfrågningar och metoder baserade på sensordelar som virtualiseras av sensorer. Alla dessa undergrupper kan ytterligare delas in i metoder med och utan datasemantikanställning.

De databascentrerade lösningarna kännetecknas av en databas som ett centralt nav för alla insamlade sensordata, och följaktligen utförs all sökning och hantering av sensordata över databasen. Det är en utmaning att mappa heterogena sensordata till ett unikt databasschema. En ytterligare mekanism bör tillhandahållas för stöd för realtidsdata, eftersom denna typ av data knappast kan lagras direkt i cacheminnet på grund av sin stora volym. Det största problemet med detta tillvägagångssätt är skalbarheten, eftersom databasservern bör hantera både insättningar av data som kommer från sensornoderna och att utföra sökningar i programmet. Detta tillvägagångssätt kan dra nytta av möjligheten att möjliggöra stöd för datautvinning och maskininlärningstekniker över den lagrade poolen av sensordata.

Frågeöversättningsmetoden utnyttjar sensordatans naturliga form och de tillhörande frågespråken för att omvandla användarnas frågor till målspråket för en viss källa. Detta tillvägagångssätt innebär ett behov av att upprätthålla informationen om tillgängliga datakällor, främst det naturliga frågespråket för en viss datakälla, formatet och arten av producerade data, men det kan också inkludera information om sensorers kapacitet, nätverkstopologi, effektbegränsningar för bättre optimering av frågor. Resultaten av de inhemska sökningarna bör sammanställas till måldataformatet. En potentiell prestandaförlust ligger i det faktum att två konverteringar per användarförfrågan måste göras i körtiden: när en fråga översätts till en inhemsk fråga och återigen när frågeresultaten ska konverteras till målformatet.

I sensorvirtualiseringsmetoden representeras sensorer och andra anordningar med en abstrakt datamodell, och tillämpningar ges möjlighet att direkt interagera med en sådan abstraktion med hjälp av ett gränssnitt. Oavsett om genomförandet av det definierade gränssnittet uppnås på sensornodernas sänkor eller gatewaykomponenter måste de producerade dataströmmarna överensstämma med det allmänt accepterade formatet som bör möjliggöra driftskompatibilitet. I allmänhet kan alla gemensamma dataformat som utnyttjar den semantiska datamodellen användas för att representera datarepresentation, eller till och med flera dataformat som är inriktade på olika nivåer av dataabstraktioner kan samexistera parallellt beroende på användarens behov. Detta tillvägagångssätt är lovande och erbjuder god skalbarhet, hög prestanda och effektiv datafusion över heterogena sensornätverk samt flexibilitet när det gäller aggregering av dataströmmar etc.

Som anges ovan försöker tillämpningsorienterade tillvägagångssätt erbjuda det effektivaste sättet för användarapplikationer att få den information som behövs från de integrerade sensornäten. Men genom att fokusera på att tillhandahålla interaktion på hög nivå mellan tillämpningar och underliggande system, med möjliggörande funktioner för kunskapsinhämtning, lider man ibland av prestandaspekter, vilket förhindrar att dessa lösningar accepteras i större utsträckning. Vi har identifierat fyra undergrupper som delar samma grundprincip för top-down-strategin: tjänsteorienterad arkitektur, tjänstekomposition, regelbaserad datatransformation och agentbaserade system.

Den tjänsteorienterade arkitekturen tillhandahåller ett standardiserat tjänstegränssnitt med definierade metoder och datakodningar för att erhålla observationer och mätningar från önskade sensorer. Dessutom kan det erbjuda funktioner som att få information om sensorernas egenskaper, möjlighet att prenumerera på utvalda sensorers datavärden, skicka in förfrågningar, eventuellt aktiveringsfunktioner osv. Den dominerande interaktionen i dessa arkitekturer är modellen för begäran och svar, och i mindre utsträckning den händelsebaserade leveransen av sensordata. En nackdel med detta tillvägagångssätt är att det inte har möjlighet att kombinera strömbaserade sensordata med arkiverade eller förvärvade datatyper. Även om det inte finns några uttryckliga begränsningar för det konkreta genomförandet tenderar detta tillvägagångssätt att vara vertikalt orienterat och täcker endast ett tillämpningsområde.

De tjänstekompositionsorienterade tillvägagångssätten ger användarna möjlighet att definiera godtyckliga tjänster eller dataströmmar med specifika egenskaper av intresse. Systemet kommer att försöka komponera ett sådant dataflöde genom att tillämpa specifik behandling av lämpliga datakällor, vilket kommer att resultera i ett dataflöde som överensstämmer med den begärda specifikationen. Fullständig uttrycklighet för användarens begäran skulle kunna uppnås genom att möjliggöra en semantisk modellbaserad beskrivning av önskade dataströmmar och bearbetningsmöjligheter: semantikbaserade resonemang skulle kunna användas när man letar efter en optimal sammansättning av tillgängliga komponenter. Detta tillvägagångssätt verkar erbjuda de mest flexibla lösningarna ur ett tillämpningsperspektiv, även om prestandan kan försämras på grund av att tjänstesammansättningen upptäcks i realtid.

Den regelbaserade datatransformationen verkar vara det vanligaste tillvägagångssättet för att utnyttja semantiska datamodeller. Att få fram ny kunskap eller upptäcka händelser på hög nivå uppnås med hjälp av mappningsfunktioner som bygger på relationerna mellan de begrepp som fångas upp i den ontologiska representationen av domänmodellen och observationer och mätningar av sensordata. Det kan finnas flera omvandlingar genom arkitekturen i enlighet med de olika lagren i informationsmodellen. Data omvandlas från format på lägre nivå till semantiskt baserade representationer som möjliggör semantisk sökning och tillämpning av algoritmer för resonemang.

De agentbaserade systemen består av flera typer av agenter. Agenter är programvarukomponenter som kan utföra specifika uppgifter. De uppnår i samarbete önskade funktioner. För den interna agentkommunikationen kan några av standardplattformarna för agenter eller en specifik implementering användas. Typiskt sett tillhör agenterna ett av flera lager beroende på vilken typ av funktionalitet de ansvarar för. Det kan också finnas flera typer av agenter i ett och samma logiska lager. Agenter från högre skikt använder agenter från lägre skikt. Huruvida agenterna använder sensordatasemantik eller om semantiska modeller används för beskrivningen av agentens bearbetningskapacitet beror på det konkreta genomförandet.

Klassificeringsträdet, som härleds från de ovan nämnda klassificeringskriterierna, presenteras i fig. 1 och består av sju blad. Varje blad i klassificeringsträdet tilldelas ett namn, enligt beskrivningen ovan. Förteckningen över befintliga lösningar (exempel) ges i enlighet med den tillämpade klassificeringen för varje blad (klass). Vi har endast angivit namnen på tillvägagångssätten och de viktigaste referenserna i ett separat stycke för att ge intresserade läsare möjlighet att studera ytterligare detaljer. För enkelhetens skull ger vi ett godtyckligt namn till en lösning som inte har ett uttryckligt namn från författarna. Vi använder antingen namnet på den institution som författarna kom från eller namnet på den viktigaste strategiska frågan som är karakteristisk för den lösningen.

Figur 1. Klassificeringsträdet för arkitekturer för sensornätverk.

De databascentrerade lösningarna omfattar icke-semantiska tillvägagångssätt som Cougar-databassystemet , ett av de första forskningsarbetena för integrering av sensornätverk, och SenseWeb , som är ett exempel på maximalt utnyttjande av det beskrivna tillvägagångssättet. ES3N är ett exempel på en semantikbaserad databascentrerad metod.

Alla lösningar som avser metoder för översättning av frågor använder sig av semantisk teknik och omfattar: CSIRO:s semantiska sensornätverk , den SPARQLSTREAM-baserade metoden och SemSorGrid4Env , som är den mest heltäckande lösningen i den här gruppen.

De senaste forskningsinsatserna på det här området tillhör metoderna för virtualisering av sensorer. Det icke-semantiska tillvägagångssättet används i GSN , medan de lösningar som föreslås i storskaliga EU-finansierade projekt som SENSEI och sakernas internet (IoT) använder semantik för data.

De tjänsteorienterade arkitekturerna omfattar enkla och ändå effektiva icke-semantiska lösningar som TinyREST och OGC SWE-specifikationerna för referensarkitekturen som genomförs av olika parter . Ett semantikbaserat tillvägagångssätt används i SemSOS.

Tjänstekompositionsmetoderna tenderar att erbjuda den mest flexibla interaktionen för användarna och Hourglass är ett exempel på en icke-semantikbaserad lösning. Mer kraftfulla lösningar utnyttjar semantiska metoder och inkluderar SONGS och en arkitektur som utvecklats vid IBM .

De vanligaste arkitekturerna som använder semantisk teknik tillhör regelbaserade metoder för datatransformation och inkluderar: ett semantikbaserat system för sammanslagning av sensordata som utvecklats vid University of Toronto , en pluggable arkitektur som utformats vid National Technical University of Athens och SWASN , en del av Ericssons CommonSense-vision .

För det sista har de agentbaserade tillvägagångssätten både icke-semantiska och semantiska representanter: den första är en sensorinfrastruktur i Internetskala som kallas IrisNet , medan den andra är SWAP , ett multiagentsystem för Sensor Web-arkitekturer.

Lämna ett svar

Din e-postadress kommer inte publiceras.