Klassifikationstræ

, Author

4 Klassifikationskriterier og klassifikationstræet

De to største problemer ved oprettelse af en ny taksonomi er: klassifikationskriterierne og klassifikationstræet. Her er klassifikationskriterierne blevet valgt for at afspejle essensen af forskningens grundlæggende synspunkt. Klassifikationstræet er blevet fremstillet ved successiv anvendelse af de valgte kriterier. Bladene i klassifikationstræet er de eksempler (forskningsindsatser), som uddybes kort senere i afsnittet “Præsentation af eksisterende løsninger” i dette dokument.

I denne undersøgelse har vi også medtaget arkitekturer, som ikke beskæftiger sig med datasemantikken, men hvis arkitekturer har påvirket forskningen i en bestemt retning. Desuden har vi vist, hvordan semantisk databerigelse forbedrer effektiviteten af den anvendte tilgang.

Da sensornetværkets integrationsplatforms rolle er at fungere som grænseflade mellem sensornetværk og brugernes applikation, kan forskerne løse problemet enten på sensornetværksniveau, dvs. bottom-up, eller på applikationsniveau, dvs. top-down-tilgang. Som hovedklassificeringskriterium for de undersøgte arkitekturer klassificerer vi derfor arkitekturer i henhold til den valgte tilgang, som kan omfatte: en sensornetværksorienteret tilgang og en anvendelsesorienteret tilgang. I den første tilgang forsøger forskerne at løse problemet med sensornettenes heterogenitet, sensornettenes tekniske karakteristika, begrænsninger, protokoller og producerede observationer og målinger ved at foreslå en optimal måde at håndtere, repræsentere, lagre og aggregere de tilgængelige sensordatakilder på til de øverste lag i systemet og dermed til applikationer. I den anden tilgang har forskerne en tendens til at muliggøre en grænseflade og en interaktionsmekanisme for brugere og applikationer, som gør det muligt for dem at få de oplysninger, de er interesserede i, fra de integrerede sensornetværk, ved at frigøre dem fra disse sensornetværks kompleksitet og særlige karakteristika.

I den første klasse kan vi identificere tre undergrupper: databasebaserede arkitekturer, tilgange baseret på forespørgselsoversættelse og sensorvirtualiseringsbaserede tilgange. Alle disse undergrupper kan yderligere opdeles i tilgange med og uden ansættelse af datasemantik.

De databasecentrerede løsninger er kendetegnet ved en database som et centralt omdrejningspunkt for alle de indsamlede sensordata, og følgelig udføres al søgning og manipulation af sensordata over databasen. Det er en udfordring at kortlægge heterogene sensordata til en unik databaseordning. Der bør indføres en yderligere mekanisme til understøttelse af realtidsdata, da denne type data næppe kan lagres direkte i en cache på grund af deres store volumen. Det største problem i forbindelse med denne fremgangsmåde er skalerbarheden, da databaseserveren både skal håndtere indsættelse af data fra sensorknudepunkterne og udføre forespørgsler fra applikationen. Denne fremgangsmåde kan drage fordel af muligheden for at muliggøre støtte til datamining og maskinlæringsteknikker over den lagrede pulje af sensordata.

Søgningsoversættelsesmetoden udnytter sensordatas naturlige form og de tilknyttede forespørgselssprog for at omdanne brugernes forespørgsel til målsproget for en bestemt kilde. Denne fremgangsmåde indebærer et behov for at vedligeholde oplysningerne om de tilgængelige datakilder, primært det oprindelige forespørgselssprog for en bestemt datakilde, formatet og arten af de producerede data, men den kan også omfatte oplysninger om sensorers kapacitet, netværkstopologi og strømbegrænsninger med henblik på bedre optimering af forespørgsler. Resultaterne af de oprindelige forespørgsler bør samles i måldataformat. Potentielt ligger en ydelsesmæssig ulempe i det faktum, at der skal foretages to konverteringer pr. brugerforespørgsel i runtime: når en forespørgsel oversættes til en indfødt forespørgsel, og igen når forespørgselsresultaterne skal konverteres til målformatet.

I sensorvirtualiseringstilgangen repræsenteres sensorer og andre enheder med en abstrakt datamodel, og applikationer får mulighed for at interagere direkte med en sådan abstraktion ved hjælp af en grænseflade. Uanset om implementeringen af den definerede grænseflade opnås på sensorknudepunkternes dræn eller gateways komponenter, skal de producerede datastrømme være i overensstemmelse med det almindeligt accepterede format, der skal muliggøre interoperabilitet. Generelt kan ethvert fælles dataformat, der udnytter den semantiske datamodel, anvendes til at repræsentere datarepræsentationen, eller endog flere dataformater, der er rettet mod forskellige niveauer af dataabstraktioner, kan eksistere parallelt, afhængigt af brugernes behov. Denne fremgangsmåde er lovende og giver god skalerbarhed, høj ydeevne og effektiv datafusion over heterogene sensornetværk samt fleksibilitet i forbindelse med aggregering af datastrømme osv.

Som nævnt ovenfor forsøger anvendelsesorienterede fremgangsmåder at tilbyde den mest effektive måde, hvorpå brugerapplikationer kan få de nødvendige oplysninger fra de integrerede sensornetværk. Imidlertid lider fokuseringen på at levere interaktion på højt niveau mellem applikationer og det underliggende system, med mulighed for vidensafledte funktioner, undertiden under præstationsaspekterne, hvilket forhindrer en bredere accept af disse løsninger. Vi har identificeret fire undergrupper, der deler det samme grundlæggende princip om en top-down-tilgang: tilgange med serviceorienteret arkitektur, tilgange med tjenestekomposition, tilgange med regelbaseret datatransformation og agentbaserede systemer.

De serviceorienterede arkitekturtilgange giver en standardtjenestegrænseflade med definerede metoder og datakodninger til indhentning af observationer og målinger fra de ønskede sensorer. Endvidere kan den tilbyde funktioner som f.eks. at få oplysninger om sensorers egenskaber, mulighed for at abonnere på udvalgte sensorers dataværdier, indsendelse af forespørgsler, eventuelt aktiveringsfunktioner osv. Den dominerende interaktion i disse arkitekturer er forespørgsels- og svarmodellen og i mindre grad den begivenhedsbaserede levering af sensordata. En ulempe ved denne fremgangsmåde er, at den ikke har mulighed for at fusionere stream-baserede sensordata sammen med arkiverede eller erhvervede datatyper. Selv om der ikke er nogen eksplicitte begrænsninger for den konkrete implementering, er denne fremgangsmåde ofte vertikalt orienteret og dækker kun ét anvendelsesområde.

De tjenestekompositionsorienterede fremgangsmåder giver brugerne mulighed for at definere vilkårlige tjenester eller datastrømme med specifikke karakteristika af interesse. Systemet vil forsøge at sammensætte en sådan datastrøm ved at anvende specifik behandling over passende datakilder, hvilket vil resultere i en datastrøm, der er i overensstemmelse med den ønskede specifikation. Brugernes anmodninger kan udtrykkes fuldt ud ved at muliggøre en semantisk modelbaseret beskrivelse af de ønskede datastrømme og behandlingsmuligheder: semantikbaseret ræsonnement kan anvendes, når der søges efter en optimal sammensætning af de tilgængelige komponenter. Denne fremgangsmåde synes at give de mest fleksible løsninger set fra applikationernes synsvinkel, selv om ydelsen kan blive forringet på grund af realtidsopdagelse af tjenestekompositionen.

Den regelbaserede datatransformation synes at være den mest almindelige fremgangsmåde til udnyttelse af semantiske datamodeller. Infering af ny viden eller detektering af begivenheder på højt niveau opnås ved hjælp af kortlægningsfunktioner, der er baseret på forbindelserne mellem de begreber, der er registreret i domænemodellens ontologiske repræsentation, og observationer og målinger af sensordata. Der kan være flere transformationer gennem arkitekturen i overensstemmelse med de forskellige lag i informationsmodellen. Data omdannes fra formater på lavere niveau til semantisk baserede repræsentationer, der muliggør semantisk søgning og anvendelse af algoritmer til ræsonnement.

De agentbaserede systemer består af flere typer af agenter. Agenter er softwarekomponenter, der er i stand til at udføre specifikke opgaver. De opnår i samarbejde de ønskede funktionaliteter. Til den interne agentkommunikation kan der anvendes nogle af standardagentplatformene eller en specifik implementering. Typisk hører agenterne til et af flere lag baseret på den type funktioner, de er ansvarlige for. Der kan også være flere agenttyper i ét logisk lag. Agenter fra de øverste lag anvender agenter fra de lavere lag. Om agenterne anvender sensordatasemantik, eller om der anvendes semantiske modeller til beskrivelse af agentens behandlingskapaciteter, afhænger af den konkrete implementering.

Klassifikationstræet, der er afledt af de førnævnte klassifikationskriterier, er vist i figur 1 og består af syv blade. Hvert blad i klassifikationstræet er tildelt et navn, som beskrevet ovenfor. Listen over eksisterende løsninger (eksempler) er angivet i overensstemmelse med den anvendte klassifikation for hvert blad (klasse). Vi har kun angivet navnene på metoderne og de vigtigste referencer i et særskilt afsnit for at give interesserede læsere mulighed for at studere yderligere detaljer … For enkelhedens skyld giver vi et vilkårligt navn til en løsning, som ikke har et eksplicit navn, der er givet af forfatterne. Vi bruger enten navnet på den institution, som forfatterne kom fra, eller navnet på det vigtigste strategiske spørgsmål, der er karakteristisk for den pågældende løsning.

Fig. 1. Klassifikationstræet for sensorwebarkitekturer.

De databasecentrerede løsninger omfatter ikke-semantiske tilgange såsom Cougar-databasesystemet , et af de første forskningsarbejder i retning af integration af sensornetværk, og SenseWeb , som er et eksempel på maksimal udnyttelse af den beskrevne tilgang. ES3N er et eksempel på en semantikbaseret databasecentreret tilgang.

Alle løsninger vedrørende tilgange til forespørgselsoversættelse anvender semantiske teknologier og omfatter: CSIRO’s semantiske sensornet , den SPARQLSTREAM-baserede tilgang og SemSorGrid4Env , som er den mest omfattende løsning i denne gruppe.

Den seneste forskningsindsats på dette område hører til sensorvirtualiseringstilgange. Den ikke-semantiske tilgang anvendes i GSN , mens de løsninger, der foreslås i store EU-finansierede projekter som SENSEI og Internet of Things (IoT), anvender semantik af data.

De tjenesteorienterede arkitekturer omfatter enkle og alligevel effektive ikke-semantiske løsninger som TinyREST og OGC SWE-specifikationerne for referencearkitekturen, der er gennemført af forskellige parter . En semantisk aktiveret tilgang anvendes i SemSOS.

Tjenestekompositionstilgangene har tendens til at tilbyde den mest fleksible interaktion for brugerne, og Hourglass er et eksempel på en ikke-semantikbaseret løsning. Mere kraftfulde løsninger anvender semantiske tilgange og omfatter SONGS og en arkitektur udviklet hos IBM .

De mest almindelige arkitekturer, der anvender semantiske teknologier, hører til regelbaserede datatransformationstilgange og omfatter: et semantikbaseret sensordatafusionssystem udviklet ved University of Toronto , en pluggable arkitektur designet ved National Technical University of Athens , og SWASN , en del af Ericssons CommonSense-vision .

Finalt har de agentbaserede tilgange både de ikke-semantiske og semantiske repræsentanter: den første er en sensorinfrastruktur i internetskala kaldet IrisNet , mens den anden er SWAP , et multi-agent-system til sensorweb-arkitekturer.

Skriv et svar

Din e-mailadresse vil ikke blive publiceret.