4 Classificatiecriteria en de classificatieboom
De belangrijkste twee problemen bij het creëren van een nieuwe taxonomie zijn: de classificatiecriteria en de classificatieboom. De classificatiecriteria zijn hier gekozen om de essentie van het basisstandpunt van het onderzoek weer te geven. De classificatieboom is verkregen door opeenvolgende toepassing van de gekozen criteria. De bladeren van de classificatieboom zijn de voorbeelden (onderzoeksinspanningen), die later kort worden uitgewerkt, in het gedeelte Presentatie van bestaande oplossingen van dit document.
In deze studie hebben wij ook architecturen opgenomen die geen betrekking hebben op de gegevenssemantiek, maar waarvan de architecturen het onderzoek in een bepaalde richting hebben beïnvloed. Daarnaast hebben we laten zien hoe semantische dataverrijking de efficiëntie van de gebruikte benadering verbetert.
Omdat de rol van het sensornetwerkintegratieplatform is om op te treden als interface tussen sensornetwerken en gebruikerstoepassingen, kunnen onderzoekers het probleem aanpakken op het niveau van sensornetwerken, d.w.z. bottom-up, of op het niveau van toepassingen, d.w.z. top-down benadering. Als belangrijkste indelingscriterium van de onderzochte architecturen classificeren we daarom de architecturen volgens de gekozen aanpak, die kan omvatten: sensornetwerkgeoriënteerde aanpak en toepassingsgeoriënteerde aanpak. In de eerste benadering proberen onderzoekers een oplossing te vinden voor de heterogeniteit van sensornetwerken, de technische kenmerken van sensornetwerken, de beperkingen, de protocollen en de geproduceerde waarnemingen en metingen, door een optimale manier voor te stellen voor de behandeling, representatie, opslag en aggregatie van de beschikbare sensorgegevensbronnen voor de hogere lagen in het systeem, en dus voor de toepassingen. In de tweede benadering zijn onderzoekers geneigd om een zo-conform-als-mogelijk interface en een interactiemechanisme voor gebruikers en toepassingen mogelijk te maken, die hen in staat stellen om de informatie waarin zij geïnteresseerd zijn, uit de geïntegreerde sensornetwerken te halen, door hen te bevrijden van de complexiteiten en bijzonderheden van die sensornetwerken.
In de eerste klasse kunnen wij drie subgroepen onderscheiden: database-gecentreerde architecturen, benaderingen gebaseerd op query-vertaalsystemen, en op sensorvirtualisatie gebaseerde benaderingen. Al deze subgroepen kunnen verder worden onderverdeeld in de benaderingen met en zonder data semantiek werkgelegenheid.
De database gecentreerde oplossingen worden gekenmerkt met een database als een centrale hub van alle verzamelde sensorgegevens, en bijgevolg alle zoeken en manipulatie van sensorgegevens worden uitgevoerd over de database. Het is een uitdaging om heterogene sensorgegevens in een uniek databaseschema onder te brengen. Er moet worden voorzien in een aanvullend mechanisme voor real-time gegevensondersteuning, omdat dit soort gegevens vanwege het grote volume nauwelijks rechtstreeks in een cache kan worden opgeslagen. Het belangrijkste punt van zorg bij deze aanpak is de schaalbaarheid, aangezien de databaseserver zowel het invoegen van gegevens afkomstig van de sensorknooppunten moet verwerken, als het uitvoeren van zoekopdrachten voor toepassingen. Deze aanpak kan profiteren van de mogelijkheid om ondersteuning voor datamining en technieken voor machinaal leren mogelijk te maken over de opgeslagen pool van sensorgegevens.
De query-vertalingsaanpak maakt gebruik van de natuurlijke vorm van sensorgegevens en de bijbehorende query-talen om de gebruikersvraag om te zetten in de doel-query-taal van een bepaalde bron. Deze benadering impliceert een behoefte om de informatie van beschikbare gegevensbronnen te handhaven, hoofdzakelijk de inheemse querytaal van bepaalde gegevensbron, formaat en de aard van geproduceerde gegevens, maar het kan ook informatie over sensormogelijkheden, netwerktopologie, machtsbeperkingen voor betere queryoptimalisering omvatten. De resultaten van native query’s moeten worden geassembleerd in het beoogde dataformaat. Een potentieel nadeel voor de prestaties ligt in het feit dat er per gebruikersaanvraag twee conversies moeten worden uitgevoerd in de runtime: wanneer een query wordt vertaald naar een native query, en nog een keer wanneer de query-resultaten moeten worden geconverteerd naar het doelformaat.
In de sensorvirtualisatie-benadering worden sensoren en andere apparaten gerepresenteerd met een abstract gegevensmodel en worden toepassingen voorzien van de mogelijkheid tot directe interactie met een dergelijke abstractie door middel van een interface. Of de implementatie van de gedefinieerde interface nu wordt gerealiseerd op de sensorknooppunten sinks of gateways componenten, de geproduceerde datastromen moeten voldoen aan het algemeen aanvaarde formaat dat interoperabiliteit mogelijk moet maken. In het algemeen kan elk gemeenschappelijk gegevensformaat dat gebruik maakt van het semantische gegevensmodel worden gebruikt voor de representatie van gegevens, of kunnen zelfs meerdere gegevensformaten die gericht zijn op verschillende niveaus van gegevensabstracties naast elkaar bestaan, afhankelijk van de behoeften van de gebruiker. Deze benadering is veelbelovend en biedt een goede schaalbaarheid, hoge prestaties en efficiënte gegevensfusie over heterogene sensornetwerken, evenals flexibiliteit bij het aggregeren van gegevensstromen, enz.
Zoals hierboven vermeld, proberen toepassingsgerichte benaderingen de meest efficiënte manier te bieden aan gebruikersapplicaties om de benodigde informatie uit de geïntegreerde sensornetwerken te halen. De focus op de levering van de high-level interactie tussen toepassingen en het onderliggende systeem, met de mogelijkheid om kennis af te leiden, lijdt echter soms onder de prestatie-aspecten, die een bredere acceptatie van deze oplossingen verhinderen. We hebben vier subgroepen geïdentificeerd die hetzelfde basisprincipe van top-down benadering delen: de service-georiënteerde architectuur benaderingen, service-compositie benaderingen, regel-gebaseerde data transformatie benaderingen, en agent-gebaseerde systemen.
De service-georiënteerde-architectuur benaderingen bieden een standaard service interface met gedefinieerde methoden en data coderingen voor het verkrijgen van observaties en metingen van gewenste sensoren. Bovendien kunnen functies worden aangeboden zoals het verkrijgen van informatie over de kenmerken van de sensoren, de mogelijkheid om in te schrijven op geselecteerde gegevenswaarden van de sensoren, het indienen van zoekopdrachten, facultatief de bedieningsfuncties, enz. De dominante interactie in deze architecturen is het verzoek-antwoord model, en in mindere mate de event-gebaseerde levering van sensor data. Een nadeel van deze aanpak is dat het niet mogelijk is om stroom-gebaseerde sensorgegevens te combineren met gearchiveerde of verworven gegevenstypen. Hoewel er geen expliciete beperkingen aan de concrete implementatie worden gesteld, neigt deze benadering ertoe verticaal georiënteerd te zijn en bestrijkt zij slechts één toepassingsdomein.
De service-compositie-georiënteerde benaderingen bieden gebruikers de mogelijkheid om willekeurige diensten of datastromen te definiëren met specifieke eigenschappen die van belang zijn. Het systeem zal trachten een dergelijke gegevensstroom samen te stellen door specifieke bewerkingen toe te passen op geschikte gegevensbronnen, hetgeen zal resulteren in het produceren van een gegevensstroom die voldoet aan de gevraagde specificatie. Volledige expressiviteit van de gebruikersvraag kan worden bereikt door een semantisch modelgebaseerde beschrijving van de gewenste gegevensstromen en verwerkingsmogelijkheden mogelijk te maken: op semantiek gebaseerde redenering kan worden gebruikt bij het zoeken naar een optimale samenstelling van beschikbare componenten. Deze benadering lijkt de meest flexibele oplossingen te bieden vanuit het oogpunt van de toepassingen, hoewel de prestaties kunnen afnemen als gevolg van de real-time ontdekking van de samenstelling van diensten.
De op regels gebaseerde gegevenstransformatie lijkt de meest gebruikelijke benadering voor het gebruik van semantische gegevensmodellen. Het afleiden van nieuwe kennis of het detecteren van gebeurtenissen op hoog niveau wordt bereikt door de mappingfuncties die steunen op de relaties tussen de concepten die zijn vastgelegd in de ontologische representatie van het domeinmodel en de waarnemingen en metingen van de sensordata. Er kunnen meerdere transformaties door de architectuur heen plaatsvinden naar gelang van de verschillende lagen in het informatiemodel. De gegevens worden getransformeerd van lagere formaten naar semantisch gebaseerde representaties die de toepassing van semantische zoek- en redeneeralgoritmen mogelijk maken.
De agent-gebaseerde systemen bestaan uit verschillende soorten agenten. Agenten zijn softwarecomponenten die in staat zijn specifieke taken uit te voeren. Zij bereiken gezamenlijk de gewenste functionaliteiten. Voor de interne agent communicatie kan gebruik worden gemaakt van standaard agent platforms of een specifieke implementatie. Typisch, behoren agenten tot één van verscheidene lagen gebaseerd op het type van functionaliteiten zij verantwoordelijk voor zijn. Ook kunnen er verschillende typen agenten in één logische laag zitten. Agenten uit hogere lagen maken gebruik van agenten uit lagere lagen. Of de agenten gebruik maken van sensor data semantiek, of dat semantische modellen worden gebruikt voor de beschrijving van de verwerkingsmogelijkheden van de agent hangt af van de concrete implementatie.
De classificatieboom, afgeleid van de eerder genoemde classificatiecriteria, is weergegeven in Fig. 1, en is samengesteld uit zeven bladeren. Aan elk blad van de classificatieboom is een naam toegekend, zoals hierboven beschreven. De lijst van bestaande oplossingen (voorbeelden) wordt gegeven volgens de toegepaste classificatie voor elk blad (klasse). Wij hebben alleen de namen van de benaderingen en de belangrijkste referenties in een aparte paragraaf vermeld om geïnteresseerde lezers in staat te stellen nadere bijzonderheden te bestuderen. Omwille van de eenvoud geven wij een willekeurige naam aan een oplossing waarvoor de auteurs geen expliciete naam hebben gegeven. We gebruiken ofwel de naam van de instelling waar de auteurs vandaan komen, ofwel de naam van de belangrijkste strategische kwestie die kenmerkend is voor die oplossing.
De databasegecentreerde oplossingen omvatten niet-semantische benaderingen zoals het Cougar databasesysteem , een van de eerste onderzoeken naar de integratie van sensornetwerken, en SenseWeb , dat een voorbeeld is van maximale benutting van de beschreven benadering. ES3N is een voorbeeld van een op semantiek gebaseerde databankgerichte aanpak.
Alle oplossingen die betrekking hebben op query-vertaling maken gebruik van semantische technologieën en omvatten: het CSIRO semantisch sensornetwerk , de SPARQLSTREAM-gebaseerde aanpak , en de SemSorGrid4Env , die de meest uitgebreide oplossing in deze groep is.
De meest recente onderzoeksinspanningen op dit gebied behoren tot de sensorvirtualisatiebenaderingen. De niet-semantische benadering wordt gebruikt in het GSN , terwijl de oplossingen die worden voorgesteld in grootschalige, door de EU gefinancierde projecten zoals SENSEI en het Internet of Things (IoT) gebruik maken van de semantiek van gegevens.
De dienstgerichte architecturen omvatten eenvoudige en toch efficiënte niet-semantische oplossingen zoals TinyREST en de OGC SWE-specificaties van de referentiearchitectuur die door diverse partijen worden toegepast . Een op semantiek gebaseerde aanpak wordt gebruikt in het SemSOS .
De op diensten gebaseerde benaderingen bieden de gebruikers meestal de meest flexibele interactie en Zandloper is een voorbeeld van een niet-semantisch gebaseerde oplossing. Krachtiger oplossingen maken gebruik van semantische benaderingen en omvatten SONGS en een bij IBM ontwikkelde architectuur.
De meest voorkomende architecturen die gebruik maken van semantische technologieën behoren tot op regels gebaseerde gegevenstransformatie-benaderingen en omvatten: een op semantiek gebaseerd sensordatafusiesysteem dat is ontwikkeld aan de Universiteit van Toronto , een pluggable architectuur die is ontworpen aan de Nationale Technische Universiteit van Athene , en het SWASN , een onderdeel van de CommonSense-visie van Ericsson .
Ten slotte hebben de agent-gebaseerde benaderingen zowel niet-semantische als semantische vertegenwoordigers: de eerste is een Internet-schaal sensor infrastructuur genaamd het IrisNet , terwijl de tweede de SWAP is , een multi-agent systeem voor Sensor Web architecturen.