4 Klassifikationskriterien und der Klassifikationsbaum
Die beiden Hauptprobleme bei der Erstellung einer neuen Taxonomie sind: die Klassifikationskriterien und der Klassifikationsbaum. Die Klassifizierungskriterien wurden so gewählt, dass sie das Wesentliche der grundlegenden Forschungsperspektive widerspiegeln. Der Klassifikationsbaum wurde durch sukzessive Anwendung der gewählten Kriterien erstellt. Die Blätter des Klassifikationsbaums sind die Beispiele (Forschungsanstrengungen), die später im Abschnitt „Darstellung bestehender Lösungen“ kurz erläutert werden.
In dieser Studie haben wir auch Architekturen berücksichtigt, die sich nicht mit der Datensemantik befassen, deren Architekturen aber die Forschung in eine bestimmte Richtung beeinflusst haben. Darüber hinaus haben wir gezeigt, wie die semantische Datenanreicherung die Effizienz des verwendeten Ansatzes verbessert.
Da die Rolle der Integrationsplattform für Sensornetzwerke darin besteht, als Schnittstelle zwischen Sensornetzwerken und Benutzeranwendungen zu fungieren, können die Forscher das Problem entweder auf der Ebene der Sensornetzwerke, d.h. von unten nach oben, oder auf der Ebene der Anwendungen, d.h. von oben nach unten, angehen. Als Hauptklassifizierungskriterium der untersuchten Architekturen klassifizieren wir daher die Architekturen nach dem gewählten Ansatz, der Folgendes umfassen kann: Sensornetzwerk-orientierter Ansatz und anwendungsorientierter Ansatz. Beim ersten Ansatz versuchen die Forscher, die Heterogenität der Sensornetzwerke, die technischen Merkmale der Sensornetzwerke, die Beschränkungen, die Protokolle und die erzeugten Beobachtungen und Messungen zu lösen, indem sie einen optimalen Weg für die Handhabung, Darstellung, Speicherung und Aggregation der verfügbaren Sensordatenquellen für die oberen Schichten des Systems und damit für die Anwendungen vorschlagen. Im zweiten Ansatz tendieren die Forscher dazu, eine möglichst konforme Schnittstelle und einen Interaktionsmechanismus für Benutzer und Anwendungen zu ermöglichen, die es ihnen erlauben, die Informationen, an denen sie interessiert sind, aus den integrierten Sensornetzwerken zu erhalten, indem sie sie von der Komplexität und den Besonderheiten dieser Sensornetzwerke befreien.
Innerhalb der ersten Klasse können wir drei Untergruppen identifizieren: datenbankzentrierte Architekturen, auf Abfrageübersetzung basierende Ansätze und auf Sensorvirtualisierung basierende Ansätze. Alle diese Untergruppen können weiter in Ansätze mit und ohne Einsatz von Datensemantik unterteilt werden.
Die datenbankzentrierten Lösungen zeichnen sich dadurch aus, dass eine Datenbank als zentraler Knotenpunkt aller gesammelten Sensordaten dient und folglich alle Suchvorgänge und Manipulationen von Sensordaten über die Datenbank durchgeführt werden. Es ist eine Herausforderung, heterogene Sensordaten auf ein einheitliches Datenbankschema abzubilden. Es sollte ein zusätzlicher Mechanismus für die Unterstützung von Echtzeitdaten vorgesehen werden, da diese Art von Daten aufgrund ihres großen Volumens kaum direkt zwischengespeichert werden kann. Das Hauptproblem bei diesem Ansatz ist die Skalierbarkeit, da der Datenbankserver sowohl das Einfügen von Daten aus den Sensorknoten als auch die Durchführung von Anwendungsabfragen bewältigen muss. Dieser Ansatz kann von der Möglichkeit profitieren, Data-Mining- und maschinelle Lerntechniken über den gespeicherten Pool von Sensordaten zu unterstützen.
Der Ansatz der Abfrageübersetzung nutzt die natürliche Form von Sensordaten und die zugehörigen Abfragesprachen, um die Abfrage des Benutzers in die Zielabfragesprache einer bestimmten Quelle zu transformieren. Dieser Ansatz impliziert die Notwendigkeit, die Informationen der verfügbaren Datenquellen zu erhalten, in erster Linie die native Abfragesprache einer bestimmten Datenquelle, das Format und die Art der erzeugten Daten, aber er kann auch Informationen über die Fähigkeiten der Sensoren, die Netzwerktopologie und die Leistungsbeschränkungen für eine bessere Abfrageoptimierung enthalten. Die Ergebnisse der nativen Abfragen sollten in das Zieldatenformat gebracht werden. Ein potenzieller Leistungsnachteil besteht darin, dass für jede Benutzeranfrage zwei Konvertierungen in der Laufzeit durchgeführt werden müssen: wenn eine Abfrage in eine native Abfrage übersetzt wird und erneut, wenn die Abfrageergebnisse in das Zielformat konvertiert werden sollen.
Beim Sensorvirtualisierungsansatz werden Sensoren und andere Geräte mit einem abstrakten Datenmodell dargestellt und Anwendungen die Möglichkeit gegeben, über eine Schnittstelle direkt mit dieser Abstraktion zu interagieren. Unabhängig davon, ob die Implementierung der definierten Schnittstelle auf den Komponenten der Sensorknoten, Senken oder Gateways erfolgt, müssen die erzeugten Datenströme einem allgemein akzeptierten Format entsprechen, das Interoperabilität ermöglichen soll. Generell könnte jedes gängige Datenformat, das das semantische Datenmodell nutzt, für die Datendarstellung verwendet werden, oder es könnten sogar mehrere Datenformate, die auf verschiedene Ebenen der Datenabstraktion abzielen, parallel nebeneinander bestehen, je nach den Bedürfnissen der Nutzer. Dieser Ansatz ist vielversprechend und bietet eine gute Skalierbarkeit, hohe Leistung und effiziente Datenfusion über heterogene Sensornetzwerke sowie Flexibilität bei der Aggregation von Datenströmen usw.
Wie oben erwähnt, versuchen anwendungsorientierte Ansätze, den effizientesten Weg für Benutzeranwendungen zu bieten, um benötigte Informationen aus den integrierten Sensornetzwerken zu erhalten. Die Konzentration auf die Bereitstellung der High-Level-Interaktion zwischen Anwendungen und dem zugrundeliegenden System, mit der Möglichkeit, Wissen abzuleiten, leidet jedoch manchmal unter den Leistungsaspekten, die eine breitere Akzeptanz dieser Lösungen verhindern. Wir haben vier Untergruppen identifiziert, die das gleiche Grundprinzip des Top-Down-Ansatzes teilen: die Ansätze der serviceorientierten Architektur, der Servicekomposition, der regelbasierten Datentransformation und der agentenbasierten Systeme.
Die Ansätze der serviceorientierten Architektur bieten eine Standarddienstschnittstelle mit definierten Methoden und Datenkodierungen, um Beobachtungen und Messungen von gewünschten Sensoren zu erhalten. Darüber hinaus können Funktionen wie das Abrufen von Informationen über die Eigenschaften der Sensoren, das Abonnieren ausgewählter Sensordaten, das Stellen von Abfragen, optional auch Ansteuerungsfunktionen, etc. angeboten werden. Die vorherrschende Interaktion in diesen Architekturen ist das Anfrage-Antwort-Modell, und in geringerem Maße die ereignisbasierte Lieferung von Sensordaten. Ein Nachteil dieses Ansatzes besteht darin, dass er nicht in der Lage ist, strombasierte Sensordaten zusammen mit archivierten oder erfassten Datentypen zu verschmelzen. Obwohl es keine expliziten Beschränkungen für die konkrete Implementierung gibt, ist dieser Ansatz eher vertikal orientiert und deckt nur eine Anwendungsdomäne ab.
Die dienstkompositionsorientierten Ansätze ermöglichen es den Benutzern, beliebige Dienste oder Datenströme mit spezifischen Merkmalen von Interesse zu definieren. Das System wird versuchen, einen solchen Datenstrom zu komponieren, indem es eine spezifische Verarbeitung über geeignete Datenquellen anwendet, was zur Erzeugung eines Datenstroms führt, der mit der angeforderten Spezifikation übereinstimmt. Die volle Ausdrucksfähigkeit der Benutzeranfragen könnte durch eine semantische, modellbasierte Beschreibung der gewünschten Datenströme und Verarbeitungsfähigkeiten erreicht werden: Bei der Suche nach einer optimalen Zusammensetzung der verfügbaren Komponenten könnte semantikbasiertes Reasoning eingesetzt werden. Dieser Ansatz scheint aus Sicht der Anwendungen die flexibelsten Lösungen zu bieten, obwohl die Leistung aufgrund der Echtzeit-Ermittlung der Dienstkomposition beeinträchtigt werden kann.
Die regelbasierte Datentransformation scheint der häufigste Ansatz zur Nutzung semantischer Datenmodelle zu sein. Die Ableitung von neuem Wissen oder die Erkennung von Ereignissen auf hoher Ebene wird durch die Mapping-Funktionen erreicht, die sich auf die Beziehungen zwischen den Konzepten, die in der ontologischen Darstellung des Domänenmodells erfasst sind, und den Beobachtungen und Messungen der Sensordaten stützen. Je nach den verschiedenen Ebenen des Informationsmodells kann es mehrere Transformationen durch die Architektur geben. Die Daten werden von Formaten auf niedrigerer Ebene in semantische Repräsentationen umgewandelt, die die Anwendung semantischer Such- und Schlussfolgerungsalgorithmen ermöglichen.
Die agentenbasierten Systeme bestehen aus verschiedenen Arten von Agenten. Agenten sind Softwarekomponenten, die in der Lage sind, bestimmte Aufgaben auszuführen. Sie erreichen kollaborativ gewünschte Funktionalitäten. Für die interne Agenten-Kommunikation können einige Standard-Agentenplattformen oder eine spezifische Implementierung verwendet werden. In der Regel gehören Agenten zu einer von mehreren Schichten, je nach Art der Funktionen, für die sie zuständig sind. Es kann auch mehrere Agententypen in einer logischen Schicht geben. Agenten aus höheren Schichten setzen Agenten aus niedrigeren Schichten ein. Ob die Agenten Sensordatensemantik verwenden oder ob semantische Modelle für die Beschreibung der Verarbeitungsfähigkeiten der Agenten verwendet werden, hängt von der konkreten Implementierung ab.
Der Klassifikationsbaum, der aus den oben genannten Klassifikationskriterien abgeleitet wurde, ist in Abb. 1 dargestellt und besteht aus sieben Blättern. Jedem Blatt des Klassifikationsbaumes ist, wie oben beschrieben, ein Name zugeordnet. Die Liste der vorhandenen Lösungen (Beispiele) wird entsprechend der angewandten Klassifizierung für jedes Blatt (Klasse) angegeben. Wir haben nur die Namen der Ansätze und die wichtigsten Referenzen in einem separaten Absatz aufgeführt, damit interessierte Leser weitere Details studieren können. Der Einfachheit halber geben wir einer Lösung, die von den Autoren nicht explizit benannt wurde, einen willkürlichen Namen. Wir verwenden entweder den Namen der Institution, aus der die Autoren stammen, oder den Namen des wichtigsten strategischen Problems, das für diese Lösung charakteristisch ist.
Zu den datenbankzentrierten Lösungen gehören nicht-semantische Ansätze wie das Cougar-Datenbanksystem, eine der ersten Forschungsarbeiten zur Integration von Sensornetzen, und SenseWeb, das ein Beispiel für die maximale Nutzung des beschriebenen Ansatzes ist. Das ES3N ist ein Beispiel für einen semantikbasierten datenbankzentrierten Ansatz.
Alle Lösungen, die sich auf Abfrageübersetzungsansätze beziehen, verwenden semantische Technologien und umfassen: das semantische Sensornetzwerk des CSIRO , den SPARQLSTREAM-basierten Ansatz und das SemSorGrid4Env , das die umfassendste Lösung in dieser Gruppe ist.
Die jüngsten Forschungsbemühungen in diesem Bereich gehören zu den Sensorvirtualisierungsansätzen. Der nicht-semantische Ansatz wird im GSN verwendet, während die Lösungen, die in großen, von der EU finanzierten Projekten wie SENSEI und dem Internet der Dinge (IoT) vorgeschlagen werden, die Semantik der Daten nutzen.
Die dienstorientierten Architekturen umfassen einfache und dennoch effiziente nicht-semantische Lösungen wie TinyREST und die OGC SWE-Spezifikationen der Referenzarchitektur, die von verschiedenen Parteien umgesetzt werden. Ein semantikfähiger Ansatz wird im SemSOS verwendet.
Die Ansätze zur Dienstkomposition bieten den Nutzern in der Regel die flexibelste Interaktion, und Hourglass ist ein Beispiel für eine nicht-semantische Lösung. Zu den leistungsfähigeren Lösungen, die semantische Ansätze nutzen, gehören SONGS und eine bei IBM entwickelte Architektur.
Die gängigsten Architekturen, die semantische Technologien nutzen, gehören zu den regelbasierten Datentransformationsansätzen und umfassen: ein semantikbasiertes Sensordatenfusionssystem, das an der Universität von Toronto entwickelt wurde, eine steckbare Architektur, die an der Nationalen Technischen Universität von Athen entworfen wurde, und SWASN, ein Teil der CommonSense-Vision von Ericsson.
Schließlich gibt es bei den agentenbasierten Ansätzen sowohl nicht-semantische als auch semantische Vertreter: Der erste ist eine internetbasierte Sensorinfrastruktur namens IrisNet , der zweite ist SWAP , ein Multi-Agenten-System für Sensor-Web-Architekturen.