Arborele de clasificare

, Author

4 Criterii de clasificare și arborele de clasificare

Cele două probleme majore în crearea unei noi taxonomii sunt: criteriile de clasificare și arborele de clasificare. Aici, criteriile de clasificare au fost alese pentru a reflecta esența punctului de vedere de bază al cercetării. Arborele de clasificare a fost obținut prin aplicarea succesivă a criteriilor alese. Frunzele arborelui de clasificare sunt exemplele (eforturile de cercetare), care sunt elaborate pe scurt mai târziu, în secțiunea Prezentarea soluțiilor existente din această lucrare.

În acest studiu, am inclus și arhitecturi care nu se ocupă de semantica datelor, dar ale căror arhitecturi au influențat cercetarea într-o anumită direcție. În plus, am arătat modul în care îmbogățirea semantică a datelor îmbunătățește eficiența abordării utilizate.

Din moment ce rolul platformei de integrare a rețelelor de senzori este de a acționa ca o interfață între rețelele de senzori și aplicația utilizatorilor, cercetătorii au posibilitatea de a aborda problema fie la nivelul rețelelor de senzori, adică de jos în sus, fie la nivelul aplicațiilor, adică o abordare de sus în jos. Prin urmare, ca principal criteriu de clasificare a arhitecturilor analizate, clasificăm arhitecturile în funcție de abordarea selectată, care poate include: abordarea orientată spre rețele de senzori și abordarea orientată spre aplicații. În prima abordare, cercetătorii încearcă să rezolve problema eterogenității rețelelor de senzori, a caracteristicilor tehnice ale rețelelor de senzori, a constrângerilor, a protocoalelor și a observațiilor și măsurătorilor produse, propunând o modalitate optimă de manipulare, reprezentare, stocare și agregare a surselor de date ale senzorilor disponibile către straturile superioare ale sistemului și, prin urmare, către aplicații. În cea de-a doua abordare, cercetătorii tind să permită o interfață cât mai conformă cu posibilitățile și un mecanism de interacțiune pentru utilizatori și aplicații, care să le permită acestora să obțină informațiile care îi interesează, din rețelele integrate de senzori, eliberându-i de complexitatea și specificul acestor rețele de senzori.

În cadrul primei clase, putem identifica trei subgrupuri: arhitecturi centrate pe baze de date, abordări bazate pe traducerea interogărilor și abordări bazate pe virtualizarea senzorilor. Toate aceste subgrupuri pot fi împărțite în continuare în abordări cu și fără angajarea semanticii datelor.

Soluțiile centrate pe baza de date sunt caracterizate cu o bază de date ca un hub central al tuturor datelor colectate de la senzori și, în consecință, toate căutările și manipulările datelor senzorilor sunt efectuate prin intermediul bazei de date. Este o provocare să se mapeze datele eterogene ale senzorilor la o schemă unică de bază de date. Ar trebui prevăzut un mecanism suplimentar pentru suportul datelor în timp real, deoarece acest tip de date este greu de pus direct în memoria cache din cauza volumului său mare. Principala preocupare cu privire la această abordare este scalabilitatea, deoarece serverul bazei de date ar trebui să gestioneze atât inserțiile de date provenite de la nodurile senzoriale, cât și să efectueze interogări ale aplicației. Această abordare poate beneficia de posibilitatea de a permite suportul pentru tehnicile de extragere a datelor și de învățare automată pe fondul stocat de date ale senzorilor.

Abordarea de traducere a interogărilor utilizează forma naturală a datelor senzorilor și limbajele de interogare asociate pentru a transforma interogarea utilizatorilor în limbajul de interogare țintă al unei anumite surse. Această abordare implică necesitatea de a menține informațiile despre sursele de date disponibile, în primul rând limbajul de interogare nativ al unei anumite surse de date, formatul și natura datelor produse, dar poate include și informații despre capacitățile senzorilor, topologia rețelei, constrângerile de putere pentru o mai bună optimizare a interogării. Rezultatele interogărilor native ar trebui să fie asamblate în formatul de date țintă. Potențial, un dezavantaj de performanță constă în faptul că trebuie efectuate două conversii pentru fiecare solicitare a utilizatorului în timpul de execuție: atunci când o interogare este tradusă într-o interogare nativă și, din nou, atunci când rezultatele interogării trebuie convertite în formatul țintă.

În abordarea de virtualizare a senzorilor, senzorii și alte dispozitive sunt reprezentate cu un model de date abstract, iar aplicațiilor li se oferă posibilitatea de a interacționa direct cu o astfel de abstractizare folosind o interfață. Indiferent dacă punerea în aplicare a interfeței definite este realizată pe componentele nodurilor senzoriale sinks sau gateway-uri, fluxurile de date produse trebuie să respecte formatul comun acceptat care ar trebui să permită interoperabilitatea. În general, orice format comun de date, care utilizează modelul semantic de date, ar putea fi utilizat pentru reprezentarea datelor sau chiar mai multe formate de date care vizează diferite niveluri de abstractizare a datelor ar putea coexista în paralel, în funcție de nevoile utilizatorilor. Această abordare este una promițătoare și oferă o bună scalabilitate, o performanță ridicată și o fuziune eficientă a datelor în rețele de senzori eterogene, precum și flexibilitate în agregarea fluxurilor de date etc.

După cum s-a spus mai sus, abordările orientate spre aplicații încearcă să ofere modul cel mai eficient pentru ca aplicațiile utilizatorilor să obțină informațiile necesare din rețelele integrate de senzori. Cu toate acestea, concentrarea asupra furnizării unei interacțiuni de nivel înalt între aplicații și sistemul subiacent, cu caracteristici care să permită inferarea cunoștințelor, suferă uneori de aspecte legate de performanță, ceea ce împiedică o acceptare mai largă a acestor soluții. Am identificat patru subgrupuri care împărtășesc același principiu de bază al abordării de sus în jos: abordările de arhitectură orientată pe servicii, abordările de compunere a serviciilor, abordările de transformare a datelor pe bază de reguli și sistemele bazate pe agenți.

Abordările de arhitectură orientată pe servicii oferă o interfață de servicii standard cu metode definite și codificări de date pentru obținerea de observații și măsurători de la senzorii doriți. În plus, ar putea oferi funcții precum obținerea de informații despre caracteristicile senzorilor, capacitatea de a se abona la valorile datelor senzorilor selectați, transmiterea de interogări, opțional funcțiile de acționare etc. Interacțiunea dominantă în aceste arhitecturi este modelul cerere-răspuns și, într-o mai mică măsură, furnizarea de date ale senzorilor pe bază de evenimente. Un dezavantaj al acestei abordări este că nu are capacitatea de a fuziona datele senzorilor bazate pe fluxuri împreună cu tipurile de date arhivate sau achiziționate. Deși nu există constrângeri explicite asupra implementării concrete, această abordare tinde să fie orientată pe verticală și acoperă doar un singur domeniu de aplicații.

Abordările orientate spre compunerea serviciilor permit utilizatorilor posibilitatea de a defini servicii arbitrare sau fluxuri de date cu caracteristici specifice de interes. Sistemul va încerca să compună un astfel de flux de date prin aplicarea unei prelucrări specifice asupra surselor de date corespunzătoare, ceea ce va avea ca rezultat producerea unui flux de date care se conformează specificației solicitate. Expresivitatea completă a cererii utilizatorului ar putea fi obținută prin permiterea unei descrieri bazate pe modele semantice a fluxurilor de date și a capacităților de procesare dorite: raționamentul bazat pe semantică ar putea fi utilizat atunci când se caută o compoziție optimă a componentelor disponibile. Această abordare pare să ofere cele mai flexibile soluții din perspectiva aplicațiilor, deși performanța poate fi degradată din cauza descoperirii în timp real a compoziției serviciilor.

Transformarea datelor pe bază de reguli pare a fi cea mai comună abordare pentru utilizarea modelelor semantice de date. Deducerea de noi cunoștințe sau detectarea evenimentelor de nivel înalt se realizează prin funcțiile de cartografiere care se bazează pe relațiile dintre conceptele capturate în reprezentarea ontologică a modelului de domeniu și observațiile și măsurătorile datelor senzorilor. Ar putea exista mai multe transformări prin arhitectură în funcție de diferitele straturi din modelul informațional. Datele sunt transformate din formate de nivel inferior în reprezentări bazate pe semantică, permițând aplicarea algoritmilor de căutare semantică și de raționament.

Sistemele bazate pe agenți constau din mai multe tipuri de agenți. Agenții sunt componente software capabile să îndeplinească sarcini specifice. Ei realizează în mod colaborativ funcționalitățile dorite. Pentru comunicațiile interne ale agenților pot fi utilizate unele dintre platformele standard de agenți sau o implementare specifică. În mod obișnuit, agenții aparțin unuia dintre mai multe straturi, în funcție de tipul de funcționalități de care sunt responsabili. De asemenea, pot exista mai multe tipuri de agenți într-un singur strat logic. Agenții din straturile superioare angajează agenți din straturile inferioare. De implementarea concretă depinde dacă agenții utilizează semantica datelor senzoriale sau dacă sunt utilizate modele semantice pentru descrierea capacităților de procesare ale agenților.

Arborele de clasificare, derivat din criteriile de clasificare menționate anterior, este prezentat în figura 1 și este compus din șapte frunze. Fiecărei frunze a arborelui de clasificare i se atribuie un nume, conform descrierii de mai sus. Lista de soluții existente (exemple) este prezentată în funcție de clasificarea aplicată pentru fiecare frunză (clasă). Am furnizat doar numele abordărilor și referințele majore într-un paragraf separat, pentru a permite cititorilor interesați să studieze detalii suplimentare…. Din motive de simplitate, dăm un nume arbitrar unei soluții care nu are un nume explicit dat de autori. Folosim fie numele instituției de la care provin autorii, fie numele principalei probleme strategice caracteristice pentru soluția respectivă.

Fig. 1. Arborele de clasificare a arhitecturilor Sensor Web.

Soluțiile centrate pe baza de date includ abordări nesemantice, cum ar fi sistemul de baze de date Cougar , una dintre primele lucrări de cercetare spre integrarea rețelelor de senzori, și SenseWeb , care este un exemplu de utilizare maximă a abordării descrise. ES3N este un exemplu de abordare centrată pe baze de date bazate pe semantică.

Toate soluțiile referitoare la abordările de traducere a interogărilor utilizează tehnologii semantice și includ: rețeaua semantică de senzori CSIRO , abordarea bazată pe SPARQLSTREAM și SemSorGrid4Env , care este cea mai cuprinzătoare soluție din acest grup.

Cele mai recente eforturi de cercetare în acest domeniu aparțin abordărilor de virtualizare a senzorilor. Abordarea nesemantică este utilizată în GSN , în timp ce soluțiile propuse în proiecte finanțate de UE la scară largă, cum ar fi SENSEI și Internetul Lucrurilor (IoT) utilizează semantica datelor.

Arhitecturile orientate pe servicii includ soluții nesemantice simple și totuși eficiente, cum ar fi TinyREST și specificațiile OGC SWE ale arhitecturii de referință implementate de diverse părți . O abordare bazată pe semantică este utilizată în SemSOS .

Abordările de compunere a serviciilor tind să ofere utilizatorilor cea mai flexibilă interacțiune, iar Hourglass este un exemplu de soluție nesemantică. Soluții mai puternice utilizează abordări semantice și includ SONGS și o arhitectură dezvoltată la IBM .

Cele mai comune arhitecturi care utilizează tehnologii semantice aparțin abordărilor de transformare a datelor bazate pe reguli și includ: un sistem de fuziune a datelor senzorilor bazat pe semantică dezvoltat la Universitatea din Toronto , o arhitectură conectabilă concepută la Universitatea Tehnică Națională din Atena și SWASN , o parte a viziunii CommonSense de la Ericsson .

În cele din urmă, abordările bazate pe agenți au atât reprezentanți nesemantici, cât și semantici: primul este o infrastructură de senzori la scară de Internet numită IrisNet , în timp ce al doilea este SWAP , un sistem multi-agent pentru arhitecturi Sensor Web.

.

Lasă un răspuns

Adresa ta de email nu va fi publicată.