4 Criterios de clasificación y el árbol de clasificación
Los dos principales problemas en la creación de una nueva taxonomía son: los criterios de clasificación y el árbol de clasificación. Aquí, los criterios de clasificación se han elegido para reflejar la esencia del punto de vista básico de la investigación. El árbol de clasificación se ha obtenido mediante la aplicación sucesiva de los criterios elegidos. Las hojas del árbol de clasificación son los ejemplos (esfuerzos de investigación), que se elaboran brevemente más adelante, en la sección Presentación de las soluciones existentes de este documento.
En este estudio, también hemos incluido arquitecturas que no se ocupan de la semántica de los datos, pero cuyas arquitecturas han influido en la investigación en cierta dirección. Además, hemos mostrado cómo el enriquecimiento semántico de los datos mejora la eficiencia del enfoque utilizado.
Dado que el papel de la plataforma de integración de redes de sensores es actuar como interfaz entre las redes de sensores y la aplicación de los usuarios, los investigadores pueden abordar el problema tanto a nivel de las redes de sensores, es decir, enfoque ascendente, como a nivel de las aplicaciones, es decir, enfoque descendente. Por lo tanto, como principal criterio de clasificación de las arquitecturas estudiadas, clasificamos las arquitecturas según el enfoque seleccionado, que puede incluir: enfoque orientado a las redes de sensores y enfoque orientado a las aplicaciones. En el primer enfoque, los investigadores tratan de resolver la heterogeneidad de las redes de sensores, las características técnicas de las redes de sensores, las restricciones, los protocolos y las observaciones y mediciones producidas, mediante la propuesta de una forma óptima de manejar, representar, almacenar y agregar las fuentes de datos de los sensores disponibles a las capas superiores del sistema y, por tanto, a las aplicaciones. En el segundo enfoque, los investigadores tienden a habilitar una interfaz lo más conforme posible y un mecanismo de interacción para los usuarios y las aplicaciones, que les permita obtener la información que les interesa, a partir de las redes de sensores integradas, liberándolos de las complejidades y especificidades de dichas redes de sensores.
Dentro de la primera clase, podemos identificar tres subgrupos: arquitecturas centradas en bases de datos, enfoques basados en la traducción de consultas, y enfoques basados en la virtualización de sensores. Todos estos subgrupos pueden dividirse a su vez en enfoques con y sin empleo de la semántica de datos.
Las soluciones centradas en la base de datos se caracterizan por tener una base de datos como eje central de todos los datos de los sensores recogidos, y en consecuencia toda la búsqueda y manipulación de los datos de los sensores se realiza sobre la base de datos. Es un reto mapear datos de sensores heterogéneos a un esquema de base de datos único. Debe proporcionarse un mecanismo adicional para el soporte de datos en tiempo real, ya que este tipo de datos difícilmente puede ser almacenado en caché directamente debido a su gran volumen. La principal preocupación de este enfoque es la escalabilidad, ya que el servidor de la base de datos debe manejar tanto las inserciones de datos procedentes de los nodos sensores, como realizar las consultas de la aplicación. Este enfoque puede beneficiarse de la posibilidad de permitir el apoyo a la minería de datos y las técnicas de aprendizaje automático sobre el conjunto de datos de los sensores almacenados.
El enfoque de traducción de consultas utiliza la forma natural de los datos de los sensores y los lenguajes de consulta asociados con el fin de transformar la consulta de los usuarios al lenguaje de consulta de destino de una determinada fuente. Este enfoque implica la necesidad de mantener la información de las fuentes de datos disponibles, principalmente el lenguaje de consulta nativo de cierta fuente de datos, el formato y la naturaleza de los datos producidos, pero también puede incluir información sobre las capacidades de los sensores, la topología de la red, las restricciones de energía para una mejor optimización de la consulta. Los resultados de las consultas nativas deben ensamblarse en el formato de datos de destino. Potencialmente, una desventaja de rendimiento radica en el hecho de que dos conversiones por cada solicitud del usuario deben hacerse en el tiempo de ejecución: cuando una consulta se traduce a una consulta nativa, y de nuevo cuando los resultados de la consulta deben ser convertidos en el formato de destino.
En el enfoque de virtualización de sensores, los sensores y otros dispositivos se representan con un modelo de datos abstracto y las aplicaciones se proporcionan con la capacidad de interactuar directamente con dicha abstracción utilizando una interfaz. Ya sea que la implementación de la interfaz definida se logre en los componentes de los nodos sensores o de las pasarelas, los flujos de datos producidos deben cumplir con el formato comúnmente aceptado que debe permitir la interoperabilidad. En general, cualquier formato de datos común, que aproveche el modelo semántico de datos, podría utilizarse para representar los datos, o incluso podrían coexistir en paralelo múltiples formatos de datos dirigidos a diferentes niveles de abstracción de datos, dependiendo de las necesidades del usuario. Este enfoque es prometedor y ofrece una buena escalabilidad, un alto rendimiento y una eficiente fusión de datos en redes de sensores heterogéneas, así como flexibilidad en la agregación de flujos de datos, etc.
Como se ha dicho anteriormente, los enfoques orientados a la aplicación tratan de ofrecer la forma más eficiente a las aplicaciones de usuario para obtener la información necesaria de las redes de sensores integradas. Sin embargo, al centrarse en la provisión de la interacción de alto nivel entre las aplicaciones y el sistema subyacente, con la habilitación de características de inferencia de conocimiento, a veces se resiente de los aspectos de rendimiento, lo que impide una mayor aceptación de estas soluciones. Hemos identificado cuatro subgrupos que comparten el mismo principio básico de enfoque descendente: los enfoques de arquitectura orientada a servicios, los enfoques de composición de servicios, los enfoques de transformación de datos basados en reglas y los sistemas basados en agentes.
Los enfoques de arquitectura orientada a servicios proporcionan una interfaz de servicio estándar con métodos definidos y codificaciones de datos para obtener la observación y las mediciones de los sensores deseados. Además, puede ofrecer funciones como la obtención de información sobre las características de los sensores, la capacidad de suscribirse a los valores de los datos de los sensores seleccionados, el envío de consultas, opcionalmente las funciones de actuación, etc. La interacción dominante en estas arquitecturas es el modelo de solicitud-respuesta y, en menor medida, la entrega de datos de los sensores basada en eventos. Una desventaja de este enfoque es que no tiene capacidad para fusionar datos de sensores basados en flujos junto con tipos de datos archivados o adquiridos. Aunque no hay restricciones explícitas en la implementación concreta, este enfoque tiende a estar orientado verticalmente y cubre sólo un dominio de aplicación.
Los enfoques orientados a la composición de servicios permiten a los usuarios la capacidad de definir servicios arbitrarios o flujos de datos con características específicas de interés. El sistema intentará componer dicho flujo de datos aplicando un procesamiento específico sobre las fuentes de datos apropiadas, lo que resultará en la producción de un flujo de datos que se ajuste a la especificación solicitada. La expresividad total de la solicitud del usuario podría lograrse permitiendo una descripción basada en un modelo semántico de los flujos de datos deseados y de las capacidades de procesamiento: el razonamiento basado en la semántica podría utilizarse al buscar una composición óptima de los componentes disponibles. Este enfoque parece ofrecer las soluciones más flexibles desde la perspectiva de las aplicaciones, aunque el rendimiento puede verse degradado debido al descubrimiento en tiempo real de la composición de servicios.
La transformación de datos basada en reglas parece ser el enfoque más común para utilizar los modelos de datos semánticos. La inferencia de nuevos conocimientos o la detección de eventos de alto nivel se logran mediante las funciones de mapeo que se basan en las relaciones entre los conceptos capturados en la representación ontológica del modelo de dominio y las observaciones y mediciones de los datos del sensor. Puede haber múltiples transformaciones a través de la arquitectura según las diferentes capas del modelo de información. Los datos se transforman de formatos de nivel inferior a representaciones basadas en la semántica que permiten la aplicación de algoritmos de búsqueda y razonamiento semánticos.
Los sistemas basados en agentes constan de varios tipos de agentes. Los agentes son componentes de software capaces de realizar tareas específicas. Colaboran para conseguir las funcionalidades deseadas. Para las comunicaciones internas de los agentes se puede utilizar alguna de las plataformas de agentes estándar o una implementación específica. Normalmente, los agentes pertenecen a una de varias capas según el tipo de funcionalidades de las que son responsables. También puede haber varios tipos de agentes en una capa lógica. Los agentes de las capas superiores emplean agentes de las capas inferiores. El hecho de que los agentes empleen la semántica de los datos de los sensores, o que se utilicen modelos semánticos para la descripción de las capacidades de procesamiento de los agentes, depende de la implementación concreta.
El árbol de clasificación, derivado de los criterios de clasificación mencionados, se presenta en la Fig. 1, y está compuesto por siete hojas. A cada hoja del árbol de clasificación se le asigna un nombre, como se ha descrito anteriormente. La lista de soluciones existentes (ejemplos) se ofrece según la clasificación aplicada para cada hoja (clase). Para que los lectores interesados puedan profundizar en los detalles, sólo hemos facilitado los nombres de los enfoques y las principales referencias en un párrafo aparte. En aras de la simplicidad, damos un nombre arbitrario a una solución que no tiene un nombre explícito dado por los autores. Utilizamos el nombre de la institución de la que proceden los autores o el nombre de la principal cuestión estratégica característica de esa solución.
Las soluciones centradas en la base de datos incluyen enfoques no semánticos como el sistema de base de datos Cougar , uno de los primeros trabajos de investigación hacia la integración de redes de sensores, y SenseWeb , que es un ejemplo de utilización máxima del enfoque descrito. La ES3N es un ejemplo de enfoque centrado en la base de datos basada en la semántica.
Todas las soluciones pertenecientes a los enfoques de traducción de consultas emplean tecnologías semánticas e incluyen: la red de sensores semánticos CSIRO , el enfoque basado en SPARQLSTREAM , y el SemSorGrid4Env , que es la solución más completa de este grupo.
Los esfuerzos de investigación más recientes en este campo pertenecen a los enfoques de virtualización de sensores. El enfoque no semántico se utiliza en el GSN , mientras que las soluciones propuestas en proyectos a gran escala financiados por la UE, como el SENSEI y el Internet de las Cosas (IoT), utilizan la semántica de los datos.
Las arquitecturas orientadas al servicio incluyen soluciones no semánticas simples y, sin embargo, eficientes, como TinyREST y las especificaciones OGC SWE de la arquitectura de referencia implementadas por varias partes . En el SemSOS se utiliza un enfoque basado en la semántica.
Los enfoques de composición de servicios tienden a ofrecer la interacción más flexible a los usuarios y Hourglass es un ejemplo de solución no basada en la semántica. Las soluciones más potentes utilizan enfoques semánticos e incluyen el SONGS y una arquitectura desarrollada en IBM .
Las arquitecturas más comunes que emplean tecnologías semánticas pertenecen a enfoques de transformación de datos basados en reglas e incluyen: un sistema de fusión de datos de sensores basado en la semántica desarrollado en la Universidad de Toronto , la arquitectura enchufable diseñada en la Universidad Técnica Nacional de Atenas , y el SWASN , una parte de la visión CommonSense de Ericsson .
Por último, los enfoques basados en agentes tienen representantes tanto no semánticos como semánticos: el primero es una infraestructura de sensores a escala de Internet llamada IrisNet , mientras que el segundo es el SWAP , un sistema multiagente para arquitecturas de Web de sensores.