Ferramentas de Utilizador

Ferramentas de Site


lod:pard:lod_energy

Universidade do Minho

Escola de Engenharia

Mestrado Integrado em Engenharia e Gestão de Sistemas de Informação

Ano Lectivo 2015/2016

             Equipa de Trabalho:
        Diana Postolaki N.º70142
        Henrique Santos Guimarães N.º53824
        Ivo Filipe Marques Menezes N.º59838
        Sara Catarina Santos Silva N.º69185

Projecto LOD Energy

1. Introdução

Este projecto insere-se no âmbito do projecto SusCity que tem como objectivo desenvolver e testar a integração de dados em ferramentas e serviços que promovam a eficiência na gestão e na utilização de recursos em áreas urbanas. Para tal, os dados que se irão utilizar para desenvolver este projecto estarão no formato de Linked Open Data (LOD). Os objectivos são:

  • Produzir uma síntese das principais normas internacionais e europeias para os sectores do projecto (energia e construção) e relacionadas com Linked Open Data;
  • Pesquisa de datasets relacionados com os sectores da energia e da construção para as cidades de Paris, Amesterdão e Londres;
  • Análise dos elementos de metadados, esquemas de codificação e unidades de medida utilizados nos datasets e nos catálogos encontrados;
  • Apresentação dos resultados obtidos em cada um dos pontos anteriores.

De modo a responder aos objectivos propostos, a equipa efectuou um estudo sobre Linked Open Data. O LOD é um conjunto de práticas introduzidas inicialmente por Tim Berners-Lee que se deve seguir para publicar e conectar dados estruturais na web. Pretende-se com isto criar a Web of Data que é um espaço na web onde se encontram biliões de dados e onde esses dados estão todos interligados entre si e se encontram abertos a toda a comunidade. (Tim Berners-Lee, 2009).

A fase inicial do projecto consistiu na pesquisa de normas ou standards internacionais e europeus relacionados com LOD e LOD nos sectores de actuação do projecto (Construção e Energia). Como essa informação se encontra dispersa pela Internet o objectivo desta pesquisa consistiu na agregação dessa informação num documento.

De seguida o grupo pesquisou datasets em LOD novamente para os sectores de actuação do projecto e relativos as cidades de Paris, Londres e Amesterdão.

Por fim, realizou-se um mapeamento dos dados do projecto SusCity com os atributos disponíveis no Linked Open Vocabularies.

Com este projecto pretende-se contribuir para a definição dos elementos de metadados, esquemas de codificação e unidades de medida a utilizar nos catálogos de dados e nos datasets do projecto SusCity recorrendo para isso, ao LOD e as normas internacionais e europeias definidas para os atributos presentes nos datasets.

2. Metodologia

Na fase inicial do projecto foi-nos proposto a pesquisa sobre o conceito de Linked Open Data de modo a que o grupo se familiarizar-se com este. Para tal, foram consultados sites nomeadamente o 5 Star Open Data que deu início a este processo.

Depois de adquiridos os conhecimentos básicos sobre este conceito foi-nos proposto pelo proponente a consulta de normas existentes sobre esta área. Estas normas consistem em recomendações reunidas por especialistas, vocabulários, sintaxes a utilizar, ontologias e glossários existente.

1.ª Fase

Numa fase inicial foram reunidas normas que se relacionavam com o conceito de Linked Open Data. Para esta pesquisa foram consultados os seguintes sites:

SiteN.º de Normas encontradas Data Pesquisa
W3C 12 03/2016
DublinCore 2 03/2016
European Data Portal 103/2016
DERI Vocabularies 1 03/2016
Lexvo 1 03/2016
European Commission 1 03/2016
Energy.Gov 1 03/2016
Open Government Guide 1 03/2016
EUR-Lex 1 03/2016

De seguida, o grupo filtrou a pesquisa das normas de acordo com os sectores de actuação do projecto, construção e energia dando maior relevância à eficiência energética dos edifícios e para tal, pesquisou-se nos seguintes sites:

SiteN.º de Normas encontradas Data Pesquisa
DATA.GOV.UK103/2016
OpenEI103/2016
reegle103/2016
STEP Tools, Inc.103/2016
smartcity.linkeddata.es103/2016

Toda a informação resultante das pesquisas foi registada numa folha de Excel onde pode ser consultada no seguinte Link.

2.ª Fase

Depois de conhecidas as normas o grupo efectuou uma nova pesquisa que consistiu na procura de datasets relativos aos sectores da construção e energia nas cidades de Paris, Londres e Amesterdão. Nesta fase o objectivo consistiu em reunir todo o tipo de dados existentes sobre o assunto. Posteriormente a equipa refinou a pesquisa de modo a que esta se enquadrasse no âmbito do projecto que é Linked Open Data. Ou seja, o objectivo consistiu em encontrar datasets que seguiam os padrões propostos por Tim Berners-Lee no site5 Star Open Data . Para encontrar esses dados, efectuou-se novamente uma pesquisa nos seguintes sites:

França

SiteLocal N.º Datasets encontrados Data Pesquisa
Open Data ParisParis203/2016
Public DataFrança103/2016
datahubFrança104/2016

Holanda

SiteLocal N.º Datasets encontrados Data Pesquisa
Dutch Government Data PortalHolanda103/2016
ENEXISHolanda103/2016
data.amsterdam.nlAmesterdão103/2016
LianderAmesterdão103/2016

Reino Unido

SiteLocal N.º Datasets encontrados Data Pesquisa
GOV.UKReino Unido403/2016
London DataStoreReino Unido603/2016
data.gov.ukReino Unido303/2016
datahubReino Unido104/2016

Toda a informação resultante das pesquisas foi registada numa folha de Excel onde pode ser consultada no seguinte Link.

3.ª Fase

Finalmente, a ultima etapa do projecto consistiu na realização de um mapeamento entre os atributos presentes nos datasets do projeto SusCity e os vocabulários existente no site Linked Open Vocabularies.

3. Resultados

3.1. Normas

Para a realização desta etapa, o grupo criou uma tabela na qual se registou os resultados obtidos da pesquisa efectuada. Esta tabela é constituída por vários atributos relevantes tais como: Nome da norma, tipo, um pequeno resumo, a data e o site da pesquisa. Deve-se notar que esta tabela esta dividida em três secções sendo elas normas genéricas para Linked Open Data, normas para publicação ou utilização de dados em Open Data e normas sobre energia ou construção.

A tabela relativa as NORMAS pode ser consultada no seguinte Link.

Da tabela retirou-se as seguintes informações:

Na seguinte imagem é possível observar-se os sites de onde se retiraram as normas:

No seguinte gráfico é possível observar-se o tipo de normas encontradas:

3.2. Datasets

Novamente, para esta etapa voltou-se a criar uma tabela para registar os resultados da pesquisa efectuada. Sendo que esta tabela esta subdivida em quatro categorias sendo elas as cidades de actuação do projecto (Paris, Londres e Amesterdão) e outros datasets que o grupo achou relevante que, não se enquadram nestas cidades, mas tinham relevância devido à natureza dos dados apesar de não se ajustar aos requisitos de localização impostos.

Como é possível observar pela tabela encontram-se linhas a verde. Estas linhas referenciam os datasets que se enquadram no sector de eficiência energética em edifícios, porém, alguns acabam por falhar na localização. Todas as restantes linhas falham em algum dos critérios impostos antes da inicialização do projecto com por exemplo na localização, tipo de ficheiro, tema etc. À data das pesquisas, como se pode observar pela tabela, não foi encontrado qualquer tipo de dataset no formato considerado por Tim Berners-Lee como sendo de quatro ou cinco estrelas.

A tabela relativa as DATASETS pode ser consultada no seguinte Link.

Da tabela é possível retirar as seguintes informações:

3.3. Mapeamento

Nesta etapa foi-nos fornecido pela proponente alguns datasets dos parceiros do projecto SusCity. E com estes, a equipa desenvolveu um ficheiro Excel onde cada pagina deste ficheiro se referencia a um dataset tendo-se também registado noutra tabela os termos de pesquisa utilizados para encontrar vocabulário no Linked Open Vocabularies que correspondesse aos atributos presentes nos datasets.

Na tabela, podemos encontrar linhas a verde, vermelho ou azul. As linhas a verde são aquelas que se encaixam na perfeição com o atributo pretendido. A vermelho temos as linhas em que o vocabulário encontrado enquadra-se de certa forma, mas não totalmente. Finalmente a azul temos as linhas que necessitam de uma revisão posterior.

A tabela relativa ao Mapeamento pode ser consultada no seguinte Link.

Através da tabela é possível concluir-se que:

4. Análise dos Resultados

4.1. Normas

Como já foi referenciado na secção anterior, foi elaborada uma tabela onde se anotou todos os resultados encontrados derivados da pesquisa das normas de Linked Open Data. Deve-se notar que os resultados encontrados pelo grupo o que não implica a existência de outros.

Através de uma analise da tabela é possível observar-se, que relativamente as normas genéricas de Linked Open Data foram encontradas várias recomendações que falam superficialmente de todo o processo de publicação e utilização de dados em LOD. Deve-se notar também que estas normas derivam de sites reconhecidos e aceites por especialistas desta área como o W3C e o DublinCore.

Para facilitar o processo de publicação ou utilização de LOD a W3C criou um vocabulário com todos os termos utilizados em Linked Data denominado de Linked Data Glossary e que pode ser consultado na tabela.

De seguida, aprofundou-se um pouco a pesquisa e encontrou-se normas relativas ao vocabulário, sintaxe, ontologias e glossários a utilizar em LOD. A sintaxe utilizada neste tipo de dados deriva do modelo RDF (Resource Description Framework) que tem como objectivo representar informação na Web. Este modelo codifica os dados em forma de triplas de sujeito, predicado e objecto. Tendo-se o sujeito e o objecto como URIs que identificam o recurso em causa e o predicado que pretende demonstrar como estes se relacionam e que também é um URI. Relativamente a este modelo encontraram-se normas, á data da pesquisa, que pretendem dar ao utilizador um conhecimento básico, de modo a que este possa utilizar eficazmente o RDF como é o caso da “RDF 1.1 Primer” que pode ser consultado na tabela. Também podem ser encontradas normas derivadas deste modelo como é o caso do RDF/XML e que também pode ser consultada na tabela.

Para realizar consultas em bases de dados que armazenam os dados em formato RDF encontrou-se a linguagem SPARQL que significa “SPARQL Protocol and RDF Query Language” e na tabela pode ser encontrada uma recomendação do W3C para a utilização desta linguagem.

Relativamente ao vocabulário a utilizar, o grupo encontrou com facilidade, o vocabulário Data Catalog Vocabulary que utiliza o modelo RDF para facilitar a interoperabilidade entre diferentes catálogos de dados provenientes da Web. Este vocabulário provém do site W3C . Além deste vocabulário o grupo encontrou outro que utiliza para dados provenientes de cubos multidimensionais e que mais uma vez utiliza o modelo RDF e provém do site W3C . Relativamente às ontologias o grupo encontrou uma proveniente do W3C e que se refere á estrutura de uma organização.

De seguida, e por forma a reajustar a pesquisa ao âmbito do projecto o grupo pesquisou normas sobre os sectores da energia e construção. Deve-se notar que as normas encontradas não se referenciam a normas de Linked Data uma vez que os sectores da energia e construção ainda se encontram subdesenvolvidos neste tema. Pode-se encontrar normas relativamente aos standards de energia de edifícios como é o caso das “Building Energy Standards” ou normas mais genéricas relativas ao sector da energia como é o caso das “Energy Goals and Standards” E “Publication of display energy certificate and Non-domestic energy performance certificate data”. Encontrou-se também uma ontologia e um glossário de Linked Data relativas aos sectores da energia e da construção que também podem ser consultados na tabela.

Finalmente, devido à sensibilidade dos dados o grupo pesquisou normas, neste caso legislativas, relativamente a publicação ou utilização de dados. Os resultados desta pesquisa podem ser consultados na tabela.

A tabela relativa as NORMAS pode ser consultada no seguinte Link.

4.2. Datasets

Mais uma vez, e tal como foi referenciado na secção anterior, voltou-se a efectuar uma pesquisa com o objectivo de se encontrarem dados em LOD nos sectores da energia e construção e relativos as cidades de Paris, Londres e Amesterdão. Elaborou-se uma tabela de modo a registar os resultados desta pesquisa.

O primeiro obstáculo que o grupo encontrou ao elaborar esta pesquisa foi o facto de se encontrarem relativamente poucos dados com o tema pretendido e com a localização requisitada. E, quando se encontrava alguma coisa com o tema e a localização pretendida verificava-se que o formato não estava em LOD. Como se pode retirar da tabela o formato de dados mais utilizado pelas instituições para publicar os dados na Web é o XLS.

De seguida, e como a pesquisa em sites organizacionais não resultou nos resultados esperados o grupo decidiu consultar a LOD Cloud que é um diagrama onde se pode verificar as ligações entre diferentes datasets em LOD. E, relativamente ao tema da pesquisa apenas se encontrou um DataSet denominado de “GovUk Transparency Impact Indicators Energy Efficiency new Builds” que mais uma vez não correspondia aquilo que procurávamos uma vez que estes dados são relativos ao Reino Unido e não à cidade de Londres.

A tabela relativa aos DATASETS pode ser consultada no seguinte Link .

4.3. Mapeamento dos Atributos

Como foi referenciado nas secções anteriores, a última parte do trabalho consistia em fazer um mapeamento entre os atributos dos dados do Projeto SusCity com as propriedades disponíveis no Linked Open Vocabularies. Como os DataSets estavam divididos em WP1, WP3 e WP4, para a análise dos resultados decidiu-se manter essa separação.

4.3.1. WP1

Como este dataset estava dividido em vários processos o grupo decidiu manter essa divisão para a análise dos resultados.

4.3.1.1. GIS database (Input of UBEM - Input of UMS)

Para este processo apenas foram encontradas três propriedades que correspondiam aos atributos do projecto. Os atributos que obtiveram correspondência com propriedades disponíveis no Linked Open Vocabularies foram:

  • Building ID;
  • Height Roof;
  • Period of Construction: Para este atributo em particular é aconselhável que se divida em duas propriedades sendo elas: buildingStartDate e buildingEndDate;

Foram encontradas oito propriedades que se relacionavam de alguma forma, mas não totalmente com o atributo pretendido. De seguida, apresentam-se os seguintes atributos:

  • Height Ground: A propriedade encontrada no Linked Open Vocabularies é referente apenas ao andar de cima de um edifício, enquanto que o atributo refere-se a todos os pisos de um edifício;
  • Building Footprint Area: A propriedade encontrada no Linked Open Vocabularies refere-se apenas à área e não especificamente à área de um edifico;
  • BT_Archetype_WWR: O mesmo acontece com este atributo que apenas se refere a uma proporção não especificando a proporção entre a janela e a parede como é o caso do atributo;
  • Building Surface Area: Este atributo é um atributo calculável e obtém-se com a multiplicação do comprimento com a largura da superfície do edifício;
  • Line Lenght: O atributo refere-se ao comprimento de uma parede enquanto que a propriedade do Linked Open Vocabularies se refere ao comprimento de uma linha;
  • Party Wall Surface Area: Novamente este é um atributo calculável;
  • Exposed Wall Area: O atributo refere-se à área exposta de uma parede enquanto que a propriedade do Linked Open Vocabularies apenas se refere à área;
  • Building Population: O atributo refere-se à população de um edifico enquanto que a propriedade do Linked Open Vocabularies se refere apenas à população não especificada.

Para os seguintes atributos presentes neste processo não foram encontradas quaisquer correspondências.

A tabela onde se registou os resultados deste mapeamento pode ser consultada AQUI Os termos de pesquisa utilizados para encontrar as propriedades referentes a cada atributo podem ser consultados AQUI

4.3.1.2. Archetypes - Building Templates (Input of UBEM)

Este processo apenas conta com um atributo, Archetype Building Template e para este atributo não foram encontradas nenhumas propriedades que se adequa-sem.

A tabela onde se registou os resultados deste mapeamento pode ser consultada AQUI.

Os termos de pesquisa utilizados para encontrar as propriedades referentes a cada atributo podem ser consultados AQUI.

4.3.1.3. UBEM - Urban Building Energy Modeling

Este processo conta com sete atributos para os quais não foram encontradas quaisquer propriedades que se apropriassem.

A tabela onde se registou os resultados deste mapeamento pode ser consultada AQUI.

Os termos de pesquisa utilizados para encontrar as propriedades referentes a cada atributo podem ser consultados AQUI.

4.3.1.4. U-MIRA - Urban Metabolism Resources Analysis

Para este processo apenas foi encontrada uma propriedade que corresponde ao atributo do projecto . Este atributo foi:

  • Share impact of measures (%);

Foram encontradas 17 propriedades que se relacionavam de alguma forma, mas não totalmente com o atributo pretendido. De seguida, apresentam-se os seguintes atributos:

Todas as propriedades encontradas para os seguintes atributos são referentes apenas a consumo de energia de frigoríficos e congeladores:

  • Total baseline energy consumption/Building;
  • Energy consumption/Building(heating);
  • Energy consumption/Building(cooling);
  • Energy consumption/Building(lighting);
  • Energy consumption/Building(domestic hot water);
  • Energy consumption/Building(laundry + dishwashing);
  • Energy consumption/Building(food storage and preparation);
  • Energy consumption/Building(other);
  • Total impact of measures;

Todas as propriedades encontradas para os seguintes atributos são referentes apenas às emissões de CO2 “geral” por automóveis:

  • Carbon Emissions/Building - Energy;
  • Carbon Emissions/Building - Water;
  • Carbon Emissions/Building - Food;
  • Carbon Emissions/Building - Goods + Services;
  • Carbon Emissions/Building - Construction Materials;
  • Carbon Emissions/Building - Solid Waste;
  • Carbon Emissions/Building - Wastewater;
  • Total impact of measures;

Para os seguintes atributos não foram encontrados quaisquer correspondência.

A tabela de mapeamento pode ser consultada com mais detalhe AQUI.

Os termos de pesquisa utilizados para encontrar as propriedades referentes a cada atributo podem ser consultados AQUI.

4.3.2. WP3

Novamente, à semelhança do que aconteçeu com o WP1, o WP3 encontra-se dividido em cinco processos. Por uma questão de ilustração decidiu-se manter essa separação na análise dos resultados:

4.3.2.1. Energy monitoring

Relativamente a este processo não foram encontradas quaisquer propriedades que se adequassem na totalidade com os atributos em causa.

Porém, foram encontradas quatro propriedades que se certa forma se relacionavam com os atributos. Esses atributos foram:

  • Indoor temperature: a propriedade encontrada no Linked Open Vocabularies é referente à temperatura em geral e não à temperatura interior;
  • Exterior temperature: a propriedade encontrada no Linked Open Vocabularies é referente à temperatura em geral e não à temperatura exterior;
  • Wind speed: A propriedade encontrada em vez de ser referente à velocidade do vento é referente à velocidade de um veiculo;
  • Wind direction: à semelhança dos casos anteriores, a propriedade encontrada é referente à direcção de uma estrada e não do vento como se pretendia.

Para os restantes atributos não foram encontradas quaisquer correspondência.

A tabela pode ser consultada em mais detalhe AQUI.

Os termos de pesquisa utilizados para encontrar as propriedades no Linked Open Vocabularies podem ser consultados AQUI.

4.3.2.2. Residential buildings energy model simulation by LNEG and IST

Para este processo foram encontradas quatro propriedades no Linked Open Vocabularies que correspondiam com os atributos em causa, sendo estes:

  • total building electric consumption;
  • lighting consumption profile;
  • equipment consumption profile;
  • total building electric consumption profile.

Foram encontradas três propriedades que se certa forma se relacionavam com os atributos. Esses atributos foram:

  • zone mean air temperature;
  • zone mean air temperature;
  • total cooling loads.

Para os restantes atributos não foram encontradas quaisquer correspondência.

A tabela pode ser consultada em mais detalhe AQUI.

Os termos de pesquisa utilizados para encontrar as propriedades no Linked Open Vocabularies podem ser consultados AQUI.

4.3.2.3. Residential architypes energy model simulation by LNEG, IST and FCUL

Relativamente a este processo não foram encontradas quaisquer propriedades que se adequassem na totalidade com os atributos em causa.

Porém, foi encontrada uma propriedade que se certa forma se relacionavam com um atributo, sendo ele:

  • architypes: total cooling loads. A propriedade encontrada refere-se a um automóvel.

Para os restantes atributos não foram encontradas propriedades.

A tabela pode ser consultada em mais detalhe AQUI.

Os termos de pesquisa utilizados para encontrar as propriedades no Linked Open Vocabularies podem ser consultados AQUI.

4.3.2.4. Office buildings energy model simulation

Para este processo não foram encontradas propriedades iguais nem que se assemelhassem aos atributos em questão.

A tabela pode ser consultada em mais detalhe AQUI.

Os termos de pesquisa utilizados para encontrar as propriedades no Linked Open Vocabularies podem ser consultados AQUI.

4.3.2.5. Energy Efficiency Techniques

Para este processo não foram encontradas correspondencias com os atributos apresentados. Porém, para um atributo, Indoor Temperature for optimized architypes foi encontrada uma propriedade parecida mas que apenas se refere à temperatura no geral.

A tabela pode ser consultada em mais detalhe AQUI.

Os termos de pesquisa utilizados para encontrar as propriedades no Linked Open Vocabularies podem ser consultados AQUI.

4.3.3. WP4

4.3.3.1. Data from vehicle monitoring

Relativamente a este processo, foram encontradas duas propriedades que correspondiam aos atributos em questão, sendo estes:

  • LATITUDE;
  • LONGITUDE.

Foram encontradas também duas propriedades que se assemelhavam aos atributos em causa. Esses atributos são:

  • Extreme accelerations;
  • Excessive Speed.

Para todos os restantes atributos não foram encontradas correspondências.

A tabela do mapeamento pode ser consultada AQUI

Os termos de pesquisa utilizados podem ser consultados AQUI

4.3.3.2. Use-case testing

Este processo conta apenas com três atributo para os quais não foram encontradas correspondências.

A tabela do mapeamento pode ser consultada AQUI

Os termos de pesquisa utilizados podem ser consultados AQUI

4.3.3.3. Study of optimal planning of charging infrastructures for Electric Vehicles

Para os dois atributos presentes neste processo não foram encontradas correspondências.

A tabela do mapeamento pode ser consultada AQUI

Os termos de pesquisa utilizados podem ser consultados AQUI

5. Conclusão

Depois do desenvolvimento deste projecto podemos concluir que se contribui com sucesso para a definição dos elementos de metadados, esquemas de codificação e unidades de medida a utilizar nos catálogos de dados e nos datasets do projecto SusCity. De acordo com os objectivos estabelecidos no inicio do projecto e que podem ser encontrados na introdução, o grupo conclui que a criação de uma síntese das principais normas internacionais e europeias foi efectuada com sucesso e sem grandes problemas encontrados pelo caminho. Conclui-se que os principais fornecedores destas normas foram o W3C e o DublinCore. Porém, para o tema relacionado com eficiência energética dos edifício, não foram encontradas normas significativas e isto deve-se ao facto de o LOD ser algo relativamente recente e a este tema ainda se encontrar subdesenvolvido neste sentido. Relativamente à pesquisa de datasets no formato de LOD e para as cidades de Paris, Londres e Amesterdão conclui-se que à data da pesquisa, que se deu maioritariamente no mês de Abril de 2016, não foram encontrados os resultados que se pretendiam, tendo-se encontrado maior parte dos datasets no formato CSV que se encontra no nível 3 do 5 Star Open Data, E, isto acontece por causa do tema, eficiência energética em edificos e à restrição das cidades que nos foram impostas. Finalmente, em relação ao mapeamento efectuado conclui-se que para apenas uma pequena parte dos atributos foram encontradas correspondências e o grupo considera que mais uma vez, isso deve-se ao subdesenvolvimento do tema nesta área. Concluindo, o grupo considera que o trabalho foi efectuado com sucesso apesar de não existirem grandes resultados para o tema pretendido nesta área. Apesar disso, o grupo acredita que no futuro este tema vai-se desenvolver.

lod/pard/lod_energy.txt · Esta página foi modificada pela última vez em: 2016/06/06 15:57 por ssilva

Ferramentas de Página