five

Map of built-up expansion ("nedbygging") over Norway 2017-2022 version 2

收藏
Mendeley Data2024-06-29 更新2024-06-29 收录
下载链接:
https://zenodo.org/records/12566926
下载链接
链接失效反馈
官方服务:
资源简介:
Version 2 of the dataset https://zenodo.org/records/10566644 Changes from first version include: added crowdsourced verification labels to the dataset gathered from the interactive app (link below) explained here: https://www.nina.no/Om-NINA/Aktuelt/Nyheter/article/kartlegg-nedbygging-av-natur-selv added the year of change crowdsourced labels added the type of built-up expansion as labelled by the NRK team Data can be viewed interactively here: https://nina.earthengine.app/view/nedbygging (see Norwegian description below) 1. Dataset Information - Title: Map of built-up expansion over Norway 2017-2022 - Author(s): Zander Venter (NINA), Mads Nyborg Støstad (NRK), Ruben Solvang (NRK), Anne Linn Kumano-Ensby (NRK), Su Thet Mon (NRK) - Contact Information: zander.venter@nina.no - Date of Data Generation: 06.01.2024 - Version: 1 - Description: This is the dataset used in the NRK article published on 06.01.2024. The data contains polygons outlining potential “nedbygging” (hereafter translated to “built-up expansion” in English) events between 2017 and 2022 over Norway. The built-up expansion polygons were identified using a combination of Sentinel-2 satellite imagery, a fully convolutional neural network (a type of AI model) from Google called Dynamic World and NINA’s time series analysis thereof. The method to create the map will be published by NINA at a later date. The original map was created by NINA, but NRK performed some post-processing which included joining some polygons which were part of the same built-up expansion event (e.g. a long road). It is important to note that the map is a result of AI and has errors in it. Therefore, users are encouraged to read the sections on data quality and usage information below. Users can refer to Venter et al. (2024) for details on the scientific best practice which the NRK journalists followed to ensure that their reported area estimates in the article were not biased. In summary, the map is wrong 18% of the time. Users should expect to find that on average 1 in 5 square meter is incorrectly identified as built-up expansion. There are also many instances of built-up expansion which will be missed in the map such as forestry road development, building of small cabins etc. 2. File Details - Format: Shapefile (.shp, .shx, .dbf, .prj) - Size: 13.27 MB 3. Geospatial Information - Coordinate System: EPSG:32632, UTM zone 32N - Spatial Resolution: 10m - Geographical Coverage: Norway mainland (excludes Svalbard) - Temporal Coverage: 2017 to 2022 4. Data Content - Attributes Included: - *id*: unique identity number for each polygon - *undersøkt*: whether the polygon has been investigated manually using visual interpretation of orthophotos. “ja” = “yes” and “nei” = “no” - *undersøkt_source*: whether the data was collected by the NRK team or the crowdsourcing effort - *kategori_1*: the type of built-up expansion labelled by the NRK team - see Google Translate for translations - *year*: the year in which the built-up expansion occurred as defined by the crowdsourcing volunteers - *ai_feil*: whether the AI model method correctly (“riktig”) or incorrectly (“feil”) identified natural habitat conversion to built-up surface. Values where *undersøkt* == “nei” are labelled as “ikke_verifisert” 5. Data Quality - Accuracy: As described above, the false positive rate of the map was 18% based on 500 locations used for map validation and accuracy assessment. We did not quantify a false negative rate and balanced accuracy estimates because this would have required a denser sample for manual verification. Therefore, it is likely that there are many instances of built-up expansion that our map does not capture. After the formal accuracy assessment using the 500 stratified random points, NRK verified additional polygons (total of 3875) in the dataset during their investigative journalism workflow. Although these were not collected in a systematic manner, then can still be useful for some downstream tasks such as exploring what causes the AI model to misidentify built-up expansion. - Validation Methods: A design-based approach was used to quantify map accuracy and estimate uncertainty around the resulting area estimate reported in the NRK article. The details of this method are reported in Venter et al. (2024). This approach quantifies the error in the AI-derived map, and corrects for this using a stratified area estimator. Therefore, the total built-up expansion of 208 km<2> reported in the NRK article has been bias-corrected. We also quantified 95% confidence intervals around this are estimate of 9.8 km<2>. It is important to note that the validation approach was conducted on individual Sentinel-2 pixels of 10x10m and not at the polygon level. Therefore, we did not quantify the error in the precision of the polygon shape in terms of capturing the full extent of a given built-up expansion event. 6. Usage Information - Use Limitations: Considering the map error described above, users should proceed with caution when analysing the map to derive area statistics or overlays with other maps. As described in Venter et al. (2024), simply adding the areas of the polygons (or “pixel counting” with maps formatted as images) without accounting for the error in the map will lead to incorrect area statistics. We recommend that users validate the map for their municipality or study area before proceeding with analysis. It is likely that the margin of error is highly variable between municipalities. For example, although we have not quantified it, we noticed many AI mistakes in mountainous regions due to snow and ice interference and therefore high-altitude municipalities might have more errors than low-altitude ones. Norwegian description: 1. Datasettinformasjon - Tittel: Kart over nedbygging over Norge 2017-2022 - Forfatter(e): Zander Venter (NINA), Mads Nyborg Støstad (NRK), Ruben Solvang (NRK), Anne Linn Kumano-Ensby (NRK), Su Thet Mon (NRK) - Kontaktinformasjon: zander.venter@nina.no - Dato for datagenerering: 06.01.2024 - Versjon: 1 - Beskrivelse: Dette er datasettet som brukes i NRK-artikkelen publisert 06.01.2024. Dataene inneholder polygoner som skisserer potensiell nedbygging mellom 2017 og 2022 over Norge. Nedbyggingsområdene ble identifisert ved hjelp av en kombinasjon av Sentinel-2 satellittbilder, et fullstendig konvolusjonelt nevralt nettverk (en type KI-modell) fra Google kalt Dynamic World og NINAs tidsserie-analyse av dette. Metoden for å lage kartet vil bli publisert av NINA på et senere tidspunkt. Det originale kartet ble laget av NINA, men NRK utførte en del etterbehandling som inkluderte sammenføyning av noen polygoner som var en del av den samme oppbygde utvidelseshendelsen (f.eks. en lang vei). Det er viktig å merke seg at kartet er produsert ved hjelp av kunstig intelligens og inneholder feil. Derfor oppfordres brukere til å lese avsnittene om datakvalitet og bruksinformasjon nedenfor. Brukere kan referere til Venter et al. (2024) for detaljer om den vitenskapelige beste praksisen som NRK-journalistene fulgte for å sikre at deres rapporterte arealstatistikk i artikkelen er korrekt. Oppsummert er 18 % av arealet i kartet feil. Brukere bør forvente å finne at i gjennomsnitt 1 av 5 kvadratmeter er feilaktig identifisert som nedbygging. Det er også mange tilfeller av nedbygging som som ikke vil vises i kartet, som skogsveiutbygging, bygging av småhytter mm. 2. Fildetaljer - Format: Shapefil (.shp, .shx, .dbf, .prj) - Størrelse: 13,27 MB 3. Geospatial informasjon - Koordinatsystem: EPSG:32632, UTM-sone 32N - Rolig oppløsning: 10m - Geografisk dekning: Norges fastland (ekskluderer Svalbard) - Tidlig dekning: 2017 til 2022 4. Datainnhold - Attributter inkludert: - *id*: unikt identitetsnummer for hver polygon - *undersøkt*: om polygonet er undersøkt manuelt ved bruk av visuell tolkning av ortofoto. - *undersøkt_source*: om dataene er samlet inn av NRK-teamet eller crowdsourcing-innsatsen - *kategori_1*: typen nedbygging merket av NRK-teamet - *year*: året hvor nedbygging skjedde som definert av crowdsourcing - *ai_feil*: om AI-modellmetoden var “riktig” eller “feil”. Verdier der *undersøkt* == «nei» er merket som «ikke_verifisert» 5. Datakvalitet - Nøyaktighet: Som beskrevet ovenfor var andelen falske positive punkter i kartet 18 % basert på 500 steder (prøveflater) brukt for kartvalidering og nøyaktighetsvurdering. Vi kvantifiserte ikke andelen falske negative punkter og balanserte nøyaktighetsestimater, fordi dette ville ha krevd en tettere stikkprøvedensitet for manuell verifisering. Derfor er det sannsynlig at det er mange tilfeller av nedbygging som kartet vårt ikke fanger opp. Etter den formelle nøyaktighetsvurderingen ved bruk av 500 stratifiserte tilfeldige prøveflater, verifiserte NRK ytterligere polygoner (totalt 3875) i datasettet i løpet av deres journalistiske undersøkelser. Selv om disse ikke ble samlet inn på en systematisk måte, kan de fortsatt være nyttige for noen oppfølgingsanalyser som å utforske hva som får AI-modellen til å feilidentifisere nedbygging. - Valideringsmetoder: En designbasert tilnærming («design-based area estimation» på engelsk) ble brukt for å kvantifisere kartnøyaktighet og estimere usikkerhet rundt det resulterende arealestimatet rapportert i NRK-artikkelen. Detaljene ved denne metoden er forklart i Venter et al. (2024). Denne tilnærmingen kvantifiserer feilen i det KI-avledede kartet, og korrigerer for dette ved å bruke en stratifisert arealestimator. Derfor er den totale bebygde utvidelsen på 208 km<2> som er rapportert i NRK-artikkelen, skjevhetskorrigert. Vi kvantifiserte også 95 % konfidensintervaller rundt dette er estimat på 9,8 km<2>. Det er viktig å merke seg at valideringstilnærmingen ble utført på individuelle Sentinel-2 piksler på 10x10m og ikke på polygonnivå. Derfor kvantifiserte vi ikke feilen i presisjonen til polygonformen når det gjelder å fange opp hele omfanget av en gitt oppbygget ekspansjonshendelse. 6. Bruksinformasjon - Bruksbegrensninger: Med tanke på kartfeilen beskrevet ovenfor, bør brukere fortsette med forsiktighet når de analyserer kartet for å beregne områdestatistikk eller overlegg med andre kart. Som beskrevet i Venter et al. (2024), ved å legge til områdene til polygonene (eller «pikseltelling» med kart formatert som bilder) uten å ta hensyn for feilen i kartet vil føre til feil arealstatistikk. Vi anbefaler at brukere validerer kartet for sin kommune eller studieområde før de går videre med analyse. Det er sannsynlig at feilmarginen varierer mye mellom kommuner. For eksempel, selv om vi ikke har kvantifisert det, la vi merke til mange AI-feil i fjellområder på grunn av snø- og is, og derfor kan kommune med mye fjell ha flere feil enn de langs kysten (for eksempel).
创建时间:
2024-06-29
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作