建筑矢量数据
# 全球7.77亿建筑物轮廓数据
# 1.前言
微软必应地图(Bing Maps)于2022年5月17日向世界各地发布开放的全球建筑物轮廓数据(暂不包括中国)。该团队在2014年至2021年间从Bing Maps图像中(包括Maxar和Airbus影像)检测到了约7.77亿座建筑物,目前该套数据可在ODbL、GitHub等平台上免费下载和使用。
2022年5月发布的全球建筑物轮廓数据集是对该团队在2018年7月到2022年2月期间发布的其他版本的全面补充。
# 2.数据版本
2022年5月17日,微软必应地图团队发布包含涵了776712641个建筑物轮廓数据的全球建筑物轮廓数据集Global MLBuilding Footprints
在此之前微软必应地图团队于2018年7月首次发布了部分国家地区的建筑物轮廓数据。
2018年7月,微软必应地图团队首次面向全球发布US Building Footprints数据集——该套数据涵盖美国50个州124885597个计算机生成的建筑物轮廓。
2019年9月,发布了加拿大所有省份和地区的建筑足迹数据集,数据集包含11842186个建筑物轮廓。
2020年1月,发布了乌干达和坦桑尼亚全国范围的建筑物轮廓数据集,数据集包含乌干达6928078个建筑物轮廓,坦桑尼亚11014267个建筑物轮廓。
2020年2月,发布了澳大利亚全国范围的建筑物轮廓数据集,数据集包含11334866个建筑物轮廓。
2021年12月,发布了南美洲部分地区/国家的建筑物轮廓数据集,共计44495865个建筑物轮廓。其中包含阿根廷3427787个建筑物轮廓,玻利维亚1015151个建筑物轮廓,巴西18711536个建筑物轮廓,智利2208744个建筑物轮廓,哥伦比亚6083821个建筑物轮廓,厄瓜多尔3674190个建筑物轮廓,圭亚那3339个建筑物轮廓,巴拉圭990756个建筑物轮廓,秘鲁1710431个建筑物轮廓,乌拉圭2656个建筑物轮廓,委内瑞拉6572969个建筑物轮廓。
2022年1月,发布了尼日利亚和肯尼亚全国范围的50516194个建筑物轮廓数据集,数据集包含尼日利亚35767509个建筑物轮廓,肯尼亚14748685个建筑物轮廓。
2022年2月,发布了菲律宾、印度尼西亚和马来西亚全国范围的88653552个建筑物轮廓数据集,数据集包含印度尼西亚63947880个建筑物轮廓,菲律宾17421764个建筑物轮廓,马来西亚7283908个建筑物轮廓。
# 3.研究方法
微软在深度学习、计算机视觉和人工智能方面进行了大量投资,这些投资已经应用于地图绘制。在过去几年中,必应地图团队利用AI人工智能和计算机视觉的强大功能大规模识别地图要素,生成了高质量的建筑足迹。
依靠微软开发的开源CNTK统一工具包。将深度神经网络和ResNet34与RefineNet上采样图层结合使用,以检测必应影像中的建筑物覆盖区。
为了确保最佳输出,从预测中删除噪声和可疑数据,例如误报。然后,应用面化算法来检测建筑物边缘和角度,以创建适当的建筑物覆盖区。
建筑物提取分两个阶段完成:
(1)语义分割—使用深度神经网络(DNN)识别航空影像上的建筑像素。
(2)多边形化—将建筑像素检测转换为多边形。
# 4.数据评价
(1)评价指标
**precision:**准确率,表示预测结果中,预测为正样本的样本中,正确预测为正样本的概率;
recall:召回率,表示在原始样本的正样本中,最后被正确预测为正样本的概率;
**IoU:**全称为Intersection over Union(交并比),是衡量目标重叠检测中最常用的标准指标。计算的是“预测的”和“真实的”边框的交集和并集的比值。是衡量标签重叠质量的标准指标;
**Rotation error:**主导角旋转误差,用于测量多边形旋转偏差;
**Shape Distance:**形状距离,测量多边形轮廓相似度;
**False positive ratio:**假正率,表示所有负例中被错误地预测为正例的比例;FPR=FP/(FP+TN)。
(2)评价结果
# 5.数据信息
坐标参考:EPSG 4326(WGS-84)
时间尺度:提取的建筑物覆盖区的年份取决于基础影像的年份。基础图像来自必应地图,其中还包括2014-2021年间的Maxar和Airbus的影像数据。
空间尺度:全球**(暂不包括中国)**
数据大小:83.6GB(压缩后)
数据格式:GeoJSON
作者团队:MicrosoftOpenSource、Andwoi等
意见反馈:opencode@microsoft.com
**数据用途:**用于支持蓬勃发展的OpenStreetMap(OSM)系统建设。
# 6.数据覆盖
全球覆盖(2022.05.17补充地区)
美国地区—124885597个建筑物轮廓
南美地区(1)—44495865个建筑物轮廓
澳大利亚—11334866个建筑物轮廓
尼日利亚和肯尼亚—50516194个建筑物轮廓
乌干达和坦桑尼亚—6928078个建筑物轮廓
# 7.数据获取
Github分地区下载地址:
https://github.com/microsoft/GlobalMLBuildingFootprints
全球汇总数据(暂不包括中国)