1.5.2 地理数据
1.5.2.1 道路网络数据
道路网络数据可能是城市计算中最常使用的地理数据类型(例如,交通监控和预测、城市规划、路由和能源消耗分析)。它通常由一个图表示,该图由一组边(表示道路段)和一系列节点(表示道路交叉口)组成。每个节点都有唯一的标识和地理空间坐标,每条边由两个节点(有时称为端点)和一系列中间地理点组成(如果道路段不是直线)。其他属性,如长度、速度限制、道路级别(高速公路、大街或街道)、单向或双向以及车道数,都与边相关联。
1.5.2.2 POI数据
一个POI(如餐厅或购物中心)通常由名称、地址、类别和一组地理空间坐标来描述。一旦建立了POI,其属性很少随时间变化,尽管餐厅可能会偶尔更改名称或搬迁至新位置。由于城市中存在大量的POI,收集POI数据并不是一个容易的任务。通常,生成POI数据有两种方法。
一种方法是通过现有的黄页数据获取POI,并使用地理编码算法根据文本地址推导出POI的地理空间坐标。另一种方法是在现实世界中手动收集POI信息,例如,携带GPS日志记录器记录POI的地理空间坐标。主要数据提供商已经将大量精力投入了第二种方法。一些最近的以位置为基础的社交网络服务,如Foursquare,允许终端用户在系统中没有包含某个POI时,创建这个新的POI。
为了覆盖大量的POI,人们广泛使用的在线地图服务,如Bing和谷歌地图,通常采用这两种方法来收集POI数据。因此,出现了一些问题,比如如何验证POI的信息是否正确。有时,POI的地理空间坐标可能不准确,导致人们前往错误的地方。又如,如何合并不同来源或方法生成的POI。
1.5.2.3 土地利用数据
土地利用数据描述了一个区域的功能,如居住区、郊区和自然区域,这些最初由城市规划师规划,并在实际操作中通过卫星图像进行大致测量[23]。例如,美国地质调查局将美国的每个30m×30m的区域划分为21种地面覆盖类型,如草地、水域和商业区。在许多发展中国家,由于城市随时间变化,会建造许多新基础设施,拆除旧建筑,因此城市的现实情况可能与原始规划有所不同。大多数卫星图像无法区分细粒度的土地利用类别,如教育、商业和居住区,因此要获取一个大城市的当前土地利用数据,需要基于其他数据集进行一定程度的推断,如基于人类流动性和POI[51,54]。