1.5 城市数据
1.5.1 城市数据的分类
1.5.1.1 基于数据结构和时空属性
如图1.14所示,这些数据集的形式可以根据它们的结构和时空属性分为六类。在数据结构方面,有基于点的和基于网络的数据集,分别显示在上方和下方。对于时空属性,有时空静态数据、空间静态时间动态数据,以及时空动态数据,分别由三列表示。

图1.14 城市大数据的六种数据形式
例如,图1.14所示的第一列中以基于点的数据结构表示的POI数据具有静态的地理位置和固定的属性,如名称、地址和类别,这些属性不随时间改变。
城市中的道路以网络结构表示,也具有静态的时空属性,如位置、名称、车道数和速度限制。如图1.14中间列的下方所示,当与随时间变化的交通相关联时,道路交通数据变为基于网络的空间静态时间动态数据。
如图1.14中间列的上方所示,大多数地理感知数据(如气象数据和空气质量)具有静态的点位置,固定传感器就部署在这些位置,但会持续产生动态的读数。
如图1.14最后一列的下方所示,数据的最复杂形式是轨迹数据,它通常表示移动对象(如车辆或人)的运动。轨迹数据既包含空间信息(如移动对象的地理位置),也包含随时间变化的时空属性(如速度和行驶方向)。
时空人群感知数据可以被视为一种基于点的时空动态数据集。最后一列上方和下方之间的区别在于,前者的连续点之间的顺序属性比后者要弱得多。例如,人们可能在某个地点发布一个带有地理标签的推文,几天后又在另一个地点发布其他推文。两个地点之间的联系变得非常弱,因为人们在这两个地点之间可能已经访问了许多其他地方。
1.5.1.2 基于数据来源
城市数据还可以根据其来源进行分类,例如分为地理数据、交通数据、通勤数据、环境监测数据、社交网络数据、经济数据、能源消耗数据和健康保健数据。每个来源可能进一步由几个子类别组成。例如,通勤数据包括人们在公交车、地铁和共享单车系统中的购票数据。
此外,当从不同的角度和以不同的方式使用同一来源的数据时,可以形成不同的数据结构。例如,从共享单车站点的角度来看,单个站点内人们的单车租赁数据是一个基于点的空间静态时间动态数据集。然而,通过汇总来自多个站点的大量单车租赁数据,我们可以构建一个单车站点之间的网络,因为人们从一个站点借出单车并在另一个站点归还。此外,不同站点之间的自行车流量随时间变化。因此,来自许多站点的大量共享单车数据可以被视为一个基于网络的时空动态数据集。如果配备GPS传感器,单车的移动将形成一条轨迹,这属于时空动态网络数据。
鉴于这两个因素,同一来源的数据可能属于基于数据结构和时空属性的分类法中的多个类别,如表1.3所示。
表1.3 映射到分类法中不同类别的数据源

以下小节将根据来源介绍每种类型的城市数据,并讨论在城市计算中的潜在应用以及可能面临的挑战。