search
尋找貓咪~QQ 地點 桃園市桃園區 Taoyuan , Taoyuan

專輯論文| 俞童:剖分網格下顧及用戶興趣的矢量地圖多尺度表達方法

《測繪學報》

構建與學術的橋樑 拉近與權威的距離

1

112

1. 信息工程大學地理空間信息學院, 河南 鄭州 450000;

2. 61243部隊, 甘肅 蘭州 730020

收稿日期:2016-08-20; 修回日期:2016-10-20

基金項目:國家自然科學基金(41571442)

第一作者簡介:俞童 (1992—),女, 碩士生, 主要研究方向為空間數據融合與表達。

E-mail: [email protected]

摘要:在海量空間數據的組織與表達方面,與傳統的空間數據模型與方法相比,地球剖分網格表現出了極大的優勢。鑒此,本文提出了一種剖分網格下顧及用戶興趣的矢量地圖多尺度表達方法,首先利用大量POI數據構建空間興趣場模型,描述用戶對地理信息的興趣的空間分佈;然後對空間要素進行分類分級,確定其表達的尺度範圍;運用GeoSOT剖分理論劃分不同層次的剖分面片,建立剖分面片與尺度的對應關係,根據用戶對剖分面片所在區域的興趣度大小,表達不同詳細程度的空間要素,實現基於用戶興趣的空間數據多尺度表達。實驗表明,該方法能夠滿足用戶由概略到詳細、由重要到次要的空間認知需求,同時能夠獲得較好的多尺度表達效果。

關鍵詞:空間興趣場 地球剖分網格 GeoSOT 多尺度表達 用戶興趣

A Method of Vector Map Multi-scale Representation Considering User Interest on Subdivision Gird

, DENG Shujun112

Abstract: Compared with the traditional spatial data model and method, global subdivision grid show a great advantage in the organization and expression of massive spatial data. In view of this, a method of vector map multi-scale representation considering user interest on subdivision gird is proposed. First, the spatial interest field is built using a large number POI data to describe the spatial distribution of the user interest in geographic information. Second, spatial factor is classified and graded, and its representation scale range can be determined. Finally, different levels of subdivision surfaces are divided based on GeoSOT subdivision theory, and the corresponding relation of subdivision level and scale is established. According to the user interest of subdivision surfaces, the spatial feature can be expressed in different degree of detail. It can realize multi-scale representation of spatial data based on user interest. The experimental results show that this method can not only satisfy general-to-detail and important-to-secondary space cognitive demands of users, but also achieve better multi-scale representation effect.

Key words: spatial interest field global subdivision gird GeoSOT multi-scale representation user interest

大數據時代下,人們獲取地理空間信息的方式越加豐富與快捷,空間數據急劇增長,人們對空間認知的需求逐漸增多,傳統的空間數據組織與表達方法具有一定的局限性,如:傳統的方法僅適用於局部範圍,缺乏一種全球範圍內統一的空間數據組織與表達,各個區域之間所採用的坐標系不統一、不能相互兼容、可拼接性差等問題;傳統的方法已遠遠不能滿足信息大眾化時代下人們對空間信息服務提出的需求,其空間數據組織與表達模式的滯后,導致「數據豐富,信息、知識貧乏」的現象[1-2]。因此,如何充分利用多源、海量、多尺度的空間數據進行智能化表達、顯示和傳輸並提供靈活高效的網路化地理信息服務是當前亟待思考和解決的問題。

地球剖分網格系統是將地球表面劃分為一系列形狀相似、大小規則、相互嵌套的多層次面片集合,通過對剖分面片進行有序編碼,為空間信息的標識、存儲和索引、計算、表達及服務等提供基礎,具有海量空間數據的無縫拼接、多尺度全球覆蓋表達、層次關聯以及組織與表達統一的特點[3-5]。地球剖分網格系統建立了穩定的球面區域劃分規範與區域位置標識體系,對地理位置進行標識與組織,實現了對地理空間的有效模擬,避免了傳統空間數據模型平面尺度的局限性,為空間大數據的多尺度表達與應用提供一種新的思路與方法。

本文提出一種剖分網格下顧及用戶興趣的矢量地圖多尺度表達方法,其核心思路是:利用網路挖掘出的POI數據建立空間興趣場模型,得到整個研究區域的用戶興趣度分佈;對空間數據進行預處理,劃分用戶興趣等級,並依據用戶興趣度大小對空間數據進行按次序分級組織;利用GeoSOT剖分理論將地理空間剖分為不同層次的面片,建立尺度與面片對應關係,在不同尺度下,依據各個面片用戶興趣度不同,表達出詳細程度不同的空間要素,實現依據用戶興趣度的空間要素的多尺度表達。

1 空間興趣場模型1.1 空間興趣場概念

地理位置描述了地理空間中地理實體的空間和時間關係,地理位置具有唯一性、確定性、地理性和空間性的特性[6]。地理位置能夠反映地理實體之間一種多維的空間關係,是在不同尺度上佔據著特定空間,具有不同的相對地位和地理特點,對其政治、經濟、文化有著深遠的影響。因此,對地理位置的研究在地理學研究領域有著重大意義和應用價值。

近年來,新興技術層出不窮,人們可獲取的信息量呈爆炸式增長,其中80%的信息與空間位置有關[7],位置數據是大數據中重要的組成部分,描述了地理實體的屬性特徵、時空分佈和時間特徵,是地理空間的基本要素,反映了人們對地理空間的認知水平和逼近程度,是提供地理信息服務的重要支撐,為空間環境認知、智慧城市建設、用戶社會個性化信息服務以及城市地理國情關聯分析等提供基礎數據及關鍵性的解決技術方法。

大眾用戶對地理實體的興趣表現為對其關注度較高,經常查詢訪問感興趣的地理位置,或利用與其相關的空間媒體數據如地理標籤、文字、圖片等對該地理位置進行描述。這些地理實體連續分佈在地球表面,因此,用戶的興趣也是連續分佈於整個地理空間中。本文提出一種空間興趣場的概念,描述用戶對地理實體的興趣度空間分佈特徵。

空間興趣場是基於位置數據及用戶興趣信息共同構成的覆蓋整個地理空間的一種場模型。將地理空間中各個地理實體抽象為節點,興趣場信號的強弱描述用戶對各個節點的地理實體的感興趣度。該模型是將用戶興趣在地理空間中進行定位,進行空間化表示,利用位置信息描述地理空間中各個實體之間的相互關係,能夠客觀反映出用戶在地理空間中的興趣特徵、空間分佈及興趣變化趨勢規律。

1.2 基於POI的空間興趣場構建

[

8

],也是地理空間信息中的一個重要組成部分, 常常大量存儲在數字地圖中,並廣泛應用於地理信息服務。

POI是地圖服務中一種重要的矢量化表達形式,與面向大眾的基於位置服務密切相關,描述了人們日常生活中最常見地理實體的空間信息和屬性信息,如實體的名稱、類別、地理坐標等。POI最主要的特徵是具有與位置相關的信息,通過這個位置信息可以提供與該位置相關的面向大眾用戶的應用、產品或服務。POI可以引起用戶的關注,在地圖服務中承載著地理目標的查詢、屬性查看、路徑規劃及輔助定位等功能,用戶利用這些功能找到感興趣的目標的地理位置及其相關的屬性信息。POI不僅能夠記錄人類的真實活動情況,而且能夠反映出人們對於地理位置的感興趣度。通過對位置數據中POI數據進行深入挖掘與分析,能夠得到反映社會現象、廣大用戶興趣的地理空間分佈規律和特徵知識。

[

9

]對POI點的熱度進行了異常值剔除,最終篩選得到1000個POI點。POI數據包含類型編碼、名稱、經度、緯度、Hot (熱度值)、郵政編碼和地址等欄位,具體數據格式如

表 1

所示。

表 1 POI數據格式Tab. 1 POI data format

101036鳳祥酒店113.697 39534.775 42411410105河南省鄭州市經一路與黃河路交叉路口向北50米
163000鄭州西流湖度假村113.577 8234.781 36352410102河南省鄭州市中原區
281200火炬大廈113.565 09934.811 1254410102河南省鄭州市中原區市高新區國槐街8號

POI數據是以離散的點狀要素的形式存在於地圖中,具有準確的空間位置屬性,可通過大量離散POI數據的空間插值來反演獲得整個研究區域的熱度信息,建立空間興趣場模型。

本文採用Kriging插值方法對POI數據進行空間插值,將POI點的熱度值作為觀測值,其坐標數據作為區域變化量,對鄭州區域的熱度值進行估計。根據插值后獲得的鄭州市的熱度信息,得到整個鄭州區域的空間興趣場 (圖 1),模型效果圖中,以高低程度表示用戶興趣度大小,以特殊高亮的形式和顏色變化顯示用戶興趣分佈及變化情況。

圖 1 鄭州市部分地區感興趣場模型效果圖Fig. 1 Interest field model of Zhengzhou2 GeoSOT剖分網格理論

地球剖分模型是近年來提出的一種全新空間數據模型,它是利用球形剖分的方式將地球表面劃分為近似等面積和等形狀的多級多層次面片,並進行規則編碼,進而建立起全球統一的多解析度層次化的空間數據組織和索引模型[

10

-

12

]。2

n

一維整型數組的全球經緯度剖分格網 (geographic coordinate subdivision grid with one-dimension-integral coding on 2n-tree,GeoSOT) 剖分網格是由文獻[

13

]提出的一種等經緯度的四叉樹剖分網格模型。這種剖分網格是基於地理坐標系統劃分的網格系統,在全球範圍內是無縫的、穩定的並近似均勻的,可實現層次之間的有機關聯。其剖分面片具有可標識性、層次性、聚合性和關聯性等特點,為矢量數地圖多尺度表達提供基礎。

2.1 GeoSOT剖分模型

GeoSOT剖分模型在對地球表面經緯度空間範圍經過3次擴展 (即180°×360°擴展為512°×512°,1°×1°(60′×60′) 網格單元擴展為64′×64′,1′×1′(60″×60″) 網格單元擴展到64″×64″) 基礎上進行嚴格的遞歸四叉剖分,如圖 2所示,形成了覆蓋整個地球的GeoSOT剖分格網。該網格通過空間擴展使網格具有整數特徵,形成了「度」級、「分」級、「秒」級的層次網格。通過遞歸四叉剖分,GeoSOT剖分網格上下層級之間面積之比大致為4:1,是均勻變化的。

圖 2 GeoSOT剖分網格Fig. 2 GeoSOT subdivision grids

針對GeoSOT剖分網格方法,採用0、1、2、3的四進位數進行Z序編碼,如圖 3所示。每個剖分面片具有唯一的編碼,每個子面片的編碼可在其父碼末尾加上一位。地址碼越短,表達的空間區域範圍越大,尺度越大;地址碼越短,表達的空間區域範圍越小,尺度越小。這樣編碼不僅反映了表達的尺度信息,同時體現了層次性特徵。

圖 3 GeoSOT剖分網格編碼示意圖Fig. 3 Diagram of GeoSOT subdivision grids coding2.2 GeoSOT剖分網格尺度劃分

利用GeoSOT剖分理論,實現矢量地圖的多尺度表達,主要利用了地球剖分的空間層次性,通過對地球表面空間的遞歸性剖分,使各級剖分層次在結構上形成了從上而下的嵌套與從屬關聯關係。剖分面片的空間層次性隱含了空間尺度特徵,剖分面片的層次、大小與空間尺度存在著一定的聯繫。

剖分網格尺度劃分主要是建立GeoSOT剖分網格與地圖比例尺之間的聯繫。以國家基本比例尺地形圖為基礎,建立GeoSOT剖分網格與高斯剖分網格之間的對應關係,依次分為1:100萬、1:50萬、1:25萬、1:10萬、1:5萬、1:2.5萬、1:1萬、1:5000、1:2000比例尺對應的9個層次級別,得到GeoSOT剖分網格與地圖比例尺對應表 (表 2)。

表 2 GeoSOT剖分網格與地圖比例尺對應Tab. 2 POI data format

層級剖分網格層級剖分網格單元大小對應比例尺
1第7級4°網格1:100萬
2第8級2°網格1:50萬
3第9級1°網格1:25萬
4第14級2′網格1:10萬
5第14級2′網格1:5萬
6第15級1′網格1:2.5萬
7第20級2″網格1:1萬
8第21級1″網格1:5000
9第21級1″網格1:2000

表選項

3 GeoSOT剖分網格下顧及用戶興趣的空間數據多尺度表達策略

本文為實現按用戶興趣有效地分層次對矢量地圖進行多尺度表達,提出了一種GeoSOT剖分網格下顧及用戶興趣的矢量地圖多尺度表達策略,使空間數據在GeoSOT剖分網格框架下,能夠根據按用戶興趣多層次進行表達,以方便數據的動態操作和多尺度的管理。

基本流程如圖 5所示,主要分為空間數據預處理、空間剖分及面片興趣度的確定、空間數據組織及索引、興趣場約束下多尺度表達等部分。

圖 4 剖分網格下顧及興趣場多尺度表達基本流程Fig. 4 The basic procedure of multi-scale representation considering user interest on subdivision gird圖 5 基於GeoSOT剖分網格的空間數據組織Fig. 5 Spatial Data Organization Based on GeoSOT subdivision grids3.1 空間數據預處理

在地圖表達過程中,隨尺度的變化,空間數據的表現形態也在不斷變化。因此,在多尺度表達中,需要對空間數據進行一種多尺度、層次化的描述,即記錄空間數據隨尺度變化的各個空間狀態,使得較為重要的空間要素優先存儲和顯示,能夠實現一種知識級的多尺度表達。空間數據的多層次結構化組織是依據空間要素的重要性對空間數據進行有序化管理,將海量、雜亂無章的空間信息組織為有序集合,實現空間數據的高效存儲、索引、表達、應用、服務等。

在實際的地理信息中,地理要素由於種類繁多,每個地理要素的地理位置、所處層次的重要性和作用不同,一般將其進行分類分級,並在地圖顯示時,不同等級的要素顯示層級級別範圍 (即要素在地圖表達時顯示的生命周期)。因此,要對空間數據進行分類分級處理,基本思路為:

(1) 根據空間數據的基本數據類型,分為點、線、面三類進行處理。

(2) 根據GB/T13923—2006標準《基礎地理信息要素分類與代碼》對空間要素進行分類,確定每個類別下的各個要素顯示的比例尺範圍及相應的剖分層級範圍,如表 3所示。

表 3 空間要素顯示層級Tab. 3 Spatial data display hierarchy format

ID要素名稱類型類別比例尺範圍層級範圍
10482河南財經政法大學大學1:5000~1:10萬4~8
18146鄭州市植物園植物園1:500~1:1萬7~9
25347科學大道主幹道1:500~1:100萬1~9
18354機場高速高速公路1:500~1:100萬1~9

表選項

3.2 空間剖分及面片興趣度的確定

根據GeoSOT剖分網格框架對研究區域進行層次劃分,建立剖分模板,得到各層級的剖分面片。再依據所構建的空間興趣場,確定各個剖分面片的興趣度。

根據數據本身有斷點的這一特點,對空間興趣場中用戶興趣進行分級,使分級后的組內差異最小, 組間差異最大,利用自然間斷點分級法 (Jenks)[

15

],將用戶興趣分為10個等級。

由於人們對空間各個區域感興趣程度不同,需要根據空間興趣場,通過面片所在區域的位置,以該區域內的平均用戶興趣等級作為該區域的所表達的用戶興趣度。

3.3 空間數據組織及索引

根據剖分模板,對空間數據進行空間劃分並建立層次索引。

在GeoSOT剖分網格下,將地理空間劃分成以剖分網格為單元的面片區域。以剖分面片為基本表達的單元,採用四叉樹結構對剖分面片進行分層組織,再將空間數據按所在面片進行分塊劃分成不同的集合,各個面片中的要素按次序分級分層次組織,即空間要素集合中按用戶興趣度由大到小的順序進行線性排序,並按序記錄相應的標識ID、顯示的剖分層級及興趣度等信息。因此,空間數據能夠在橫向上按興趣度進行有序組織,在縱向上按尺度建立索引。

因此,各個層次級別與相應層次的空間要素建立關聯。通過剖分層次與尺度的對應關係,能夠把相應用戶需求尺度的空間要素提取並表達出來。呈現的組織結構如圖 5所示。在不同尺度下,根據面片所表達的用戶興趣程度不同,各個面片區域中表達的空間要素呈現不同的詳細程度,使興趣度高的面片區域表達內容較為詳細,即用戶興趣度較高的要素能夠優先表達。基於GeoSOT剖分網格的空間數據組織結構,能夠滿足用戶興趣高效地對海量空間數據進行索引與表達。

3.4 興趣場約束下多尺度表達

地圖應用時,由於用戶對地圖上不同區域的興趣度不同,本文提出興趣載負量的概念。興趣載負量是衡量某一區域內用戶興趣的大小,即區域面積內用戶興趣的總和。設在某區域平均興趣度為I,該區域興趣載負量Z可利用式 (1) 計算

(1)

即可表示為

(2)

由於對地圖認知和興趣的限制,人們在應用地圖時,對地圖興趣度往往是集中於某個或某些區域,不可能對地圖全部的細節都感興趣,也不現實。因此,可認為地圖的興趣載負量也是有一定限度的,並且興趣度高區域的興趣載負量與興趣度低區域的興趣載負量處於一種平衡的狀態。

本文方法是希望在某一層級表達時,剖分后的各個表達的面片的興趣載負量之間是平衡的,使整個地圖興趣處於飽和狀態。當地圖為

k

級表達時,首先確定該比例尺下剖分后所在的層級,然後進行空間劃分,如

圖 6(a)

所示。當地圖為

k

+1級表達,將

k

級面片進行遞歸四叉剖分,如

圖 6(b)

所示。將興趣場引入到剖分空間中,將其按GeoSOT的

k

+1級格網進行劃分,構建興趣模板,再根據式 (1),將

k

+1級網格與所對應的興趣模板相乘,計算得到各個剖分面片的興趣載負量。比較各個剖分面片的興趣載負量,若四個相鄰面片

S

111213、

S

14的興趣載負量之和與另一面片

S

30的興趣載負量相等,即

(2)圖 6 興趣場約束下多尺度表達Fig. 6 Multi-scale representation based on interest field model

11、

S

12、

S

13141進行表達,並查找與提取各個面片所包含的要素集合中在

k

層表達的要素,如

圖 6(c)

所示,實現了一種剖分網格下顧及興趣場多尺度表達。

當由小尺度到大尺度變換時,即地圖為由k級變為k+1級表達時,對原剖分網格中各個面片進行四叉劃分,得到子剖分面片,計算各個子剖分面片的興趣度及興趣載負量,同上一步,若相鄰4個子面片與某一面片興趣載負量相等,即用k級面片表達。由於不同層次面片之間具有繼承與被繼承的關係,高層次面片包含了低層次面片的信息。依次比較4個子面片興趣度與父面片興趣度,當子面片興趣度大於等於父面片興趣度,保留在k級中該子面片表達的要素;當子面片興趣度小於父面片興趣度時,保留在k級中該子面片表達的要素,並再表達出顯示範圍在[k, k+1]尺度之間的要素。該步驟將興趣度高的要素保留,興趣度較低的要素逐漸進行表達。

當由大尺度到小尺度變換時,即地圖為由k級變為k-1級表達時,由於剖分面片具有空間聚合性,即低層次的較小相鄰剖分面片可以聚合生成高層次的較大面片。因此,按剖分規則,對原剖分網格中相鄰的4個面片進行聚合,形成高層次的父面片,而對在k級尺度中已利用k-1級表達的面片保持不變,確定各個面片的興趣度。依次比較原4個子面片興趣度與父面片興趣度,當原子面片大於等於父面片興趣度時,保留在k級中該子面片表達的要素;當原子面片興趣度小於父面片興趣度時,在k級中該子面片表達的要素中刪除顯示範圍在[k-1, k]尺度之間的要素。該步驟能夠將興趣度高的要素進行優先表達。

4 試驗與分析

為實現剖分網格下顧及用戶興趣的矢量地圖多尺度表達,驗證本文提出研究思路的有效性,本文對剖分網格下傳統多尺度表達方法與顧及用戶興趣多尺度表達方法進行比較,以鄭州市點狀要素多尺度表達為例,進行了模擬試驗。試驗數據是採集的1000個鄭州市POI數據及全國1:25萬基礎矢量數據中鄭州市區內點狀數據。

為衡量利用本方法對點狀數據表達顯示效果,採用地圖面積載負量作為量化評判指標。地圖載負量是衡量地圖中能夠表達地物信息多少的數量標誌[

16

]

(2)

式中,

G

為總圖幅面積;

fi

為符號和註記所佔面積。通過計算,得到各個尺度下地圖面積載負量。

試驗結果如圖 7所示,圖 7(a)為1:10萬比例尺下的原始數據,利用本文的方法對點狀要素進行多尺度表達,圖 7(b)—(e)分別是在1:10萬 (第4級)、1:5萬 (第5級)、1:2.5萬 (第6級)、1:1萬 (第7級) 比例尺下的表達效果,由此可以看出,在表達時,相對重要的點狀要素首先顯示,隨比例尺的增加,尺度的減小,其他點狀要素逐漸顯示出來,呈現出了由概略到詳細、由重要到次要的效果。

圖 7 顧及用戶興趣的點狀要素多尺度表達Fig. 7 Multi-scale representation method of point data considering user interest

圖 8為剖分網格下不同尺度傳統多尺度表達方法與本文提出的顧及用戶興趣多尺度表達方法的比較,由圖 8可知,傳統方法在不同比例尺下的地圖面積載負量呈現整體較為平穩的趨勢;顧及用戶興趣的方法在小比例尺下,顧及用戶興趣的方法面積載負量較小,遠遠小於傳統方法,隨比例尺逐漸增大面積載負量逐漸遞增。

圖 8 剖分網格下不同比例尺的傳統多尺度表達方法與本文方法比較Fig. 8 The comparison with traditional representation method and the suggested method in different scale on subdivision gird

在1:10萬比例尺下,選取興趣級別分別為3、5、7的3個剖分面片,並計算每個面片區域在不同比例尺下的載負量。由表 4可知,利用本文方法得到的矢量地圖在比例尺介於1:1萬與1:5萬時其面積載負量逐漸增加,當比例尺小於1:5萬時,載負量逐漸減小;不同興趣度區域的載負量總體變化大致相同;不同興趣度區域的載負量存在明顯差異,在同一比例尺下,興趣度高區域的載負量比興趣度低區域載負量高,而且在較小比例尺下,興趣度高區域具有較高載負量值,說明興趣度高的數據能夠優先顯示。

表 4 各尺度下地圖面積載負量Tab. 4 Area Load of Multi-scale map

比例尺/(萬)1:101:51:2.51:1
全圖0.0290.0930.1720.158
3級興趣面片0.0090.0410.0890.099
5級興趣面片0.0470.1250.2010.195
7級興趣面片0.2670.2820.3050.311

表選項

5 結論

本文提出一種剖分網格下顧及用戶興趣的矢量地圖多尺度表達方法,首先利用研究區域的大量POI數據構建覆蓋整個地理空間的興趣場模型,描述用戶對地理信息的興趣強度空間分佈及其變化趨勢,再對空間要素進行分類分級,確定其表達的尺度範圍,最後利用地球剖分理論對空間範圍進行不同層次的區域劃分,根據各個區域用戶興趣程度,進行空間數據不同詳細程度的表達與顯示,實現一種基於用戶興趣的空間數據多尺度表達。試驗表明該方法根據海量網路數據挖掘用戶感興趣地理信息,並在多尺度表達過程中,地圖上人們關注的重要信息能夠較為優先表達與顯示,次要信息隨尺度的減小進而表達與顯示出來,滿足用戶興趣需求的同時,具有較好的多尺度表達效果,有著實際的研究意義與應用價值。在尺度變換過程中,還要考慮到空間要素跨面片、不同尺度間要素變換的連續性等問題,需要進一步研究。

【引文格式】俞童,鄧術軍,錢海忠,等。 剖分網格下顧及用戶興趣的矢量地圖多尺度表達方法[J]. 測繪學報,2016,45(S1):127-134. DOI: 10.11947/j.AGCS.2016.F016

權威 | 專業 | 學術 | 前沿

微信投稿郵箱 | [email protected]

歡迎加入《測繪學報》作者QQ群: 297834524

進群請備註:姓名+單位+稿件編號



熱門推薦

本文由 yidianzixun 提供 原文連結

寵物協尋 相信 終究能找到回家的路
寫了7763篇文章,獲得2次喜歡
留言回覆
回覆
精彩推薦