Viac

Množiny údajov POI pre Severnú Ameriku

Množiny údajov POI pre Severnú Ameriku


Používam foursquare, pretože obsahuje veľa bodov záujmu. Akú databázu používate, keď potrebujete bod záujmu v Severnej Amerike?


Zdá sa, že v USA existuje 7 hlavných databáz „POI“, ktoré majú veľké množstvo údajov o POI prístupných cez API. (Väčšinu z toho nájdete na stránke http://www.quora.com/What-are-the-pros-and-cons-of-each-Places-API)

  • WebMiner GEO
  • Yelp
  • CitySearch
  • Facebook
  • Foursquare
  • Google
  • SimpleGeo, faktické

V závislosti od toho, čo hľadáte, tieto ponúkajú rôzne výhody.

WebMiner GEO

TheWebMiner GEO je zbierka databáz POI. Geografické údaje je možné stiahnuť v určitom polomere z bodu, napr. Ak chcete údaje pre celé Spojené štáty, môžete vybrať Colorado ako bod a 2 500 míľ ako polomer a môžete získať všetky údaje pre Spojené štáty.

Yelp, CitySearch

Tieto dve stránky sú podobné: sústreďujú sa predovšetkým na recenzie, a nie ako databázy bodov záujmu. Výsledkom je, že ich údaje sú naklonené viac k miestam, na ktoré by používatelia písali recenzie - v týchto databázach nenájdete „Mužskú izbu na Blízkom východe na poschodí“. Väčšinou však majú bohatšie informácie - okrem kategorizácie majú samozrejme aj samotné recenzie a ďalšie informácie, ako sú hodnotenia atď. Na mnohé účely sú tieto stránky s recenziami nadradené na miestach, kde majú obsah.

Facebook

Rozhranie API pre miesta na Facebooku ponúka spôsob integrácie miest, ktoré majú sociálnejší charakter. Na miestach, ktoré existujú na miestach na Facebooku, sa budú častejšie objavovať veci ako nástenné príspevky, obrázky a pod. V prípade miest, ktoré na Facebooku pôsobia, nájdete viac obsahu. Celková kvalita týchto miest je však nižšia; v mojom obmedzenom vzorkovaní je geografická presnosť zvyčajne nižšia ako Foursquare a pokrytie je nižšie bez výhody vybraných recenzií, ktoré ponúkajú Yelp a CitySearch.

FourSquare

FourSquare je najkomplexnejší zoznam miest ktoréhokoľvek z týchto rozhraní API, bodka. Obsahuje najkomplexnejší zoznam miest - čiastočne preto, že má širšiu definíciu pojmu „miesto“. (Pozri vyššie.) Na vyhľadávanie miest má relatívne otvorené rozhranie API a nahlásenia, tipy a podobne poskytujú rozumný súbor metadát-ale obmedzenejší ako vyššie uvedené „rafinovanejšie“ zdroje miest.

Pretože však veľkú časť týchto údajov zadáva používateľ, veľa z týchto údajov je svinstvo: duplikáty sú skutočnosťou a budete sa musieť vyrovnať s nesprávne zadanými údajmi.

Google

Rozhranie API miest Google vám poskytuje obmedzený súbor informácií zo stránok miest Google. Poskytnuté informácie sú rozumné, ale je ťažšie získať informácie, ako sú odkazy na miesta, mimo toto API. Je to relatívne komplexný výber, ale jeho vyhľadávanie nie je nijako zvlášť široké a neponúka informácie ako checkiny a podobne, ktoré Foursquare ponúka. Celkovo je toto API rozumné, ale s menším pokrytím ako Foursquare a (prostredníctvom API) menšou hĺbkou ako ostatné, neponúka oveľa viac ako Foursquare alebo ostatné v oboch smeroch.

SimpleGeo, faktické

Na tieto som sa nepozrel. Sú to však „otvorené“ údaje, na rozdiel od všetkých ostatných, čo je v niektorých prípadoch použitia pravdepodobne prínosom.

Celkovo je to „najlepšie“ pravdepodobne úplne závislé od toho, čo robíte; všetky ponúkajú rôzne sady bodov, rôznu hĺbku atď. Foursquare je pravdepodobne víťazom v šírke; Yelp (v oblastiach, ktoré pokrýva) je väčším víťazom do hĺbky; Google medzi ne v niektorých ohľadoch zapadá.

Všimnem si, že toto všetko je neoficiálne; Google si nárokuje 50 miliónov miest, zatiaľ čo Foursquare tvrdí, že viac ako 15 miliónov, takže môže existovať značný rozdiel v skutočnom počte miest, ktoré má Google ... prinajmenšom v prevažne mestských oblastiach, na ktoré som sa pozeral, však zdá sa, že Foursquare je komplexnejší. (Pretože údaje Foursquare sú do značnej miery odosielané užívateľmi, dáva zmysel, že mestské oblasti budú lepšie pokryté, takže moje pozorovania nemusia platiť pre žiadny daný prípad použitia.)


Pozrite sa na https://simplegeo.com/products/places/. Je to nové v bloku, ale zaznamenáva dobrú tlač.


Obvykle používam POI plaza, má dobrú databázu bodov záujmu.

http://poiplaza.com/?p=co


Kúpiť dopravné údaje

Údaje o premávke vám hovoria o objeme, plynulosti, rýchlosti a klasifikácii premávky vozidiel na cestách v danej oblasti. Nenechajte sa zamieňať s údajmi o návštevnosti webu alebo údajmi o návštevnosti z prevádzky - tieto súbory údajov poskytujú informácie o používateľoch internetu a chodcoch na ulici, nie o autách a vozidlách!

Údaje o premávke sa bežne týkajú premávky, ktorú vidíme na cestách okolo nás, a preto sa niekedy používajú zameniteľne s „údajmi o cestnej premávke“. Údaje o premávke však majú ešte mnoho ďalších podkategórií - železničná doprava, nákladná doprava a námorná doprava vám hovoria o toku vozidiel na konkrétnych miestach a v rôznych priemyselných odvetviach. Ale v tejto príručke, kedykoľvek sa odvolávame na „údaje o premávke“, hovoríme o údajoch, ktoré počítajú a merajú automobily a verejnú dopravu nachádzajúce sa na bežných cestách.

Analytika údajov o premávke je stále dôležitejšia, pretože naše mestá sú stále preťaženejšie. Organizácie a miestne orgány zodpovedné za mestské plánovanie a stanovovanie rýchlostných limitov sa spoliehajú na súbory údajov o premávke, aby pochopili, ako vozidlá cestujú a kde ich najčastejšie navštevujú. Živé kanály s údajmi o premávke umožňujú týmto organizáciám analyzovať údaje o premávke v reálnom čase a poskytujú im najpresnejšie informácie o dnešných cestách. Údaje o návštevnosti v reálnom čase sa často porovnávajú s historickými údajmi o premávke, aby sa identifikovali historické vzorce návštevnosti a zmeny v priebehu času. Organizácie tak môžu používať tento kombinovaný súbor údajov o návštevnosti na predikciu návštevnosti.

Údaje o verejnej premávke však nepoužívajú iba vlády a organizácie v oblasti infraštruktúry. V skutočnosti sa stále viac maloobchodníkov a spoločností obracia na spoločnosti zhromažďujúce údaje o premávke, aby zlepšili svoju činnosť a robili rozhodnutia založené na dátach. Pozrime sa bližšie na rôzne aplikácie s údajmi o cestnej premávke.

Kto používa údaje o návštevnosti a pre aké prípady použitia?

Poskytovatelia údajov o premávke umožňujú spoločnostiam a organizáciám z celého radu odvetví zlepšiť svoje rozhodovanie a plánovanie. Tu je len niekoľko používateľov a prípadov použitia spojených s údajmi o premávke vozidla:

Maloobchodníci - Zhromažďovanie a analýza údajov o premávke má pre firmy a maloobchodníkov niekoľko výhod. Údaje o návštevnosti sa používajú na výber maloobchodných webov, pretože maloobchodníci sa snažia umiestniť svoje obchody na miesta, ktoré ľudia často navštevujú a kam sa dá ľahko cestovať. Vysoký počet návštevníkov naznačuje, že daná cesta alebo miesto je obľúbené. Na základe toho môže maloobchodník využiť informácie od poskytovateľov služieb počítania návštevnosti spolu s internými metrikami firmy na rozhodovanie o mieste maloobchodného obchodu. Vďaka softvéru na analýzu údajov o návštevnosti od poskytovateľa údajov môžu firmy robiť najlepšie rozhodnutia na webe: len preto, že je v danej oblasti veľký prenos, neznamená to vždy, že je to dobré miesto na otvorenie obchodu. Súčasťou analýzy podnikových údajov o návštevnosti je rozhodnutie, či vysoký počet návštev znamená, že obchod získa viac zákazníkov alebo bude čeliť väčšej konkurencii.

Cestovný ruch a pohostinstvo - Dátový súbor predpovedí dopravy umožňuje spoločnostiam v odvetví cestovného ruchu a pohostinstva múdro plánovať logistiku. Údaje o objeme premávky a údajoch o dopravnom toku môžu týmto podnikom ukázať, kedy je doprava na cestách najviac koncentrovaná. Vďaka rozhraniu API pre tok návštevnosti môže cestovný ruch a pohostinstvá pripraviť inventár svojich produktov a pracovnú silu na rušné obdobia a tiež predvídať akékoľvek narušenie dodávateľského reťazca.

Obchodníci - Obchodníci často spolupracujú so spoločnosťami na analýzu údajov o premávke pri marketingu založenom na polohe a DOOH. Obchodníci si môžu vybrať, kedy sa majú reklamy zobrazovať na digitálnych billboardoch a displejoch na cestách, na základe analýzy návštevnosti v reálnom čase. Použitie programového rozhrania API pre aktuálnu návštevnosť na programové zobrazovanie reklám umožňuje obchodníkom zobrazovať reklamy, ktoré vidí čo najviac vodičov. Tradične súbor údajov o cestnej premávke pomôže obchodníkom rozhodnúť, kde uvádzať reklamy OOH. Nemá zmysel investovať peniaze do nákladnej reklamnej billboardovej kampane, ak z vašej databázy návštevnosti vyplýva, že vo vami vybranej oblasti sa zriedka nachádzajú vozidlá!

Miestne orgány a vlády - Miestne orgány a vlády používajú súbory údajov o premávke na mnohé prípady použitia. Pri plánovaní novej cesty regionálne orgány analyzujú historické súbory údajov o dopravných nehodách, aby identifikovali nebezpečne frekventované oblasti. Podobne mnoho miestnych autorít používa aj API pre dopravné incidenty, aby mohli v prípade prudkých kolízií upraviť zákonný rýchlostný limit. V širšom zmysle vlády a miestne orgány využívajú súbory údajov o dopravnom toku na zavedenie poplatkov za preťaženie v najrušnejších mestách ako súčasť svojich ekologických iniciatív. Pri urbanistickom plánovaní je nevyhnutné, aby miestne orgány a vlády mali kvalitné údaje o premávke, aby mohli inštalovať zariadenia, ako sú čerpacie stanice, a vykonávať pravidelnú údržbu ciest. Na diaľniciach môžu implementovať systémy riadenia preťaženia, napríklad rôznu dostupnosť jazdných pruhov.

Inteligentná infraštruktúra - Softvér prevádzkových údajov sa používa stále inovatívnejšie. AI a Deep Learning sa používajú na zber dopravných údajov, ako aj na sofistikované urbanistické plánovanie. Mnoho miest napríklad testuje projekty, ktoré používajú senzory bezdrôtovej komunikácie a inteligentné materiály a energiu na vytváranie inteligentných ciest, ktoré vyrábajú elektrickú energiu z prechádzajúcej premávky. Získaná elektrická energia je uskladnená v batériách na cestách a používa sa na napájanie pouličných lámp, dopravných značiek alebo monitorov znečistenia ovzdušia, ako aj senzorov, ktoré zisťujú, kedy sa vytvárajú výmoly. Inteligentné cesty môžu tiež monitorovať rýchlosť vozidla, čo robí zber údajov o rýchlosti premávky efektívnejším a spoľahlivejším. Inteligentné cesty môžu dokonca rozpoznať typ riadeného vozidla, čo ukazuje, že metódy zberu údajov o premávke sú každým dňom výkonnejšie.

Nová doprava - S poskytovateľom dopravných údajov môžu firmy a vlády spoznať príležitosti na inovácie a zlepšovanie dopravy. Napríklad v nórskom Bergene bol vyvinutý prvý autonómny ľahký železničný systém na svete. Zníži náklady, pretože nie je potrebné platiť vodičovi. Môže tiež zlepšiť presnosť a spoľahlivosť a zvýšiť spokojnosť zákazníkov. Spoločnosti, ktoré poskytujú služby dopravných dát, tento vývoj umožnili: Analýza dopravných údajov ukázala, že ľahký železničný systém bude komerčným úspechom.

Nákladná doprava - Väčšina prepravných spoločností považuje API pre dopravné údaje za zásadnú súčasť ich riadenia dopravy a logistiky. Analýza premávky v reálnom čase umožňuje vodičom efektívne plánovať cesty a trasy. Dopravné spoločnosti sa spoliehajú na údaje o premávke v reálnom čase, aby zaistili, že vozový park bude cestovať čo najbezpečnejšie a najefektívnejšie.

Pohotovostné služby - Systémy dopravných údajov sú neoddeliteľnou súčasťou každého tímu reakcie na núdzové situácie. Aby sa zaistilo, že sanitky, policajné autá a hasičské autá dorazia na miesto určenia čo najrýchlejšie, používajú služby pre vznik núdzovej situácie údaje o dopravných zápchach, aby zistili, ktorým trasám sa majú vyhnúť. Údaje o premávke na ulici sú tiež mimoriadne užitočné pre logistické tímy záchranných služieb. Pokiaľ je to možné, pokúsia sa nasmerovať núdzové vozidlá mimo obytných ulíc alebo oblastí s veľkým počtom chodcov. Vďaka rozhraniu API pre aktuálnu premávku sa vozidlá môžu týmto trasám vyhnúť a cestovať čo najrýchlejšie.

Aké sú typické atribúty prevádzkových údajov?

Veľa dátových bodov tvorí oblak dát o premávke. Keď si kúpite množinu údajov o návštevnosti alebo dátové rozhranie API od poskytovateľa údajov o návštevnosti, zvyčajne má celý rad atribútov. Môžu zahŕňať

Údaje o návštevnosti - Spoločnosti zaoberajúce sa návštevnosťou inštalujú senzory a kamery buď nad, alebo vedľa ciest, ktoré monitorujú, koľko vozidiel prejde v danom časovom rámci.

Údaje o dopravnom toku - Pochopenie, ako merať tok návštevnosti, môže byť komplikované. Našťastie API pre údaje o premávke v reálnom čase vám okamžite povedia, aký pravidelný je pohyb na ceste a či sa to časom mení.

Údaje o rýchlosti premávky - Poskytovatelia údajov o premávke zhromažďujú údaje o rýchlosti premávky v reálnom čase buď pomocou svojho systému GPS alebo čiernej skrinky, alebo vytvorením súboru údajov o rýchlosti premávky pomocou kamier a senzorov na ceste.

Údaje o zápchach - Množina údajov o zápchach dopravy ukazuje, kedy je na danej ceste príliš veľa premávky, čo znamená, že vozidlá nemôžu pravidelne jazdiť. Posúdenie frontu je tiež spojené s preťažením.

Údaje o dopravných nehodách - Poskytovatelia údajov o premávke ponúkajú historické údaje o premávke súvisiace s nehodami, ku ktorým došlo v minulosti na cestách, ako aj živé údaje o premávke, ktoré hlásia incidenty hneď, ako sa uskutočnia.

Údaje o klasifikácii vozidla - Klasifikácia vozidiel organizuje rôzne vozidlá, ktoré tvoria prúd premávky, do rôznych skupín. Napríklad autá, autobusy, taxíky, motorky, bicykle, dodávky a nákladné autá sú všetky rôzne triedy vozidiel.

Ako sa zhromažďujú údaje o návštevnosti?

Po celom svete existuje nespočetné množstvo zariadení na zhromažďovanie údajov o premávke. Niektoré z nich sú zdrojmi údajov o návštevnosti v reálnom čase, iné sú obecné postupy. Spoločnosti poskytujúce prevádzkové údaje zvyčajne používajú celý rad spôsobov zberu, aby zaistili presnosť.

Ručné počítanie meria tok premávky a zdržania prostredníctvom prieskumov vodičov. Rovnako ako prieskumy parkovania, ručný zber môže identifikovať bolestivé miesta vodiča, takže miestne orgány môžu splniť požiadavky na plánovanie cesty a parkovanie. Prieskumy chodcov merajú tok chodcov na križovatkách. Popri analýze premávky vozidla môžu byť tieto prieskumy použité na navrhnutie vylepšení pre bezpečný pohyb pešej premávky.

Fotoaparáty sa používajú na rozpoznávanie ŠPZ, používajú sa však aj na zhromažďovanie údajov o rýchlosti premávky a prehľadov klasifikácie vozidiel. Tieto údaje je potom možné dodať prostredníctvom rozhraní API historických údajov o návštevnosti.

Údaje o počte premávok je možné získať pomocou senzorov Bluetooth. Tieto senzory sú pripojené k počítadlu a údaje je možné načítať až šesť metrov od pultu. Tieto údaje je možné denne automaticky sťahovať prenosom GSM/4G. Údaje o počte sa automaticky ukladajú do softvéru poskytovateľa dopravných údajov, kde sú k dispozícii na analýzu. K údajom o počte v reálnom čase je možné pristupovať aj prostredníctvom pripojenia Ethernet/IP.

GPS, satelitné a mobilné signály môžu zhromažďovať údaje o objeme premávky. Analytika GPS sa používa na monitorovanie preťaženia a toku dopravy, ako aj na analýzu miesta určenia.

Nástroje na škrabanie webu a systémy AI môžu monitorovať sentiment v sociálnych médiách a zistiť, či sa nahráva veľké množstvo príspevkov o návštevnosti. Kľúčové slová ako „premávka“, „vyťaženosť“ a „nehoda“ môžu byť prvým indikátorom narušenia plynulosti dopravy. Rozhrania API pre údaje o návštevnosti v reálnom čase poskytujú tieto informácie 24/7.

Kto sú najlepší poskytovatelia údajov o návštevnosti?

Medzi popredných poskytovateľov dopravných dát a dopravných dát patria INRIX, Waze, Uber Movement, OpenStreetMap a Mapbox.

Ako hodnotiť kvalitu prevádzkových údajov?

Vysoko kvalitné údaje o premávke sú nevyhnutné pre najlepšiu analýzu návštevnosti. Iba konzistentné, aktuálne a obohatené služby údajov o premávke vám poskytnú presné informácie o premávke. Na posúdenie kvality údajov o návštevnosti môžu kupujúci urobiť tieto kroky:

  • Nákup zo seriózneho zdroja s vynikajúcimi recenziami je jedným zo spôsobov zabezpečenia kvality.
  • Tiež by sa mali používať pravidelné kontroly pomocou vašich vlastných systémov na detekciu chýb.
  • Pravidelné testovanie a hodnotenie je najlepší spôsob, ako zaistiť kvalitné údaje o premávke. Tieto kontroly je možné nastaviť tak, aby sa spúšťali automaticky.

Aké sú ceny údajov o návštevnosti zvyčajne?

Ceny za údaje o návštevnosti závisia od mnohých premenných. Služby zberu údajov o premávke majú pre kupujúcich údajov zvyčajne k dispozícii niekoľko modelov oceňovania. Ceny budú závisieť od toho, na čo budú použité údaje o premávke, koľko ľudí vo vašej spoločnosti potrebuje prístup k údajom o premávke a od geografických oblastí potrebných na analýzu údajov o premávke.

Aké sú bežné problémy pri nákupe dopravných údajov?

K bežným výzvam patrí zaistenie aktuálnosti údajov o premávke. Kúpou rozhrania API pre údaje o návštevnosti v reálnom čase sa tento problém rieši.

Je tiež potrebné zaistiť, aby zhromaždené údaje o návštevnosti zodpovedali potrebám vašej spoločnosti. To znamená analyzovať nespracované údaje o premávke a vzorky údajov o premávke. Odtiaľto môžete komunikovať svoje požiadavky s dodávateľom prevádzkových údajov a získavať prevádzkové údaje, ktoré zodpovedajú potrebám vašej spoločnosti. Extrahovanie užitočných informácií z týchto vzoriek údajov môže byť komplikovaný proces. Skúšanie a omyl s rôznymi otázkami je najlepší spôsob, ako dosiahnuť užitočné výsledky.

Podniky musia zaistiť, aby boli údaje o návštevnosti pravidelne testované na presnosť a minimalizáciu chýb. Vždy skontrolujte, či má váš poskytovateľ údajov o návštevnosti zavedené certifikácie kvality a postupy na zníženie chýb.

Čo sa opýtať poskytovateľov prevádzkových údajov?

  • Ako často sa aktualizuje súbor údajov o návštevnosti? Historické alebo v reálnom čase?
  • Využíva systém na analýzu údajov o návštevnosti postupom času strojové učenie na zlepšenie výkonu?
  • Bude sa systém údajov o návštevnosti integrovať s mojimi existujúcimi obchodnými technológiami?

Kto sú najlepší poskytovatelia prevádzkových údajov?

Nájdenie správneho poskytovateľa prevádzkových údajov pre vás skutočne závisí od vášho jedinečného prípadu použitia a požiadaviek na údaje vrátane rozpočtu a geografického pokrytia. Populárnymi poskytovateľmi prevádzkových údajov, od ktorých by ste mohli chcieť nakupovať prevádzkové údaje, sú Automaton AI, MBI Geodata, DDS Digital Data Services, Matrixian Group a FreightWaves.

Kde môžem kúpiť údaje o premávke?

Ako môžem získať údaje o premávke?

Údaje o premávke môžete získať prostredníctvom celého radu spôsobov doručenia - ten správny pre vás závisí od prípadu použitia. Historické údaje o návštevnosti sú napríklad obvykle k dispozícii na hromadné stiahnutie a doručujú sa pomocou segmentu S3. Na druhej strane, ak je váš prípad použitia kritický z časového hľadiska, môžete si kúpiť rozhrania API, informačné kanály a streamy v reálnom čase a stiahnuť si tak najaktuálnejšie informácie.

Čo sú podobné typy údajov ako údaje o návštevnosti?

Údaje o premávke sú podobné údajom o letectve, údajoch o nákladných vozidlách, nákladoch, cestných údajoch a údajoch o obchode. Tieto kategórie údajov sa bežne používajú na analýzu návštevnosti a analýzu údajov o premávke.


Štatistiky uvedené nižšie sú založené na vydaní miesta v júni 2021

Krajina POI Count Výrazné značky % Značkového BZ
CA 639,550 1,190 17.4%
GB 1,311,770 534 8.9%
USA 6,462,532 5,820 20.6%
Úhrn 8,413,852 7,544 18.6%

Poznámka: celkový súčet rôznych názvov značiek bude zvýšený z dôvodu dvojnásobného započítania značiek, ktoré existujú vo viacerých krajinách.Aktuálne jedinečné metriky značiek nájdete v časti Počty informácií o výrobkoch a miery plnenia.

Počty bodov záujmu sa budú v priebehu času líšiť v dôsledku zmien, ako je napríklad príjem nových zdrojov údajov alebo zmeny v našom modeli duplikácie. Ďalšie podrobnosti nájdete v poznámkach k vydaniu.

Metadáta BZ používame na sledovanie otvárania a zatvárania obchodov a nižšie sú uvedené počty značiek s najmenej 1 otvoreným alebo zatvoreným BZ v mesiaci.

Vyvodenie dátumu otvorenia/zatvorenia môže trvať viac ako mesiac, preto uvádzame metriky otvorenia/zatvorenia značky s mesačným oneskorením. Tu sa dozviete viac o našich stĺpcoch otvorenia/zatvorenia.

Niektoré body záujmu, ako sú letiská alebo nákupné strediská, zahrnujú menšie body záujmu v rámci svojich hraníc, pričom väčšie body záujmu obsahujúce body záujmu sa označujú ako „porovnateľné“ a menšie body záujmu sa označujú ako „deti“. Tento vzťah sa označuje nastavením rodičovského_miestneho kľúča podradeného BZ na rovnakú hodnotu ako miestny kľúč nadradeného BZ. Tu sa dozviete viac o našej logike hierarchie.

Nasledujúca tabuľka uvádza počty a miery naplnenia v stĺpcoch Core & amp Geometry pre všetky body záujmu a otvára iba body záujmu. Prepínajte medzi kartami a pohybujte sa podľa krajín. Upozorňujeme, že pre zatvorené body záujmu nie sú k dispozícii stĺpce geometrie.

Ďalej je zahrnutý absolútny počet atribútov značky a ich príslušných mier plnenia (percento nenulových hodnôt). Definície polí nájdete v schéme informácií o značke.

Názov stĺpca Absolútny počet Miera plnenia
safegraph_brand_id 7,084 100%
brand_name 7,084 100%
naics_code 7,084 100%
top_category 7,084 100%
podkategória 7,084 100%
parent_safegraph_brand_id 990 14%

Na kategorizáciu kľúčových funkcií miest používa SafeGraph kategorizáciu NAICS (North American Industry Classification System), ktorá pozostáva z číselného kódu NAICS s dĺžkou až 6 číslic. Kódy NAICS sú hierarchické a majú priradené popisy, ďalšie informácie nájdete v téme Schéma miest.

Nižšie môžete filtrovať podľa krajiny a kódov NAICS, aby ste videli najlepšie značky, ktoré v našom aktuálnom vydaní Miesta máme.

Nasledujúca tabuľka uvádza počet bodov POI podľa kategórie pre všetky body záujmu a iba pre body záujmu otvorené. Prepínajte medzi kartami a navigujte podľa krajín.

Štatistiky uvedené nižšie zahŕňajú iba americké vzory, avšak kanadské týždenné vzory budú zahrnuté po vydaní v máji 2021.

Metrické Krajina Hodnota (milióny) % zmena minulý mesiac
BZ so vzormi USA 4.5 0.9%
Celkový počet návštev USA 1,032.0 6.3%
Celkový počet návštevníkov USA 35.3 7.5%
Medián denných zariadení USA 15.8 -0.5%

Návšteva sa počíta, ak mobilné zariadenie v našom paneli pri danom bode záujmu pobýva aspoň 4 minúty. Tu sa dozviete viac o tom, ako zvládame návštevy uzavretých bodov záujmu a ďalšie špeciálne prípady.

Počty návštev sú ovplyvnené geografickými odchýlkami v našej množine údajov a zmenami veľkosti panela v priebehu času. Každá mesačná dodávka vzorov obsahuje údaje prehľadu panela, ktoré umožňujú normalizáciu.

Priemerné denné zobrazené zariadenia sa vypočítavajú z celkového počtu zariadení zobrazených v súbore normalizačných štatistík, ktorý sa dodáva s vydaním každého mesiaca.


Všade okolo GIS

Quantarctica je zbierka geografických súborov údajov o Antarktíde, ktorá pracuje s bezplatným softvérom QGIS s otvoreným zdrojovým kódom. Aktuálne obsahuje údaje z geografie, glaciológie a geofyziky a bude sa rozširovať o príspevky výskumnej komunity.

Pensylvánsky prístup k priestorovým údajom a#8211 národný výškový súbor údajov 10 metrov 7,5 a#2157,5 minútový štvoruholník pre Pensylvániu

Americký geologický prieskum vyvinul národnú výškovú databázu (NED). NED je bezproblémovou mozaikou najlepšie dostupných údajov o nadmorskej výške. Údaje o nadmorskej výške 7,5 minúty pre súbežné Spojené štáty sú primárnymi počiatočnými zdrojovými údajmi. Okrem dostupnosti úplných 7,5-minútových údajov boli vyvinuté účinné metódy spracovania na filtrovanie výrobných artefaktov v existujúcich údajoch, konverziu na konzistentný nulový bod, zhoda hrán, vyplnenie prameňov chýbajúcich údajov v štvoruholníkových švoch, prepracovanie údajov na konzistentná geografická projekcia a previesť všetky hodnoty nadmorskej výšky na desatinné metre ako konzistentnú mernú jednotku. NED má rozlíšenie jedna tretina oblúkového sekundy (približne 10 metrov) pre väčšinu súbežných USA, Havaj a Portoriko v bode NAD83. Pre Aljašku je rozlíšenie dvoch oblúkových sekúnd a nulový bod je NAD27.

USGS a#8211 Národná nadmorská výška (USA)

Národný údajový súbor nadmorskej výšky (NED) je hlavným produktom výškových údajov USGS a slúži ako výšková vrstva Národná mapa. NED poskytuje základné informácie o nadmorskej výške pre štúdie o vede Zeme a mapové aplikácie v USA. Vedci a manažéri zdrojov používajú údaje NED na výskum globálnych zmien, hydrologické modelovanie, monitorovanie zdrojov, mapovanie, vizualizáciu a mnoho ďalších aplikácií. NED sa neustále aktualizuje, aby integroval novo dostupné, vylepšené údaje o zdrojoch nadmorskej výšky. Všetky údaje NED sú verejným vlastníctvom.


Ochrana súkromia polohy pre outsourcované priestorové údaje v cloudovom úložisku.

Rozšírené používanie zariadení orientovaných na polohu podporuje rozvoj rôznych úspešných služieb založených na polohe [1] a množstvo priestorových informácií za posledné desaťročie narástlo výnimočnou rýchlosťou. Tieto obrovské priestorové informácie by mali byť udržiavané a spracovávané výkonným systémom správy údajov, ktorý presahuje možnosti malých firiem a jednotlivcov. Cloud computing adaptívne alokuje zdroje a efektívne znižuje náklady na manipuláciu a údržbu pre vlastníka údajov (DO). Outsourcing údajov sa preto stáva prevládajúcim vzorom a získal si rozsiahlu pozornosť akademickej obce [2]. V tomto vzore DO deleguje správu svojich údajov na tretieho poskytovateľa cloudového úložiska (SP), ktorý uchováva údaje DO a odpovede na dotazy autorizovaného používateľa (AU). Keďže sú však údaje outsourcované do SP, DO nemôže vedieť, kde sú údaje uložené, a tým stráca priamu kontrolu nad osudom svojich údajov. Preto je ochrana súkromia údajov o polohe outsourcovaných priestorových údajov veľkou výzvou pri vývoji outsourcingu priestorových údajov a služieb založených na polohe [3].

V modeli outsourcingu priestorových údajov priestorové dotazy, ako napríklad K najbližší sused (KNN) alebo dotazy na rozsah, bežne vydáva AU, aby mohla vykonávať priestorové dotazy, AU potrebuje zdieľať polohu bodu dotazu (okno dotazu) so SP [4] . Poloha AU je však veľmi citlivou informáciou, ktorá môže byť po odhalení ohrozená rôznymi hrozbami zverejnenia. Škodlivý SP môže napríklad predávať komerčne cenné informácie súperom DO alebo môže špekulovať o zdravotnom stave používateľov na základe priestorových dotazov používateľov.

V záujme zachovania súkromia pri outsourcingu priestorových údajov je jedným jednoduchým riešením to, že DO najskôr lokálne aplikuje konvenčné šifrovanie (napr. AES) na dáta a potom out out the encrypted data to SP. Akonáhle sú však údaje zašifrované, tradičné techniky dotazovania prostým textom sa stanú neplatnými a AU nemôže šifrované údaje vyhľadávať ani používať efektívne. Toto riešenie je neúčinné pre dotazy, ktoré vyžadujú iba malý zlomok údajov. Použitie výpočtových šifrovacích techník [5, 6] bude mať za následok obmedzenia pri spracovaní priestorových dotazov. Ak napríklad AU potrebuje nájsť K bodov záujmu najbližších susedov (POI) k bodu dotazu q, hoci techniky výpočtového šifrovania môžu vypočítať šifrované euklidské vzdialenosti medzi šifrovaným bodom q a každým bodom záujmu, nemôže tieto šifrované vzdialenosti zoradiť vzostupne alebo zostupne poradie. Preto by mali byť tieto šifrované vzdialenosti odoslané späť AU, ktorý ich môže dešifrovať a nájsť najlepších K výsledkov. Vďaka analýze procesu vieme, že na to, aby SP získal správny výsledok dotazu, musí SP vypočítať šifrované vzdialenosti a odoslať ich späť na AU, takže výpočtová a komunikačná zložitosť pre SP je O (n), kde n je veľkosť outsourcovaného súboru údajov. Keďže údaje v dnešnej dobe explodujú, tento jednoduchý prístup v takom prípade nie je použiteľný. Získavanie informácií o ochrane osobných údajov (PIR) [7] medzitým zaisťuje, že nedôveryhodné SP nebudú vystavené žiadne informácie o dotazoch AU, takže môže dosiahnuť vysokú úroveň zachovania súkromia. Bude to však mať za následok obrovské náklady na výpočty a komunikáciu a nie je vhodné na outsourcing priestorových údajov.

Aby sa zaručilo, že DO a AU môžu efektívne vyhľadávať šifrované priestorové údaje a súčasne chrániť súkromie polohy outsourcovaných priestorových údajov, na transformáciu umiestnení AU aj bodov záujmu sa používa Hilbertova krivka [8-12]. Štandardná Hilbertova krivka (SHC) však vytvára indexy bodov záujmu pomocou rovnakej zrnitosti v priestorovej doméne. Ak sa body POI husto distribuujú, jeho indexy generované SHC budú obsahovať veľa hodnôt indexu bez zodpovedajúcich bodov záujmu, ktoré tieto hodnoty nazývame segmenty nulovej hodnoty, čo je pre zákerné SP ľahké analyzovať a špekulovať s distribúciou bodov záujmu v transformovanom priestore. Zvýši sa riziko zverejnenia súkromných údajov o polohe outsourcovaných priestorových údajov. V tomto príspevku navrhujeme dve metódy generovania indexu pre outsourcované priestorové údaje a kvantitatívne analyzujeme bezpečnosť a účinnosť týchto metód. Naše hlavné príspevky sú zhrnuté nasledovne

(1) Navrhujeme metódu indexovej modifikácie pre SHC ([SHC.sup.*]) Na zvýšenie jej bezpečnosti, zatiaľ čo z hľadiska účinnosti je navrhnutá aj krivka priestorového zaplnenia založená na hustote (DSC).

(2) Navrhuje sa metrika na meranie rizika zverejnenia metódami priestorovej transformácie (napr. SHC), a to nerozlíšiteľnosť A. Okrem toho pre tieto metódy priestorovej transformácie formálne definujeme útočný model, ktorý kvantifikuje znalosti útočníka a používa upravenú všeobecnú metódu útoku na rekonštrukciu pôvodného súboru priestorových údajov.

(3) Výsledky hodnotenia vykonávané na súboroch údajov v reálnom svete ukazujú, že naše metódy priestorovej transformácie môžu dosiahnuť lepšie zabezpečenie ako SHC.

Zostávajúca časť tohto príspevku je usporiadaná nasledovne. Časť 2 hodnotí súvisiace práce. Časť 3 navrhuje naše metódy priestorovej transformácie. Časť 4 predstavuje model nerozlíšiteľnosti a útoku na bezpečnostnú analýzu. Empirické hodnotenie je uvedené v časti 5. Časť 6 uzatvára a diskutuje o budúcich smeroch výskumu.

2.1. Ochrana súkromia priestorových dotazov. Dôvernosť bola riešená v kontexte priestorových dotazov. Používatelia mobilných zariadení zadávajú priestorové dotazy (napr. Dotazy na rozsah alebo KNN), na ktoré odpovedá poskytovateľ služieb (napr. Mapy Google). Používatelia nechcú SP informovať o svojej presnej polohe. V záujme ochrany súkromia priestorových dotazov by malo byť umiestnenie používateľa najskôr zovšeobecnené pomocou anonymizátora dôveryhodného umiestnenia [13], ktorý dotaz spracuje a namiesto presného umiestnenia používateľa vygeneruje anonymizujúcu priestorovú oblasť. Väčšina práce, ktorá sa týka ochrany súkromia priestorových dotazov, pochádza z modelu k-anonymity, ktorý ako prvý navrhol Sweeny v databáze [14]. Gruteser a Grunwald [15] najskôr navrhli polohu k-anonymitu na základe tohto modelu na ochranu súkromia priestorových dotazov. Na základe anonymity polohy k navrhli Gedik a Liu [16] škálovateľnú architektúru, ktorá podporuje anonymitu polohy k pre široký rozsah mobilných klientov s požiadavkami na súkromie závislými od kontextu. Bamba a kol. [17] navrhli rámec na podporu anonymných dopytov založených na polohe, ktorý rozdeľuje záujmovú geografickú oblasť na bunky siete a dosahuje k-anonymitu pomocou siete.

Berúc do úvahy politiku anonymizácie, Deutsch a kol. [18] navrhol kanonymitu umiestnenia zohľadňujúcu zásady, ktorá by mohla brániť pred realistickejšími politikami a útočníkmi. Pretože väčšina algoritmov anonymity k polohy nemôže účinne predchádzať útokom závislým od polohy, keď sú polohy používateľov neustále aktualizované, Pan et al. [19] navrhli na vyriešenie tohto problému inkrementálny maskovací algoritmus založený na klikoch. Okrem anonymity polohy k bolo navrhnutých niekoľko ďalších spôsobov ochrany súkromia dotazov. Napríklad Beresford a Stajano [20] predstavili zónu mixu, aby zmapovali problém súkromia priestorových dotazov na problém anonymnej komunikácie. Palanisamy a Liu [21] budovaním kombinovaných zón v cestnej sieti predstavujú rámec na ochranu súkromia používateľov, ktorí cestujú po cestných sieťach, s polohou.

Metódy ochrany súkromia priestorových dotazov skrývajú polohu používateľov dopytu pred SP, ale nechránia dopytované údaje. Preto je ortogonálny k nášmu problému.

2.2. Outsourcing priestorových údajov Ochrana súkromia. Hacigumus a kol. [22] prvýkrát predstavil myšlienku outsourcingu databázových služieb externému poskytovateľovi služieb. Potom poskytli riešenie pre outsourcovanú ochranu súkromia údajov vytvorením indexu založeného na šifrovaných dátach a dodatočných interných informáciách na podporu šifrovaného dotazu na údaje [23]. Neskôr, so zameraním na jednorozmerné číselné hodnoty, Agrawal a kol. [24] navrhli schému šifrovania (OPES) zachovávajúcu poradie, ktorá podporuje efektívne spracovanie dotazov v SP. Potom Huang a kol. [25] predstavili externý prístup k zachovaniu ochrany osobných údajov, ktorý podporuje fuzzy dopyty po šifrovaných reťazcoch. Všetky vyššie uvedené prístupy sú vhodné pre reťazcové alebo jednorozmerné číselné hodnoty a nemožno ich priamo použiť na ochranu priestorových údajov z hľadiska ochrany osobných údajov.

Wong a kol. [26] študovali výpočet KNN šifrovaných n -tíc uložených v nedôveryhodných SP a navrhli metódu podporujúcu SP na výpočet relatívnej vzdialenosti medzi dvoma šifrovanými dátovými bodmi. Keďže bola zavedená virtuálna dimenzia, táto metóda nemôže efektívne vytvárať index šifrovaných dátových bodov. Preto pri spracovaní žiadosti o dotaz musí SP prejsť všetkými šifrovanými dátovými bodmi, čo vedie k relatívne nízkej účinnosti dotazov.

Aby sa podporila služba dotazov na outsourcované súkromné ​​priestorové údaje, niektorí vedci použili krivky vyplnenia priestoru na transformáciu bodov záujmu, ktoré môžu podporovať rozsah a dotaz KNN v transformovanom priestore. V praxi sa SHC používa vo väčšine prípadov. Použitím SHC, Ni a kol. [8] znížili dodatočné pracovné zaťaženie v dôsledku nastavenia parametrov používateľov. Medzitým sa znížili náklady na výpočet a komunikáciu dotazu na dosah, pretože vlastnosti SHC klastrovania a zachovania vzdialenosti sú vynikajúce. Khoshgozaran a kol. [9] používa SHC na mapovanie dátových bodov a požiadaviek na dotaz do Hilbertovho transformovaného priestoru a na povolenie dotazovacích služieb na šifrovaných priestorových dátach. Okrem toho zavádzajú techniku ​​duálnej Hilbertovej krivky, ktorá zvyšuje presnosť a efektivitu dotazu. Ku a kol. [10] preštudujte si schému zabezpečenia integrity dotazu. Na základe SHC sú dátové body šifrované symetrickým kľúčom a indexované Hilbertovou hodnotou. Pôvodná databáza a jej ukážka sú šifrované rôznymi priestorovými šifrovacími kľúčmi. Potom sa tieto dve šifrované množiny údajov skombinujú a uložia v SP na overenie integrity.

Podľa súčasného výskumu SHC pri transformácii pôvodného priestoru neberie do úvahy distribúciu bodov záujmu. V skutočnosti rozdeľuje priestor pomocou rovnakej zrnitosti a generuje Hilbertove hodnoty na zostavenie indexov bodov záujmu. Aby bola zaistená bezpečnosť a efektivita dotazov, je potrebná dostatočne veľká krivka, aby sa zabezpečilo, že neexistujú dva body záujmu s rovnakou hodnotou Hilbert. Khoshgozaran a kol. [9] poukázali na to, že bez znalosti parametrov Hilbertovej krivky môže škodlivý SP stále zistiť hustú oblasť bodov záujmu v transformovanom priestore analyzovaním počtu bodov záujmu s rovnakými alebo podobnými hodnotami Hilberta, čo zvyšuje riziko odhalenia súkromia polohy outsourcovaných priestorových údajov.

3. Metódy priestorovej transformácie

Aby sme chránili súkromie priestorových údajov o polohe, musíme transformovať pôvodné polohy bodov záujmu. Ideálnou metódou transformácie priestoru by mala byť jednosmerná funkcia, ktorú je ľahké vypočítať, ale je ťažké ju invertovať. Medzitým, aby sa zachovala efektivita dotazov šifrovaných priestorových údajov, metóda priestorovej transformácie by mala rešpektovať priestorovú blízkosť pôvodného priestoru. V tejto časti najskôr predstavíme štandardnú Hilbertovu krivku, ktorá je reprezentatívnou metódou priestorovej transformácie. Potom navrhneme dve vylepšené metódy priestorovej transformácie, ktoré dosahujú lepšie zabezpečenie ako SHC.

3.1. Štandardná Hilbertova krivka (SHC). Krivky vypĺňania priestoru [27] majú vyššie uvedené vlastnosti a je ich možné použiť pri transformácii priestorových údajov na ochranu súkromia polohy pre outsourcované priestorové údaje. Krivka vyplnenia priestoru prechádza každým oddelením uzavretého priestoru a nemá so sebou žiadny priesečník. Týmto spôsobom bude každý bod vo viacrozmernom priestore mapovaný ako hodnota do jednorozmerného priestoru. Z krivka [28], šedá krivka [29] a Hilbertova krivka sú všetky krivky vyplnenia priestoru, ktoré je možné použiť na transformáciu priestoru.

V porovnaní so Z krivkou a Grayovou krivkou je Hilbertova krivka široko používaná vďaka svojim vynikajúcim vlastnostiam klastrovania a zachovania vzdialenosti [11, 28-30, 34]. Podobne ako v [11] používame [H.s.N.dub] na označenie Hilbertovej krivky s rádom N v d-rozmernom priestore, kde N [väčší alebo rovný] 1 ad d [väčší ako alebo rovný ] 2. Týmto spôsobom môže byť d-dimenzionálny celočíselný priestor [[0, [2.s.N] -1] .s.d.d] namapovaný na jednorozmernú celočíselnú množinu [0, [2.sup.Nd ] -1], čo znamená, že pre akýkoľvek bod záujmu p v d -dimenzionálnom priestore existuje funkcia f vyhovujúca [V.sH.] = f (p), kde [V.sH.H] [člen] [0, [2.sd.Nd] -1]. Pretože jedna rozdelená oblasť môže obsahovať viac bodov POI, rôzne body záujmu môžu mať rovnakú hodnotu indexu pre danú Hilbertovu krivku.

Pretože hlavným cieľom tohto príspevku je chrániť súkromie POI polohy, zameriavame sa na priestorové transformácie v dvojrozmernom priestore. Obrázok 1 (a) ilustruje proces transformácie dvojrozmerného

priestor do Hilbertových hodnôt. Všetky body záujmu sú prechádzané Hilbertovou krivkou druhého rádu a sú indexované na základe sekvencie, v ktorej sú krivkou navštívené. V tomto prípade sú teda body záujmu a, b, c a d reprezentované ich Hilbertovými hodnotami 7, 9, 3 a 13. Obrázok 1 (b) zobrazuje Hilbertovu krivku s poradím 1,2,4 a 6. Z obrázku vidíme, že čím väčšia je objednávka, tým jemnejšie zrnitá je Hilbertova krivka.

3.2. Metóda úpravy indexu pre SHC ([SHC.sup.*]). Pretože súbory priestorových údajov v reálnom svete ukazujú súhrnnú distribúciu, indexy bodov záujmu generované spoločnosťou SHC obsahujú mnoho segmentov nulovej hodnoty, ktoré zvyšujú riziko odhalenia súkromia. Škodlivý SP má celé indexy a môže pasívne získavať niektoré mapovania medzi BZ a indexmi.Skenovaním indexov môže útočník ľahko nájsť súvislé segmenty a segmenty s nulovou hodnotou. Na tieto informácie sa môže zamerať a svoje znalosti použiť na odhad polohy neznámych bodov záujmu.

Študujeme distribučné charakteristiky indexov generovaných SHC. A distribúcia indexov je znázornená na obrázku 2.

Obrázok 2, ľavý obrázok predstavuje pôvodný súbor údajov a zodpovedajúci histogram predstavuje vizualizáciu indexov bodov záujmu. V histograme čierne čiary predstavujú spojité segmenty a sivé časti označujú segmenty s nulovou hodnotou. Ak tieto šedé časti stlačíme, distribúcia indexov sa stane rovnovážnou. Preto bude pre útočníkov ťažšie analyzovať a riziko odhalenia súkromia sa zníži. Na základe tohto konceptu predstavujeme algoritmus modifikácie indexu na zvýšenie bezpečnosti SHC, označovaný ako [SHC.sup.*].

V algoritme 1 na základe indexov i 'POI generovaných SHC a maximálnej medzery M parametra používateľa, ktorá označuje maximálnu hodnotu medzery medzi dvoma indexmi v indexoch I*upravených POI, porovnávame rozdiel medzi dvoma susednými indexmi, ak rozdiel presahuje maximálnu medzeru M, potom by sa tento druhý index mal upraviť pomocou forwardového indexu a M. Indexy upravených bodov PO* I* by sa mali aktualizovať pomocou novej n -tice, ktorá obsahuje index i a šifrovaný POI. Časová náročnosť tohto algoritmu je 0 ([absolútna hodnota (I ')]), kde [absolútna hodnota (I')] predstavuje mohutnosť I '

Po použití algoritmu 1 na úpravu indexov bodov záujmu sa dĺžka sivých častí na obrázku 2 dramaticky zníži a outsourcované súbory priestorových údajov sú pre škodlivého SP ťažšie napadnúť.

3.3. Krivka priestorovej výplne založená na hustote (DSC). Keď sa [SHC.sup.*] Začne vykonávať po generovaní indexov pomocou SHC, [SHC.sup.*] Potrebuje na vytvorenie indexov bodov záujmu viac času. Inšpirovaní myšlienkou, že SHC dokáže rozdeliť a transformovať pôvodný priestor, navrhujeme krivku vyplnenia priestoru založenú na hustote (DSC), ktorá zohľadňuje distribúciu bodov záujmu. DSC rozdeľuje priestorovú doménu podľa kapacity, čo je maximálny počet bodov POI, ktoré obsahuje rozdelená oblasť, označená ako C. Na určenie návštevnej sekvencie každej rozdelenej oblasti používa fraktálne pravidlá Hilbertovej krivky.

Generovanie DSC zahŕňa dva kroky. (1) Podľa kapacity je priestorová doména rozdelená na štvorčlennú stromovú štruktúru [31]. A generované rozdelené oblasti budú reprezentované ako uzly štvor stromového stromu. (2) Na základe orientácie krivky, východiskového bodu a faktora mierky zadanej DO sa každá rozdelená oblasť prechádza postupne v súlade s fraktálnymi pravidlami Hilbertovej krivky, potom sa vygeneruje poradové číslo každej rozdelenej oblasti a nazývame to. číslo DSC hodnota, ktorá sa používa na vytváranie indexov bodov záujmu.

Priestorový oddiel založený na strome na úrovni štyroch stromov. V DSC je priestorová doména rozdelená na štvorčlennú stromovú štruktúru. O zrnitosti rozhoduje kapacita C, čo znamená, že v prípade súčasného rozdelenia, ak počet bodov záujmu v oblasti R prekročí C, by sme mali pokračovať v delení R, kým počet bodov záujmu v každej oblasti s rozdelením nepresiahne C. Obrázok 3 ukazuje rôzne oddiely pomocou rôznych C. Na obrázku 3 vidíme, že čím je C menšie, tým je oddiel jemnejšie zrnitý.

DSC rozdeľuje priestor a generuje uzly štyroch stromov zodpovedajúce rozdeleným oblastiam na základe množiny údajov a kapacity POI.

Generovanie indexu pre DSC. Po rozdelení priestorovej domény a vygenerovaní uzlov kvadrantového stromu je potrebné vygenerovať orientáciu a krivku podkrivky uzlov krídla uzlov a medziľahlých uzlov podľa predvolenej orientácie krivky a počiatočného bodu DSC, znázorneného v algoritme 2. Medzitým indexová hodnota každého BZ je nastavená rovnako ako hodnota DSC rozdelenej oblasti, do ktorej BZ patrí. Tento algoritmus využíva fraktálne pravidlá Hilbertovej krivky znázornené na obrázku 4.

Existuje osem typov fraktálnych pravidiel Hilbertovej krivky. Poradové číslo subregiónu je priradené číslom v štvorici. Podľa pravidiel na obrázku 4 môže byť každý subregión ďalej rozdelený na generovanie kriviek vyššieho rádu.

V Algoritme 2 je [Q.O.] podkrivková orientácia uzla Q, [Q.S.S] je počiatočný bod podpriebehu uzla Q, S je zásobník, ktorý ukladá uzly štvorkoliek, [Z.sub. D] je hodnota DSC uzla Z a Z (i) je i-tý podradený uzol Z. Algoritmus 2 pretína hĺbku prvý strom Q podľa prednastavenej orientácie krivky 9 a počiatočného bodu [S. 0] a generuje hodnota indexu každej rozdelenej oblasti na základe hosťujúcej sekvencie listových uzlov. Z koreňového uzla nastavíme orientáciu a počiatočný bod každého medziľahlého uzla po úrovni podľa fraktálnych pravidiel na obrázku 4 (riadky 6-9). [T.sO] ([Z.O], [Z.S.S], i) a Ts ([Z.zO], [Z.S], i) predstavujú podprúd orientácia a počiatočný bod i -tého podradeného uzla Z.

Za predpokladu, že veľkosť súboru údajov POI je n.Onaverage,

Algoritmus 2 potrebuje navštíviť uzly [MATEMATICKÉ VYJADRENIE, KTORÉ SA V ASCII NEODPOVEDÁVA] a každý uzol bude navštívený iba raz. Zložitosť algoritmu 2 je O (n).

V tejto časti najskôr analyzujeme bezpečnosť SHC a navrhujeme nerozlíšiteľnosť na meranie rizika zverejnenia kriviek vyplnenia priestoru. Potom formálne definujeme útočný model, ktorý kvantifikuje znalosti útočníka na pozadí a meria bezpečnosť kriviek vyplnenia priestoru.

4.1. Riziko odhalenia súkromia. Ako vieme, škodlivý SP môže identifikovať hustú oblasť bodov záujmu v transformovanom priestore analyzovaním počtu bodov záujmu s podobnými alebo rovnakými hodnotami indexu. Aby sme zabránili tomu, aby viacerým POI prideľovalo rovnakú hodnotu indexu, musíme zvýšiť poradie kriviek SHC. V praxi sa body záujmu vo väčšine prípadov distribuujú husto a aplikácia SHC na generovanie indexov bodov záujmu môže zaviesť mnoho segmentov nulovej hodnoty. Škodlivý SP tak môže analyzovať tieto segmenty nulovej hodnoty a potom zistiť husté oblasti v transformovanom priestore. Napriek tomu, že použitie fiktívnych hodnôt na zníženie segmentov nulovej hodnoty [9] môže tieto segmenty explicitne eliminovať, pomocou analýzy protokolu dotazov môže škodlivý SP stále zisťovať hodnoty indexu s nízkou frekvenciou dotazov a potom hodnoty figuríny potvrdiť. Aby sme kvantifikovali riziko odhalenia súkromia, používame myšlienku entropie informácií a definujeme nerozlíšiteľnosť X nasledovne:

[MATEMATICKÉ VYJADROVANIE, KTORÉ SA V ASCII NEODPOVEDÁVA]] (1)

kde [8] predstavuje dĺžku segmentu s nulovou hodnotou v indexoch bodov záujmu, predstavuje počet segmentov s nulovou hodnotou [[phi]. sub.j] predstavuje dĺžku súvislého segmentu v bodoch záujmu “ indexy predstavuje počet súvislých segmentov a predstavuje celkovú dĺžku indexov bodov záujmu. Nerozlíšiteľnosť meria, ako segmenty s nulovou hodnotou a súvislé segmenty ovplyvňujú riziko odhalenia súkromia. Pre škodlivé SP je ťažké analyzovať rovnomerne rozložené indexy. Podľa charakteristík informačnej entropie sa dozvedáme, že čím nerovnomernejšie sú distribuované segmenty s nulovou hodnotou a spojité segmenty, tým nižšia je nerozlíšiteľnosť, a tým vyššie je riziko odhalenia súkromia.

4.2. Útočný model. Pretože škodlivý SP môže analyzovať šifrované priestorové údaje na odhad pôvodných umiestnení, DO chce poznať úroveň zabezpečenia metód priestorovej transformácie. Škodlivý SP môže získať určité znalosti na pozadí, napríklad podmnožinu mapovaní medzi pôvodnou množinou údajov P a transformovanou množinou údajov P '. Potom môže použiť niekoľko útočných metód na odhad pôvodných umiestnení objektov v P 'a získať odhadovaný súbor údajov P*. Na meranie priemernej chyby medzi pôvodným súborom údajov a odhadovaným súborom údajov * používame odhadové skreslenie (P, P *) [4]:

DT (P, P*) = [AVG.sub.p.id = p*.id, p [člen] P, p*[člen] P*] [paralelný] p- [p.sup.*] [paralelné], (2)

kde [rovnobežne] p- [str.*] [rovnobežne] predstavuje euklidovskú vzdialenosť medzi p a [p.*]. Je zrejmé, že vysoká (P, [P.sup.*]) Hodnota znamená, že na metódu priestorovej transformácie je ťažké zaútočiť. Skreslenie odhadu (P, [P.sup.*]) By sa dalo použiť na meranie úrovne zabezpečenia metódy priestorovej transformácie.

Predpokladáme, že útočník môže získať predchádzajúce znalosti o outsourcovaných súboroch priestorových údajov. Útočník môže napríklad poznať niektoré mapovania medzi pôvodnými miestami a zodpovedajúcimi indexmi. Vďaka vynikajúcim vlastnostiam SHC v oblasti zhlukovania a zachovania vzdialenosti môže útočník odhadnúť pôvodné polohy indexov pomocou známych mapovaní. Kvôli diskusii predpokladáme, že útočník pasívne pozná nasledujúce informácie.

(1) Podskupina A [podmnožina] P n POI, A = [[a.l], [a2],. [a.sub.n]>, kde [a.sub.i] je umiestnenie BZ.

(2) Príslušná podmnožina A! [podmnožina] I 'indexov bodov záujmu, A' = <[a'.sub.1], [a'22],. [a.sub.n]>, kde je index polohy [a.sub.i].

Pretože útočník môže získať iba A a A! pasívnym spôsobom si ich nemôže aktívne vyberať, ako chce. Aj keď útočník pozná indexy bodov záujmu v bodoch I ' - A', nepozná umiestnenie žiadneho bodu záujmu v bode P - A. Útočník sa teda pokúša odhadnúť pôvodné umiestnenie každého indexu v bodoch I ' - A'. Metóda priestorovej transformácie by mala tento odhad vykonať s vysokou hodnotou DT (P, [P.sup.*]).

Yiu a kol. [4] definujú všeobecný model útoku a navrhnú všeobecnú metódu útoku založenú na heuristike, ktorá útočníkovi umožní odhadnúť primeranú aproximáciu pôvodného umiestnenia využitím svojich obmedzených znalostí o známych mapovaniach. Podobne pre index b 'e I' -A 'definujeme jeho vektor vlastností cez A' nasledovne:

[MATEMATICKÉ VYJADRENIE, KTORÉ SA V ASCII NEODPOVEDÁ], (3)

kde [absolútna hodnota (b ' -[a'1]]]] predstavuje absolútny rozdiel medzi b' a [a'.sub.i]. Ako vieme, v indexoch bodov záujmu sú segmenty s nulovou hodnotou a výkonnosť SHC v oblasti zhlukovania a zachovania vzdialenosti je vynikajúca. Útočník by teda nemal počítať absolútny rozdiel pre každý index [a'.sub.i] [člen] A '. Pre index b 'útočník vypočíta iba absolútny rozdiel pre indexy blízke b' a tieto indexy by mali byť spojité. Tieto indexy predstavujú podmnožinu A! Označenú ako B ', ktorá sa mení s b'. Vektor funkcií indexu b '[člen] I' - A 'by preto mal byť zrevidovaný nasledovne:

[MATEMATICKÉ VYJADROVANIE, KTORÉ SA NEODPOVEDÁ ZA ASCII], (4)

kde B '= <[a'1], [a'2],. [a'.sub.m]> predstavuje podmnožinu A 'a m & n n. Pre alokáciu p v pôvodnej priestorovej doméne je jej vektor vektorov

V (p, B) = ([paralelný] p- [a.1] [paralelný] p- [a.2] [paralelný]. [Paralelný] p- [a.m.m] [paralelný ]), (5)

kde B = <[a'1], [a'2],. [a'.sub.m]> predstavuje podmnožinu A a táto podmnožina zodpovedá . Výberom kandidátnej polohy I a následným porovnaním koherentného vzoru vektorov vlastností V (b ', B') a V (l, B) môže útočník identifikovať pôvodné umiestnenie indexu b 's nízkou chybou odhadu. Na priame porovnanie by mali byť vektory znakov normalizované ich veľkosťami a na základe rozdielu medzi l a b 'používame odlišnosť [4] takto:

[eta] (l, b) = [L. 1] (V (b ', B')/[absolútna hodnota (V (b ', B'))], V (l, B)/[ absolútna hodnota (V (b ', B'))])

kde [L. 1] je vzdialenosť Manhattanu. Útočník teda môže odhadnúť pôvodnú polohu indexu b 'ako l*, čo je kandidátske miesto I s najmenšou hodnotou podobnosti,

[MATEMATICKÉ VYJADRENIE, KTORÉ SA V ASCII NEODPOVEDÁ]. (7)

Je zrejmé, že výpočet l* má za následok nekonečný počet kandidátskych miest v pôvodnej priestorovej doméne. Predpokladáme, že útočník používa randomizovanú numerickú metódu na získanie aproximácie l* v prijateľnom čase. Odhadom každého indexu b 'el' -A 'môže útočník získať odhadovaný súbor údajov [P.sup.*],

[MATEMATICKÉ VYJADRENIE, KTORÉ SA V ASCII NEODPOVEDÁ]. (8)

V časti 5 empiricky študujeme úroveň zabezpečenia SHC, [SHC.sup.*] A DSC pomocou vyššie upraveného všeobecného modelu útoku.

Výkon a bezpečnosť SHC, [SHC.sup.*] A DSC hodnotíme pomocou štyroch skutočných priestorových súborov údajov [32]: North East USA (NE: 123, 593 POIs), San Joaquin County (TG: 18, 263 POIs ), San Francisco (SF: 174, 956 BZ) a Severná Amerika (NA: 175, 813 BZ). Tieto súbory údajov sa dobre zhodujú s outsourcingom súkromných priestorových údajov uvedeným v oddiele 1. Doména každého súboru údajov je normalizovaná na štvorček jednotky [[0,1] .2] a experimenty sa vykonávajú na Intel i5-2400 3,1 Ghz s 8 GB RAM. Počiatočný bod, orientácia krivky a faktor mierky krivky sú prednastavené na (0, 0), D1 a 1.

5.1. Voľba parametra. Pri použití SHC alebo DSC na transformáciu priestorovej domény bude každej rozdelenej oblasti priradená hodnota. BZ má priradenú rovnakú hodnotu ako rozdelená oblasť, do ktorej patrí, a túto hodnotu je možné použiť na zostavenie indexu sady bodov záujmu. Keď sú dva body záujmu v tej istej oblasti oblasti, bude im priradená rovnaká hodnota. Nech a predstavuje priemerný počet bodov záujmu s rovnakou hodnotou indexu pomocou SHC a DSC na indexovanie bodov záujmu, meriame a pre každú hodnotu N a C vo všetkých množinách údajov. V ideálnom prípade chceme, aby sa a bolo nekonečne blízko 1, čo znamená, že neexistujú dva body záujmu s rovnakou hodnotou indexu.

[SHC.sup.*] Má rovnaké a ako SHC, takže študujeme iba vzťah medzi parametrami krivky a a pre SHC a DSC, aby sme zaručili, že nasledujúce experimenty sa uskutočňujú za rovnakých podmienok. Obrázok 5 ukazuje a SHC pre JV rôzneho poradia kriviek. A) SHC drasticky klesá, keď sa zvyšuje poradie kriviek. Keď N = 12, a sa blíži k 1 v NE, TG a SF, ale NA potrebuje N = 13. Obrázok 6 zobrazuje a DSC pre rôznu kapacitu C. a DSC stúpa pomaly so zvyšovaním kapacity. Keď C = 1, a = = 1. Toto nastavenie teda použijeme na SHC ([SHC.sup.*] Použije rovnaké nastavenie ako SHC) a DSC vo zvyšných experimentoch.

Ako užívateľský parameter môže maximálna medzera M pre [SHC.sup.*] Mať akúkoľvek hodnotu. Študujeme vzťah medzi nerozlíšiteľnosťou a M pre [SHC.sup.*] A zisťujeme, že nerozlíšiteľnosť [SHC.*] zostáva stabilná, keď M e [5, 55] a klesá, keď M> 60. Diskusie v tomto príspevku sme nastavili M = 10 v nasledujúcich experimentoch, ktoré efektívne komprimujú segmenty nulovej hodnoty a znižujú réžiu výpočtu.

5.2. Porovnanie generovania indexu. Výpočtové náklady na generovanie indexu sú dôležitou metrikou na hodnotenie metód priestorovej transformácie. Nastavíme a = 1 pre SHC, [SHC.sup.*] A DSC a porovnáme ich účinnosť generovania indexu v rôznych množinách údajov. EDHO [33] a BIA [34] sú algoritmy generovania indexov pre SHC, zatiaľ čo IGD navrhované v tomto článku je algoritmus generovania indexu pre DSC. Pretože [SHC.sup.*] Sa začne vykonávať po EDHO alebo BIA, používame [SHC.sup.*]-E a [SHC.sup.*]-B na označenie rôznych sekvencií vykonávania. Experiment sa vykoná 100 -krát a priemerný čas generovania indexu (ms) sa spriemeruje.

Tabuľka 1 ukazuje čas generovania indexu SHC, [SHC.sup.*] A DSC v rôznych množinách údajov. BIA generuje index rýchlejšie ako EDHO a [SHC.sup.*]-B je rýchlejší ako [SHC.sup.*]-E, ale všetky sú pomalšie ako IGD. Pretože [SHC.sup.*] -E pozostáva z EDHO a [SHC.sup.*], Trvá to trochu viac času ako EDHO. A vysvetlenie výsledku [SHC.sup.*]-B je podobné ako [SHC.sup.*]-E. Časové náklady podľa IGD sú v priemere iba 49,2%, z toho 64,5% v prípade EDHO a BIA. Sine DSC berie do úvahy distribúciu súboru údajov POI a vyberá rôzne poradia kriviek v oblastiach s rôznou hustotou, čo umožňuje riedkym oblastiam POI používať relatívne nízke poradie kriviek, a tým zlepšuje efektivitu výpočtu.

5.3. Porovnanie nerozlíšiteľnosti. Pri vytváraní indexov bodov záujmu používame nastavenie parametrov v časti 5.1 a vypočítavame nerozlíšiteľnosť týchto metód priestorovej transformácie. Pretože ako indexy bodov záujmu sú použité iba hodnoty indexu zodpovedajúce bodom záujmu, čo sú spojité segmenty, mohli by sme postupne skenovať indexy bodov záujmu a zistiť medzery medzi spojitými segmentmi a tieto medzery sú segmentmi s nulovou hodnotou. Tabuľka 2 ukazuje nerozlíšiteľnosť SHC, [SHC.sup.*] A DSC pre rôzne súbory údajov.

Nerozlíšiteľnosť [SHC.sup.*] A DSC je výrazne vyššia ako u SHC vo všetkých súboroch údajov. V priemere sú [SHC.*] a DSC o 68,4%, respektíve 64,9%, vyššie než SHC. Znamená to, že [SHC.sup.*] A DSC môžu udržiavať veľmi nízke riziko zverejnenia osobných údajov. Analýzou charakteristík týchto metód priestorovej transformácie sa môžeme dozvedieť, že keď SHC stavia index na skutočnom súbore priestorových údajov, bude existovať veľké množstvo nulových hodnotových segmentov a priemerná dĺžka spojitých segmentov sa úplne líši od nulovej. hodnotové segmenty. Zatiaľ čo DSC rozdeľuje priestorovú doménu podľa hustoty, počet a dĺžka segmentov nulovej hodnoty budú oveľa menšie ako v prípade SHC a segmenty s nulovou hodnotou a spojité segmenty distribuujú rovnováhu, čím sa nerozlíšiteľnosť DSC výrazne zvýši od oblasti SHC.

Aby sme porovnali distribúciu segmentov nulovej hodnoty a spojitých segmentov pri použití rôznych metód priestorovej transformácie, ilustrujeme indexy bodov záujmu zostavené pomocou SHC, [SHC.sup.*] A DSC na obrázku 7, kde (a.1) , (b.1), (c.1) a (d.1) označujú súbory údajov NE, TG, SF a NA. A 2, 3 a 4 predstavujú indexy bodov záujmu vytvorené spoločnosťami SHC, [SHC.sup.*] A DSC. Ako je popísané v časti 3.2, čierne čiary histogramu predstavujú spojité segmenty a sivé časti označujú segmenty s nulovou hodnotou. Vidíme, že dĺžka sivých častí sa dramaticky znižuje po použití algoritmu 1 na úpravu indexov bodov záujmu vytvorených SHC.Pretože [SHC.sup.*] Komprimuje segmenty s nulovou hodnotou, celková dĺžka segmentov s nulovou hodnotou je oveľa väčšia ako SHC a distribúcia segmentov s nulovou hodnotou a spojitých segmentov je oveľa rovnovážnejšia ako v SHC, čo robí [SHC.sup] nerozlíšiteľným. .*] oveľa väčšie ako v prípade SHC, čo vedie k nižšiemu riziku odhalenia súkromia. Z tohto obrázku tiež zisťujeme, že distribúcie indexov bodov záujmu vytvorených [SHC.sup.*] A DSC sú podobné, a preto je nerozlíšiteľnosť [SHC.sup.*] Podobná distribúcii DSC. .

5.4. Útoky proti SHC, [SHC.sup.*] A DSC. Použijeme nastavenie parametrov v časti 5.1 a nastavíme pomer známej sady A k 1% na základe predpokladu, že útočníci získajú obmedzené znalosti pozadia a počet susedných referenčných bodov záujmu na 15, čo je najlepšia hodnota pre odhad bodov záujmu v našich experimentoch . Útočná metóda opísaná v časti 4 sa používa na rekonštrukciu pôvodných súborov údajov.

Obrázok 8 zobrazuje odhadované množiny údajov zrekonštruované útočnou metódou nad indexmi bodov záujmu generovaných SHC, [SHC.sup.*] A DSC, kde a, b, c a d označujú NE, TG, SF a NA súbory údajov, v uvedenom poradí, zatiaľ čo 1, 2, 3 a 4 predstavujú pôvodné súbory údajov, odhadované súbory údajov pre SHC, odhadované súbory údajov pre [SHC.sup.*], a odhadované súbory údajov pre DSC, v uvedenom poradí. Na obrázku 8 môžeme ľahko zistiť, že na indexy bodov záujmu generované [SHC.sup.*] A DSC je ťažšie zaútočiť, pretože odhadované množiny údajov sú menej podobné pôvodným súborom údajov. Naopak, odhadované množiny údajov zrekonštruované nad indexmi vytvorenými spoločnosťou SHC si zachovávajú ďalšie podrobnosti. Znamená to, že [SHC.sup.*] A DSC sú bezpečnejšie ako SHC.

Pre ďalšiu analýzu vypočítame skreslenie odhadu SHC, [SHC.*] a DSC a tabuľka 3 ukazuje skreslenie odhadu SHC, [SHC.sup.*] A DSC pre všetky súbory údajov.

Pretože skreslenie odhadu predstavuje priemernú chybu medzi pôvodnými a odhadovanými množinami údajov, väčšia metrická hodnota znamená bezpečnejšiu metódu. V tabuľke 3 vidíme, že skreslenie odhadu SHC je menšie ako pri [SHC.*] a DSC a skreslenie pri odhade DSC je o niečo menšie ako pri [SHC.sup.*]. Znamená to, že [SHC.sup.*] A DSC sú bezpečnejšie ako SHC. Pretože je výkonnosť SHC klastrovania a zachovania vzdialenosti vynikajúca, odhadované množiny údajov sú bližšie k pôvodným množinám údajov a hodnota skreslenia odhadu je menšia. [SHC.sup.*] A DSC komprimujú segmenty s nulovou hodnotou, vlastnosť zachovania vzdialenosti je do určitej miery porušená a škodlivý SP nemôže špekulovať s distribúciou polohy pôvodných množín údajov jednoduchou analýzou indexov bodov záujmu, takže [SHC.sup.* ] a DSC sú bezpečnejšie.

V tomto príspevku navrhujeme [SHC.sup.*] A DSC na generovanie indexu outsourcovaných priestorových dát a navrhujeme nerozlíšiteľnosť na meranie rizika zverejnenia metód priestorovej transformácie. Je tiež definovaný útočný model, v experimentoch sú odhadované súbory údajov vizualizované na explicitné štúdium a skreslenie odhadu ukazuje, že [SHC.sup.*] A DSC sú bezpečnejšie ako SHC. Navrhované metódy môžu čiastočne narušiť vlastnosť SHC zachovávajúcu vzdialenosť, aby sa dosiahla lepšia bezpečnosť. Čas generovania indexu ukazuje, že DSC je účinnejší ako SHC a [SHC.sup.*], Takže DSC dosahuje dobré zabezpečenie a efektivitu. V budúcnosti budeme ďalej vykonávať bezpečnostnú analýzu metód priestorovejšej transformácie a navrhneme účinnejšie metriky na kvantifikáciu bezpečnosti.

Obrázky 9 a 10 zobrazujú rôzne priestorové oddiely cez množinu údajov TG SHC a DSC. Modrá čiara predstavuje krivky vypĺňania priestoru. Vidíme, že SHC rozdeľuje priestorovú doménu pomocou zjednotenej granularity, zatiaľ čo DSC rozdeľuje priestorovú doménu podľa hustoty bodov POI. Pre uľahčenie pozorovania nastavíme N = 6 pre SHC a nastavíme C = 1 pre DSC.

Autori prehlasujú, že v súvislosti s uverejnením tohto príspevku nedochádza ku konfliktu záujmov.

Túto prácu čiastočne podporil NSFC pod grantom č. 61172090, Výskumný fond pre doktorandský program vysokoškolského vzdelávania v Číne podľa grantu č. 20120201110013, Vedecký a technologický projekt v provincii Shaanxi pod grantom č. 2012 K06-30 a 2014JQ8322, Fond základného výskumu vedy na Univerzite Xi'an Jiaotong (č. XJJ2014049 a XKJC2014008) a Inovačný projekt vedy a technológie Shaanxi (2013SZS16-Z01/P01/K01). Autori tiež vďačne uznávajú užitočné návrhy recenzentov.

[1] J. An, X. Gui, W. Zhang, J. Jiang a J. Yang, „Research on social relations cognitive model of mobile nodes in Internet of Things,“ Journal of Network and Computer Applications, vol. 36, č. 2, s. 799-810, 2013.

[2] L. Hu, W. Ku, S. Bakiras a C. Shahabi, „Integrita priestorových dotazov so susedmi voronoi“, IEEE Transactions on Knowledge and Data Engineering, zv. 25, č. 4, s. 863-876, 2013.

[3] WS Ku, L. Hu, C. Shahabi a HX Wang, „Zabezpečenie integrity dotazu na služby založené na polohe s prístupom k outsourcovaným priestorovým databázam“ v zborníku z 11. medzinárodného sympózia o priestorových a dočasných databázach, s. 80- 97, Aalborg, Dánsko, 2009.

[4] M. L. Yiu, G. Ghinita, C. S. Jensen a P. Kalnis, „Enabling search services on outsourced private spatial data,“ The VLDB Journal, vol. 19, č. 3, s. 363-384, 2010.

[5] R. Huang, X. Gui, S. Yu a W. Zhuang, „Vypočítateľná šifrovacia schéma cloud computingu zachovávajúca súkromie“, Chinese Journal of Computers, zv. 34, č. 12, s. 2391-2402, 2011.

[6] P. Indyk a D. Woodruff, „Polylogaritmické súkromné ​​aproximácie a efektívne párovanie“, v zborníku z 3. konferencie teórie kryptografie, s. 245-264, New York, NY, USA, 2006.

[7] B. Chor, E. Kushilevitz, O. Goldreich a M. Sudan, „Private information retrieval,“ Journal of the ACM, vol. 45, č. 6, s. 965-982, 1998.

[8] W. Ni, J. Zheng a Z. Chong, „Hil Anchor: ochrana súkromia lokality za prítomnosti preferencií používateľov“, Journal of Computer Science and Technology, roč. 27, č. 2, s. 413-427, 2012.

[9] A. Khoshgozaran, H. Shirani-Mehr a C. Shahabi, „Slepé hodnotenie dopytov založených na polohe pomocou vesmírnej transformácie na ochranu súkromia polohy“, GeoInformatica, zv. 17, č. 4, s. 599-634, 2013.

[10] W. S. Ku, L. Hu, C. Shahabi a H. X. Wang, „Schéma zabezpečenia integrity dotazu na prístup k externým priestorovým databázam“, Geoinformatica, zv. 17, č. 1, s. 97-124, 2013.

[11] B. Moon, H. V. Jagadish, C. Faloutsos a J. H. Saltz, „Analýza klastrových vlastností Hilbertovej krivky plnenia priestoru“, IEEE Transactions on Knowledge and Data Engineering, zv. 13, č. 1, s. 124-141, 2001.

[12] A. Khoshgozaran a C. Shahabi, „Slepé hodnotenie dopytov najbližších susedov pomocou vesmírnej transformácie na zachovanie súkromia polohy“ v zborníku z 10. medzinárodného sympózia o priestorových a časových databázach, s. 239-257, Boston, Massachusetts, USA, 2007.

[13] P. Kalnis, G. Ghinita, K. Mouratidis a D. Papadias, „Prevening location-based identity inference in anonymous spatial queries,“ IEEE Transactions on Knowledge and Data Engineering, vol. 19, č. 12, s. 1719-1733, 2007.

[14] L. Sweeney, „k-anonymita: model na ochranu súkromia“, International Journal of Un neurčitosť, Fuzzy a systémy založené na znalostiach, zv. 10, č. 5, s. 557-570, 2002.

[15] M. Gruteser a D. Grunwald, „Anonymné používanie služieb založených na polohe prostredníctvom priestorového a časového maskovania“, v zborníku z 1. medzinárodnej konferencie o mobilných systémoch, aplikáciách a službách, s. 31-42, San Francisco, Kalifornie, USA, 2003.

[16] B. Gedik a L. Liu, „Ochrana súkromia polohy pomocou personalizovanej k-anonymity: architektúra a algoritmy“, IEEE Transactions on Mobile Computing, zv. 7, č. 1, s. 1-18, 2008.

[17] B. Bamba, L. Liu, P. Pesti a T. Wang, „Podpora anonymných dopytov na polohu v mobilných prostrediach s ochranou osobných údajov“, v zborníku zo 17. medzinárodnej konferencie o World Wide Web (WWW 08), s. 237-246, Peking, Čína, apríl 2008.

[18] A. Deutsch, R. Hull, A. Vyas a K.K. Zhao, „Anonymita odosielateľa zohľadňujúca zásady v službách založených na polohe“, v zborníku z 26. medzinárodnej konferencie IEEE o dátovom inžinierstve (ICDE 10), s. 133-144, Long Beach, Kalifornie, USA, marec 2010.

[19] X. Pan, J. L. Xu a X. F. Meng, „Ochrana súkromia pred útokmi závislými od polohy v mobilných službách“, IEEE Transactions on Knowledge and Data Engineering, roč. 24, č. 8, s. 1506-1519, 2012.

[20] A. R. Beresford a F. Stajano, „Ochrana súkromia v všadeprítomných počítačoch,“ IEEE Pervasive Computing, zv. 2, č. 1, s. 46-55, 2003.

[21] B. Palanisamy a L. Liu, „MobiMix: ochrana súkromia polohy pomocou zmiešaných zón cez cestné siete“, v zborníku z 27. medzinárodnej konferencie IEEE o dátovom inžinierstve, s. 494-505, Hannover, Nemecko, apríl 2011 .

[22] H. Hacigumus, B. Iyer a S. Mehrotra, „Poskytovanie databázy ako služby“, v zborníku z 18. medzinárodnej konferencie o dátovom inžinierstve, s. 29-38, San Jose, Calif, USA, 2002.

[23] H. Hacigumus, B. Iyer, C. Li a S. Mehrotra, „Executing SQL over encrypted data in the database-service-provider model,“ in Proceedings of the ACM SIGMOD International Conference on Management of Data (SIGMOD 216-227, Madison, Wis, USA, jún 2002.

[24] R. Agrawal, J. Kiernan, R. Srikant a YR Xu „Objednávka zachovávajúca šifrovanie pre číselné údaje“ v zborníku z medzinárodnej konferencie ACM SIGMOD o medzinárodnej správe údajov (SIGMOD 04), s. 563-574 , ACM, Paríž, Francúzsko, jún 2004.

[25] R. W. Huang, X. L. Gui, S. Yu a W. Zhuang, „Štúdia rámca ochrany súkromia pre cloudové úložisko“, Computer Science and Information Systems, roč. 8, č. 3, s. 801-819, 2011.

[26] WK Wong, DW Cheung, B. Kao a N. Mamoulis, „Zabezpečený výpočet kNN na šifrovaných databázach“, v zborníku z medzinárodnej konferencie o správe údajov a 28. sympózia o zásadách databázových systémov (SIGMOD-PODS) 09), s. 139-152, Providence, RI, USA, júl 2009.

[27] H. Sagan, Space-Filling Curves, Springer, Berlín, Nemecko, 1994.

[28] J. A. Orenstein, „Priestorové spracovanie dotazov v objektovo orientovanom databázovom systéme“, v zborníku z medzinárodnej konferencie ACM SIGMOD International Conference on Management of Data, s. 326-336, Washington, DC, USA, 1986.

[29] H. V. Jagadish, „Lineárne zhlukovanie objektov s viacerými atribútmi“, v zborníku z medzinárodnej konferencie ACM SIGMOD International Conference on Management of Data, s. 332-342, Atlantic City, New Jersey, USA, máj 1990.

[30] J. K. Lawder a P. J. H. King, „Dotazovanie sa na viacrozmerné údaje indexované pomocou Hilbertovej krivky plnenia priestoru“, SIGMOD Record, zv. 30, č. 1, s. 19-24, 2001.

[31] H. Samet, „The quadtree and related hierarchical data structures,“ ACM Computing Surveys, vol. 16, č. 2, str. 187-260, 1984.

[32] "Skutočné súbory údajov pre priestorové databázy: cestné siete a body záujmu [EB/OL]," http://www.cs.utah.edu/

lifeifei/ Spatial Dataset htm

[33] X. Liu a G. Schrack, „Kódovanie a dekódovanie Hilbertovho rádu“, Software: Practice and Experience, zv. 26, č. 12, s. 1335-1346, 1996.

[34] C. Faloutsos a S. Roseman, „Fraktály pre vyhľadávanie sekundárnych kľúčov“, v zborníku z 8ht sympózia ACM SIGACT-SIGMOD SIGART o princípoch databázových systémov, s. 247-252, Philadelphia, Pa, USA, marec 1989 .

Feng Tian, ​​(1,2) Xiaolin Gui, (1,2) Jian An, (1,2) Pan Yang, (1,2) Jianqiang Zhao, (1,2) a Xuejun Zhang (1,2)

(1) School of Electronics and Information Engineering, Xian Jiaotong University, Xian 710049, China

(2) Shaanxi Province Key Laboratory of Computer Network, Xian Jiaotong University, Xian 710049, Čína


Financovaný projekt: Prístup založený na dátovej syntéze k miestnemu sociálnemu snímaniu

Financované kanceláriou UW-Madison prorektora pre výskum a postgraduálne vzdelávanie (VCRGE) a nadáciou Wisconsin Alumni Research Foundation (WARF).

Názvy miest a sémantika miest opísaných v prirodzených jazykoch, nie ako súradnice (tj. Zemepisná dĺžka a šírka), sú v ľudskom diskurze, dokumentoch a sociálnych médiách všadeprítomné, zatiaľ čo na mapovanie alebo prepájanie ďalších informácií je potrebné určiť polohu. Stále však existuje medzera medzi neformálnymi alebo vágnymi poznávacími výrazmi miesta (napr. Centrum, susedstvo, severný Wisconsin) a formálnymi výpočtovými reprezentáciami miesta v počítačových informačných systémoch. Kognitívne oblasti a miesta je notoricky ťažké reprezentovať v geografickej informačnej vede a systémoch. Vznikajú komplexnými interakciami jednotlivcov, spoločnosti a životného prostredia.

Vznik veľkých dát prináša nové príležitosti na lepšie pochopenie nášho geografického a sociálno -ekonomického prostredia. V tomto výskume budeme syntetizovať viaczdrojové množiny údajov zo sčítania ľudu, sociálnych sietí založených na polohe, spravodajských médií, Wikipédie, blogov o cestovaní a ďalších webových stránok s otvorenými údajmi a s využitím teórie miesta, spracovania prirodzeného jazyka, strojového učenia a vizualizácie. techniky na extrakciu a reprezentáciu vágnych kognitívnych miest. Výskum tiež pomôže lepšie porozumieť pozorovaniam, skúsenostiam a expozíciám jednotlivcov na rôznych typoch miest a okolitého sociálneho prostredia.

Gao, S., Janowicz, K., Montello, DR, Hu, Y., Yang, JA, McKenzie, G., Ju, Y., Gong, L., Adams, B., & amp Yan, B. (2017 ). Metóda riadená syntézou údajov na detekciu a extrahovanie vágnych kognitívnych oblastí. International Journal of Geographic Information Science, 31(6), 1245-1271.

Gao, S., Li, L., Li, W., Janowicz, K., & amp Zhang, Y. (2017). Konštrukcia gazetárov z dobrovoľných veľkých geodát na základe Hadoop. Počítače, životné prostredie a mestské systémy, 61, 172-186.

Gao, S., Janowicz, K., McKenzie, G., & amp Li, L. (2013, november). K platinovým spojeniam a nárazníkom v GIS založenom na mieste. V Zborník z prvého medzinárodného workshopu ACM SIGSPATIAL o počítačových modeloch miesta (s. 42-49).

Yan, B., Janowicz, K., Mai, G., & amp Gao, S. (2017, november). Od ITDL k Place2Vec: Zdôvodnenie podobnosti a príbuznosti typu miesta učením sa vkladania z rozšírených priestorových kontextov. V Zborník z 25. medzinárodnej konferencie ACM SIGSPATIAL o pokrokoch v geografických informačných systémoch (s. 35). ACM.


Množiny údajov POI pre Severnú Ameriku - geografické informačné systémy

Formát údajov: Osobná trieda funkcií GeoDatabase

Názov súboru alebo tabuľky: BodyInterest04

Súradnicový systém: Univerzálny priečny mercator

Kľúčové slová témy: Losos atlantický, prieskum biotopov, body záujmu

Metadáta FGDC a ESRI:

Identifikačné informácie:

Citácia: Citačné informácie: Pôvodcovia: Americká služba pre ryby a voľne žijúce zvieratá - Pobrežný program zálivu Maine

Názov: Body záujmu *Názov súboru alebo tabuľky: BodyInterest04

Dátum publikácie: 20060331 *Forma prezentácie geopriestorových údajov: vektorové digitálne údaje

Väčšia citácia práce: Citačné informácie: Pôvodcovia: Maine Atlantic Lososova komisia

Názov: Prieskumy biotopu lososa atlantického

Dátum publikácie: 20060131 Forma prezentácie geopriestorových údajov: vektorové digitálne údaje

Popis:

*Jazyk množiny údajov: en

Časové obdobie obsahu: Informácie o časovom období: Jediný dátum/čas: Dátum kalendára: 20060331

Mesto: Falmouth Štát alebo provincia: JA Poštové smerovacie číslo: 04105 Krajina: USA
Kontaktný hlasový telefón: 207-781-8364 Kontaktujte faxový telefón: 207-781-8369

Kontaktná adresa elektronickej pošty: [email protected]

Prevádzková doba: M -F od 8:00 do 16:00


*Natívny formát množiny údajov: Osobná trieda funkcií GeoDatabase *Natívne prostredie množiny údajov: Microsoft Windows XP verzia 5.1 (zostava 2600) Service Pack 2 ESRI ArcCatalog 9.1.0.722

Späť na začiatok Informácie o kvalite údajov:

Presnosť atribútu:

Rodokmeň: Informácie o zdroji: Citácia zdroja: Citačné informácie: Pôvodcovia: US Fish & amp Wildlife Service - Pobrežný program zálivu Maine

Názov: Prieskumy biotopu lososa atlantického

Dátum publikácie: 20060331 Forma prezentácie geopriestorových údajov: vektorové digitálne údaje

Ďalšie citačné údaje: Súbory GPS Trimble .ssf sú rozdielne opravené softvérom Trimble Pathfinder Office pomocou údajov komunitnej základňovej stanice University of Maine.

Typ zdrojového média: disk

Dátum postupu: 20060131

Procesný kontakt: Kontaktné informácie: Kontaktovať primárnu organizáciu: Kontaktná organizácia: US Fish & amp Wildlife Service, Pobrežný program zálivu Maine
Kontaktná adresa: Typ adresy: poštovú a fyzickú adresu

Mesto: Falmouth Štát alebo provincia: JA Poštové smerovacie číslo: 04105 Krajina: USA
Kontaktný hlasový telefón: 207-781-8364 Kontaktujte faxový telefón: 207-781-8369

Kontaktná adresa elektronickej pošty: [email protected]

Prevádzková doba: M -F od 8:00 do 16:00


Krok procesu:

Krok procesu:

Použitá skratka citácie zdroja: ALEX2000 C proj Alex gps2003 Habitat03Edit.mdb

Krok procesu:

Použitá skratka citácie zdroja: ALEXXP C proj Alex gps2003 Habitat03.mdb

Krok procesu:

Krok procesu:

Použitá skratka citácie zdroja: ALEXXP proj Alex gps2005 Habitat05Edit.mdb

Krok procesu:

Použitá skratka citácie zdroja: ALEXXP proj Alex gps2005 Habitat05Edit.mdb

Krok procesu:

Použitá skratka citácie zdroja: ALEXXP proj Alex gps2005 Habitat05Edit.mdb

Späť na začiatok Informácie o organizácii priestorových údajov:

*Metóda priamej priestorovej referencie: Vektor

Informácie o bodových a vektorových objektoch: Popis pojmov SDTS: *Názov: PointsOfInterest04 *Typ bodu a vektorového objektu SDTS: Entity point Počet bodových a vektorových objektov: 2,607
Popis pojmov SDTS: Typ bodu a vektorového objektu SDTS: Bod Počet bodových a vektorových objektov: 4
Popis pojmov SDTS: Typ bodu a vektorového objektu SDTS: Zložený predmet Počet bodových a vektorových objektov: 3
Popis výrazov ESRI: *Názov: PointsOfInterest04 *Typ funkcie ESRI: Jednoduché *Geometria funkcií ESRI: Bod *Topológia ESRI: FALSE *Počet funkcií ESRI: 2427 *Priestorový index: PRAVDA *Lineárne odkazovanie: NEPRAVDA

Späť na začiatok Priestorové referenčné informácie:

Definícia horizontálneho súradnicového systému: Názov súradnicového systému: *Predpokladaný názov súradnicového systému: NAD_1983_UTM_Zone_19N *Názov geografického súradnicového systému: GCS_North_American_1983
Rovinné: Súradnicový systém mriežky: *Názov súradnicového systému mriežky: Univerzálny priečny mercator Univerzálny priečny Mercator: *Číslo zóny UTM: 19 Priečny mercator: *Faktor stupnice v centrálnom poludníku: 0.999600 *Zemepisná dĺžka stredného poludníka: -69.000000 *Zemepisná šírka pôvodu projekcie: 0.000000 *Falošný východ: 500000.000000 *Falošné veci: 0.000000
Informácie o planárnych súradniciach: *Metóda kódovania rovinných súradníc: súradnicový pár Súradnicové zobrazenie: *Rozlíšenie abscissa: 0.010000 *Usporiadané uznesenie: 0.010000 *Jednotky planárnej vzdialenosti: metrov
Geodetický model: *Horizontálny názov dátumu: Severoamerický dátum z roku 1983 *Názov elipsoidu: Geodetický referenčný systém 80 *Semi-major os: 6378137.000000 *Menovateľ pomeru sploštenia: 298.257222
Definícia vertikálneho súradnicového systému: Definícia výškového systému: Rozlíšenie nadmorskej výšky: 0.000010 Metóda kódovania nadmorskej výšky: Explicitná výšková súradnica je súčasťou horizontálnych súradníc
Späť na začiatok Informácie o entite a atribúte:

Detailný popis: *Názov: BodyInterest04

Typ entity: Typový štítok subjektu: Body záujmu *Typ typu entity: Trieda funkcií *Počet typov entít: 2427 Definícia typu entity: Tabuľka atribútov bodov Zdroj definície typu entity: MASC
Atribút: *Atribútový štítok: JoinID *Alias ​​atribútu: JoinID

*Typ atribútu: Reťazec *Šírka atribútu: 17 *Presnosť atribútu: 0 *Rozsah atribútov: 0

Atribút: *Atribútový štítok: Drenáž *Alias ​​atribútu: Drenáž

*Typ atribútu: Reťazec *Šírka atribútu: 20 *Presnosť atribútu: 0 *Rozsah atribútov: 0

Atribút: *Atribútový štítok: Typ *Alias ​​atribútu: Napíšte

*Typ atribútu: Reťazec *Šírka atribútu: 20 *Presnosť atribútu: 0 *Rozsah atribútov: 0

Priradiť hodnoty domény: Vyčíslená doména: Vyčíslená hodnota domény: Prístup

Počiatočný dátum hodnôt atribútov: 2001 Dátum ukončenia hodnôt atribútov: 2005

Atribút: *Atribútový štítok: Štítok *Alias ​​atribútu: Štítok

*Typ atribútu: Reťazec *Šírka atribútu: 50 *Presnosť atribútu: 0 *Rozsah atribútov: 0

Atribút: *Atribútový štítok: Select_ *Alias ​​atribútu: Select_

*Typ atribútu: Celé číslo *Šírka atribútu: 4 *Presnosť atribútu: 0 *Rozsah atribútov: 0

Priradiť hodnoty domény: Vyčíslená doména: Vyčíslená hodnota domény: 0

Počiatočný dátum hodnôt atribútov: 2001 Dátum ukončenia hodnôt atribútov: 2005

Atribút: *Atribútový štítok: Komentár *Alias ​​atribútu: Komentovať

*Typ atribútu: Reťazec *Šírka atribútu: 70 *Presnosť atribútu: 0 *Rozsah atribútov: 0

Atribút: *Atribútový štítok: Komentár2 *Alias ​​atribútu: Komentár 2

*Typ atribútu: Reťazec *Šírka atribútu: 40 *Presnosť atribútu: 0 *Rozsah atribútov: 0

Atribút: *Atribútový štítok: ObsType *Alias ​​atribútu: ObsType

*Typ atribútu: Reťazec *Šírka atribútu: 11 *Presnosť atribútu: 0 *Rozsah atribútov: 0

Priradiť hodnoty domény: Vyčíslená doména: Vyčíslená hodnota domény: Bobor

Počiatočný dátum hodnôt atribútov: 2000 Dátum ukončenia hodnôt atribútov: 2005

Atribút: *Atribútový štítok: Priechodný *Alias ​​atribútu: Priechodné

*Typ atribútu: Reťazec *Šírka atribútu: 10 *Presnosť atribútu: 0 *Rozsah atribútov: 0

Priradiť hodnoty domény: Vyčíslená doména: Vyčíslená hodnota domény: Áno

Počiatočný dátum hodnôt atribútov: 2000 Dátum ukončenia hodnôt atribútov: 2005

Atribút: *Atribútový štítok: ObHeight *Alias ​​atribútu: ObsHeight

*Typ atribútu: Reťazec *Šírka atribútu: 10 *Presnosť atribútu: 0 *Rozsah atribútov: 0

Atribút: *Atribútový štítok: ObLength *Alias ​​atribútu: ObLength

*Typ atribútu: Reťazec *Šírka atribútu: 11 *Presnosť atribútu: 0 *Rozsah atribútov: 0

Atribút: *Atribútový štítok: DWDepth *Alias ​​atribútu: DWDepth

*Typ atribútu: Reťazec *Šírka atribútu: 10 *Presnosť atribútu: 0 *Rozsah atribútov: 0

Atribút: *Atribútový štítok: Vehicle_AC *Alias ​​atribútu: Vehicle_AC

*Typ atribútu: Reťazec *Šírka atribútu: 23 *Presnosť atribútu: 0 *Rozsah atribútov: 0

Počiatočný dátum hodnôt atribútov: 2000 Dátum ukončenia hodnôt atribútov: 2005

Atribút: *Atribútový štítok: Boat_Trail *Alias ​​atribútu: Boat_Trail

*Typ atribútu: Reťazec *Šírka atribútu: 23 *Presnosť atribútu: 0 *Rozsah atribútov: 0

Atribút: *Atribútový štítok: Canoe_Acce *Alias ​​atribútu: Kanoe_Acce

*Typ atribútu: Reťazec *Šírka atribútu: 23 *Presnosť atribútu: 0 *Rozsah atribútov: 0

Atribút: *Atribútový štítok: Orientácia *Alias ​​atribútu: Orientácia

*Typ atribútu: Reťazec *Šírka atribútu: 20 *Presnosť atribútu: 0 *Rozsah atribútov: 0

Atribút: *Atribútový štítok: Trib_Wetwidth *Alias ​​atribútu: Kmeň_Mokrá šírka

*Typ atribútu: Reťazec *Šírka atribútu: 14 *Presnosť atribútu: 0 *Rozsah atribútov: 0

Atribút: *Atribútový štítok: Trib_CtrDepth *Alias ​​atribútu: Trib_CtrHĺbka

*Typ atribútu: Reťazec *Šírka atribútu: 14 *Presnosť atribútu: 0 *Rozsah atribútov: 0

Atribút: *Atribútový štítok: Trib_Flow *Alias ​​atribútu: Trib_Flow

*Typ atribútu: Reťazec *Šírka atribútu: 14 *Presnosť atribútu: 0 *Rozsah atribútov: 0

Atribút: *Atribútový štítok: Trib_Velocity *Alias ​​atribútu: Trib_Velocity

*Typ atribútu: Reťazec *Šírka atribútu: 14 *Presnosť atribútu: 0 *Rozsah atribútov: 0

Atribút: *Atribútový štítok: Názov kmene *Alias ​​atribútu: Názov kmene

*Typ atribútu: Reťazec *Šírka atribútu: 30 *Presnosť atribútu: 0 *Rozsah atribútov: 0

Atribút: *Atribútový štítok: Trib_Temp *Alias ​​atribútu: Trib_Temp

*Typ atribútu: Reťazec *Šírka atribútu: 12 *Presnosť atribútu: 0 *Rozsah atribútov: 0

Atribút: Atribútový štítok: Tvar

Priradiť hodnoty domény: Reprezentatívna doména: Súradnice definujúce vlastnosti.

Počiatočný dátum hodnôt atribútov: 1994 Dátum ukončenia hodnôt atribútov: 2005

Atribút: Atribútový štítok: Prúd

*Typ atribútu: Reťazec *Šírka atribútu: 12 *Presnosť atribútu: 0 *Rozsah atribútov: 0

Atribút: *Atribútový štítok: Seep_Temp *Alias ​​atribútu: Seep_Temp

*Typ atribútu: Reťazec *Šírka atribútu: 12 *Presnosť atribútu: 0 *Rozsah atribútov: 0

Atribút: *Atribútový štítok: Údajový súbor *Alias ​​atribútu: Dátový súbor

*Typ atribútu: Reťazec *Šírka atribútu: 14 *Presnosť atribútu: 0 *Rozsah atribútov: 0

Atribút: *Atribútový štítok: Point_ID *Alias ​​atribútu: Point_ID

*Typ atribútu: Reťazec *Šírka atribútu: 10 *Presnosť atribútu: 0 *Rozsah atribútov: 0

Detailný popis: *Názov: Anno_POI

Typ entity: *Typový štítok subjektu: Anno_POI *Typ typu entity: Vzťah Definícia typu entity: Tabuľka vzťahov anotácií Zdroj definície typu entity: ESRI
Atribút: Atribútový štítok: FID

Priradiť hodnoty domény: Reprezentatívna doména: Sekvenčné jedinečné celé čísla, ktoré sa generujú automaticky.

Atribút: Atribútový štítok: Tvar

Priradiť hodnoty domény: Reprezentatívna doména: Súradnice definujúce vlastnosti.

Atribút: Atribútový štítok: DISTANCE#

Priradiť hodnoty domény: Reprezentatívna doména: Sekvenčné jedinečné celé čísla, ktoré sa generujú automaticky.

Atribút: Atribútový štítok: ID VZDIALENOSTI

Späť na začiatok Informácie o distribúcii:

Distribútor: Kontaktné informácie: Kontaktovať primárnu organizáciu: Kontaktná organizácia: US Fish & amp Wildlife Service - Pobrežný program zálivu Maine
Kontaktná adresa: Typ adresy: poštovú a fyzickú adresu

Mesto: Falmouth Štát alebo provincia: JA Poštové smerovacie číslo: 04105 Krajina: USA
Kontaktný hlasový telefón: 207-781-8364 Kontaktujte faxový telefón: 207-781-8369

Kontaktná adresa elektronickej pošty: [email protected]

Prevádzková doba: M -F od 8:00 do 16:00


Popis zdroja: Prieskum biotopu lososa v Maine

Štandardný postup objednávky: Digitálna forma: Informácie o digitálnom prenose: Názov formátu: Trieda funkcií osobnej geodatabázy ArcGIS Formát čísla verzie: ArcGIS 9.1 Dekompresná technika súborov: nie je použitá žiadna kompresia
Možnosť digitálneho prenosu: Offline možnosť: Offline médiá: CD-ROM
Dostupné časové obdobie: Informácie o časovom období: Jediný dátum/čas: Dátum kalendára: 20060331
Späť na začiatok Referenčné informácie o metadátach:

*Dátum metadát: 20110913

*Jazyk metadát: en

Kontakt na metadáta: Kontaktné informácie: Kontaktovať primárnu organizáciu: Kontaktná osoba: Alex Abbott Kontaktná organizácia: Americká služba pre ryby a voľne žijúce zvieratá - Pobrežný program zálivu Maine
Kontaktná adresa: Typ adresy: poštovú a fyzickú adresu

Mesto: Falmouth Štát alebo provincia: JA Poštové smerovacie číslo: 04105
Kontaktný hlasový telefón: 207-781-8364 Kontaktujte faxový telefón: 207-781-8369

Kontaktná adresa elektronickej pošty: [email protected]

Prevádzková doba: M -F od 8:00 do 16:00


*Štandardný názov metadát: Štandardy obsahu FGDC pre digitálne geopriestorové metadáta *Štandardná verzia metadát: FGDC-STD-001-1998 *Konvencia času metadát: miestny čas

Rozšírenia metadát: Online prepojenie: http://www.esri.com/metadata/esriprof80.html Meno profilu: Profil metadát ESRI
Rozšírenia metadát: Online prepojenie: http://www.esri.com/metadata/esriprof80.html Meno profilu: Profil metadát ESRI
Rozšírenia metadát: *Online prepojenie: http://www.esri.com/metadata/esriprof80.html *Meno profilu: Profil metadát ESRI
Späť na začiatok Binárne skrinky:

Miniatúra: Typ skrinky: Obrázok


Späť na začiatok Posledná aktualizácia: 13. septembra 2011

Ak máte otázky týkajúce sa tohto webu, kontaktujte Bob Houston, GOMP GIS/Systems Manager. Oficiálne vyhlásenie o odmietnutí zodpovednosti USAFWS.


Severoamerické morské ekoregióny

Tento súbor údajov ukazuje severoamerické morské ekoregióny. Morské ekoregióny sú oblasti, ktoré spadajú do výhradných ekonomických zón severoamerických krajín a ktoré majú všeobecnú podobnosť z hľadiska fyziografických, oceánografických a biologických charakteristík. Tieto morské ekoregióny sú konštruované ako priestorový rámec s tromi vnorenými úrovňami. Údaje majú byť škálovateľné: vhodné pre perspektívy a záujmy, ktoré sa líšia rozsahom od regionálneho po kontinentálny, zamerané na ekosystém: založené na rade prepojených biologických, oceánografických a fyziografických charakteristík a prepojené: súvisiace s inými súbormi údajov o moriach a suchozemských oblastiach, klasifikácia systémy a disciplíny.

24 morských ekoregiónov úrovne I zachytáva rozdiely v ekosystémoch v najvšeobecnejšom meradle zoskupením veľkých vodných hmôt a prúdov, uzavretých morí a oblastí súvislej teploty povrchu mora alebo ľadovej pokrývky. Morské ekoregióny úrovne 86 II zachytávajú prielom medzi pobrežnými a oceánskymi oblasťami s hranicami určenými rozsiahlymi prvkami, ako sú kontinentálne šelf, kontinentálny svah, hlavné zákopy a ďalšie prvky. Úroveň II odráža dôležitosť hĺbky ako ako aj dôležitosť hlavných fyziografických znakov pri určovaní súčasných tokov a upwelling. 86 Morské ekoregióny úrovne III zachytávajú rozdiely v blízkosti pobrežia a sú založené na miestnych charakteristikách vodnej masy, regionálnych fyziografických vlastnostiach a typoch biologických spoločenstiev. Ekoregióny III sú definované iba pre kontinentálny šelf, pretože ide o jedinú oceánsku oblasť, pre ktorú sú k dispozícii dostatočné informácie na vymedzenie jemnejších oblastí.

Hranice morských ekoregiónov smerom k moru, ako sú zmapované, sú približné a nepredstavujú skutočné hranice ekoregiónov smerom k moru ani presnú hranicu výhradných ekonomických zón týchto troch krajín.

Údaje zo Severoamerického atlasu sú určené na geografické zobrazenie a analýzu na národnej a kontinentálnej úrovni. Tieto údaje by sa mali zobrazovať a analyzovať v mierkach vhodných pre údaje v mierke 1: 10 000 000. Komisia pre environmentálnu spoluprácu nepreberá žiadnu zodpovednosť za používanie tieto údaje.

Morské ekoregióny Severnej Ameriky, 2008, sú určené na podporu výskumu, vzdelávania, inventarizácie, monitorovania, plánovania, riadenia a ochrany severoamerických morských zdrojov a ekosystémov.

Údaje poskytol: Pôvodca: Komisia pre spoluprácu v oblasti životného prostredia
Dátum publikácie: 2009
Názov: Morské ekoregióny Severnej Ameriky, 2008
Geospatial_Data_Presentation_Form: Vektorové digitálne údaje
Publication_Information:
Miesto publikácie: Montréal, Québec, Kanada
Vydavateľ: Komisia pre spoluprácu v oblasti životného prostredia
Online_Linkage: http://www.cec.org/naatlas/
Údaje hostuje: ScienceBase (USGS) Zobraziť adresu URL služby Record Map Service: https://www.sciencebase.gov/arcgis/rest/services/Catalog/52e185e0e4b0d0c3df9a39b7/MapServer/ Dátum obsahu: neuvedené Citácia: Ďalšie informácie o vývoji Súbor údajov o morských ekoregiónoch vrátane metodiky, definícií, zoznamu účastníkov a ďalších základných informácií je k dispozícii v návrhu správy Spaces: Marine Ecoregions of North America Commission for Environmental Cooperation Montréal, Québec, Canada 2007
Organizácia kontaktu: neuvedené Kontaktné osoby: neuvedené Obmedzenia použitia: Toto dielo je chránené licenciou Creative Commons Attribution 3.0 License.

Množiny údajov POI pre Severnú Ameriku - geografické informačné systémy

Okrem formátov súborov je tiež dôležité vyvinúť dokumentáciu vrátane metadát, aby sa uľahčilo uchovávanie, zisťovanie údajov a opätovné použitie. Dokumentácia je jedným zo základných kameňov archívnej praxe a mala by existovať interne, aby sa uľahčila správa údajov o projekte. Ako je zdôraznené pri identifikácii typov súborov, proces dokumentácie by sa mal aktívne vykonávať od začiatku projektu, pretože je často ťažké vytvoriť ho retrospektívne. Napriek tomu, že dokumentácia (ako informácia) je v samotných súboroch často implicitná, oddelené uchovávanie týchto informácií nielenže uľahčuje zisťovanie zdrojov a správu údajov, ale tiež umožňuje samotným súborom prechádzať transformáciami (uchovávaním alebo iným spôsobom) bez toho, aby bola dotknutá integrita súvisiacich metadát alebo dokumentácie. .

Metadáta a komponenty dokumentácie, ktoré by mali byť súčasťou námorného archívu, sú popísané v časti 3.1 Rozhodovanie o tom, čo archivovať, a podrobný súbor metadát je uvedený v časti 3.8 Metadáta a dokumentácia. V súčasnosti však existuje aj niekoľko štandardov metadát, ktoré sú pre námorné údaje veľmi dôležité, a budú sa o nich diskutovať v nasledujúcej časti, ako aj v častiach zameraných na konkrétne techniky námorného prieskumu.

Metadáta pre námorné projekty

Ako je uvedené vyššie, je dôležité, aby sa metaúdaje vytvárali počas aktívneho generovania a spracovania údajov projektu. Práve v týchto bodoch majú tvorcovia najjasnejšiu predstavu o tom, aké informácie jednotlivé súbory obsahujú, kde boli zhromaždené, ako boli zhromaždené a ako boli následne spracované. Okrem pomoci pri správe a zbere údajov v rámci projektu sú metaúdaje a dokumentácia navrhnuté tak, aby pomáhali druhým objavovať, opätovne používať, interpretovať a spravovať údaje.

Metadáta je možné použiť na dokumentáciu mnohých rôznych aspektov projektu na mnohých rôznych úrovniach. Je možné ho zaznamenať široko pre projekt ako celok alebo pre množiny údajov od konkrétnych techník až po metadáta pre konkrétne súbory. Pri vytváraní metadát je dôležité, kde je to možné, identifikovať a dodržiavať relevantné a zavedené štandardy metadát a dokumentácie. Je dôležité si tiež uvedomiť, že štandardy metadát sa líšia nielen podľa príslušných techník, ale aj podľa geografickej oblasti. Ak je dlhodobé uchovávanie v digitálnom archíve jedným zo zamýšľaných cieľov projektu, je preto potrebné určiť štandardy metaúdajov požadované príslušným archívom. Cieľom tejto časti je identifikovať niekoľko zavedených štandardov metadát, ktoré sú konkrétne relevantné pre údaje o námorných projektoch.

Všeobecné normy pre námorné údaje

Geografické metadáta majú osobitný význam pre námorné projekty vzhľadom na prominentnú geografickú zložku akvizičných techník. V zásade všetky morské výstupy, surové alebo spracované, majú priestorový prvok, či už je definovaný ako región alebo konkrétny bod. Na národnej i medzinárodnej úrovni bolo vyvinutých niekoľko štandardov pokrývajúcich geografické údaje a je vhodné, aby si ich tvorcovia údajov boli vedomí, pretože sa na ne často odkazuje v štandardoch metadát špecifických pre more.

  • Norma ISO 19115: 2003 pre geografické informácie - metadáta [1] definuje povinné a podmienené sekcie metaúdajov, entity metadát a prvky metaúdajov na opis geografických informácií. Norma tiež definuje minimálny súbor metadát potrebných na obsluhu celého radu aplikácií (zisťovanie údajov, určovanie vhodnosti údajov na použitie, prístup k údajom, prenos údajov a používanie digitálnych údajov). Okrem toho sú popísané voliteľné prvky metadát, ktoré umožňujú rozsiahlejší štandardný popis geografických údajov, čo umožňuje rozšírenie súborov metadát tak, aby vyhovovali špecializovaným potrebám.
  • UK GEMINI (Association for Geographic Information, 2010) je britský štandard metadát (v súlade s ISO 19115) pre geopriestorové súbory údajov.
  • Severoamerický profil (NAP) normy ISO 19115 [2] je variáciou normy ISO v USA.

Stojí za zmienku, že podľa smernice INSPIRE [3] pravdepodobne existujú ďalšie regionalizované špecifikácie vyvinuté pre európske krajiny.

Napriek tomu, že väčšina informácií, ktoré sa zdajú byť dôležité pre úspešné riadenie a opätovné použitie údajov o námorných projektoch, evidentne nezapadá do normy ISO, niektoré informácie z nich môžu obsahovať tieto informácie. Metadáta o použitom zariadení, nastaveniach, metodike, presnosti a softvéri, ako sú podrobne popísané v časti 3 tejto príručky, sa môžu hodiť do britského GEMINI (alebo iného európskeho ekvivalentu kompatibilného s INSPIRE) Abstrakt prvok, ktorý špecifikácia uvádza z hľadiska použitia:

  • Uveďte, aké „veci“ sú zaznamenané
  • Uveďte kľúčové aspekty zaznamenané o týchto veciach
  • Uveďte, akú formu majú údaje
  • Uveďte akékoľvek ďalšie obmedzujúce informácie, napríklad časové obdobie platnosti údajov
  • Prípadne pridajte účel zdroja údajov (napr. Pre údaje z prieskumu)
  • Cieľom je, aby mu porozumeli neodborníci
  • Neuvádzajte všeobecné základné informácie
  • Vyhnite sa žargónu a nevysvetliteľným skratkám.

Prípadne Zdroj dodatočných informácií prvok by sa mohol použiť na poukázanie na súvisiacu dokumentáciu, ako je stručný prehľad prieskumu. Nedostatok vzťahového prvku v súbore metadát ISO 19115 by sa mohol považovať za nedostatok. Tieto informácie je možné zaznamenať aj v súvisiacej dokumentácii, na ktorú sa odkazuje v dokumente Zdroj dodatočných informácií element. Niektoré normy ISO 19115 podporujú a Rodokmeň prvok, ktorý možno použiť na zaznamenanie „informácií o udalostiach alebo zdrojových údajoch použitých pri vytváraní súboru údajov“. Ten je obzvlášť dôležitý v prípade distribuovaných archívov, kde môžu byť zdrojové údaje a odvodené množiny údajov archivované s inou organizáciou. Lineage je však iba jedným z radu možných vzťahov, ktoré môže mať digitálny objekt alebo množina údajov.

Námorné špecifické normy

Ako je uvedené v oddiele 1.3 tejto príručky („Súčasné ustanovenia a iniciatívy“), na vnútroštátnej i medzinárodnej úrovni existuje množstvo iniciatív, ktoré v súčasnosti pracujú na vytváraní noriem, zdieľaní metadát a umožňovaní prístupu k morským súborom údajov. Aj keď je konkrétny generický súbor metadát popísaný v časti 3 tejto príručky, tvorcovia údajov by si mali uvedomiť, že určité dátové centrá budú mať špecifické požiadavky.

Medzinárodná hydrografická organizácia (IHO) vypracovala dokument „Infraštruktúry priestorových údajov“ „Marine Dimension“ (2009), v ktorom sa odporúča vytvoriť metadáta na správnu charakteristiku morských údajov, uľahčenie objavovania, získavania a opätovného použitia údajov a na to, aby boli v súlade s normu ISO 19115, aby bola zaistená plná interoperabilita. Dokument predovšetkým zdôrazňuje dôležitosť zaznamenávania použitých geografických referenčných systémov. Predchádzajúci dokument (IHO 2008, kapitola 5) okrem toho načrtáva prvky metaúdajov, ktoré odporúča IHO, aby boli zaznamenané s cieľom posúdiť kvalitu súborov údajov z prieskumov.

Vo Veľkej Británii spoločnosť MEDIN vydala niekoľko dokumentov, ktoré uvádzajú prvky metaúdajov, ktoré by mali byť zaznamenané pri odosielaní údajov ich dátovým centrám. Štruktúra usmernení pre údaje MEDIN [4] uvádza konkrétne metaúdaje, ktoré by sa mali zaznamenávať pri zbere údajov, a zahŕňa okrem iného aj úroveň projektu, podrobnosti prieskumu a podrobnosti o stanici. Okrem toho má spoločnosť MEDIN definovanú sadu „Štandardných vyhľadávacích metadát“, špecifikáciu vyhovujúcu štandardom (INSPIRE, ISO19115, GEMINI2) používanú na zaznamenávanie metadát množiny údajov štandardným a ľahko zdieľateľným spôsobom. Samotné prvky sú popísané v Seeley a kol (2009) a na webovej stránke MEDIN je k dispozícii množstvo nástrojov na vytváranie takýchto metadát [5]. Webová stránka MEDIN ponúka aj niekoľko odkazov na externé námorné normy [6].

V Severnej Amerike existuje niekoľko všeobecných geopriestorových špecifikácií uvedených v NAP ISO19115 a Obsahovom štandarde pre digitálne geopriestorové metadáta (CSDGM) [7] (existujú aj podporné príručky na pomoc pri vytváraní týchto metaúdajov [8] [9] ]). Príručka predkladania údajov amerického Národného centra oceánografických údajov (NODC) [10] uvádza minimálnu špecifikáciu metadát na vytváranie údajov (časť 4) pre morské údaje a je podobná rozsahu dokumentu National Spatial Data Infrastructure (2005) „časť o normách presnosti geopriestorového určovania polohy“ 5: Štandardy pre námorné mapovacie hydrografické prieskumy “. Za zmienku tiež stojí, že projekt interoperability námorných metadát (MMI) [11], ktorý bol vytvorený s cieľom poskytnúť usmernenie k morským metadátam v Severnej Amerike, má za sebou mnoho pokrokov v procese uľahčovania výmeny metadát a môže poskytovať významné objasnenie a vývoj súčasnej situácie v budúcnosti.

Dodatočná dokumentácia

Skladá sa z čohokoľvek, čo uľahčí uchovanie a opätovné použitie množiny údajov. Môžu to byť napríklad publikované správy, krátke správy zo sivej literatúry alebo dokonca niekoľko naskenovaných strán z prenosného počítača. Môžu poskytovať informácie, ktoré chýbajú v záznamoch metadát, ich podporu alebo podrobnejšie údaje. Často môžu poskytnúť ďalšie kontextové informácie o tom, ako do seba súbor údajov zapadá. Dokumentácia môže mať osobitný význam pre údaje o morských projektoch, ak množstvo prieskumných techník zahŕňa sériu prechodov priestorovo vymedzenou oblasťou. Kompozitné mozaiky je možné vyrábať buď ako súčasť akvizície, alebo ako súčasť následného spracovania. V druhom prípade je zrejmé, že je dôležité dokumentovať, ako sa údaje z každého traverzu týkajú ostatných. Existuje možnosť použiť súbor Zdroj dodatočných informácií alebo podobný prvok v norme metadát kompatibilných s ISO 19115, aby na tieto informácie poukazoval. Silná a dodržaná konvencia pomenovania súborov to môže tiež posilniť.

[1] http://www.iso.org/iso/iso_catalogue/catalogue_tc/catalogue_detail.htm?csnumber=26020
[2] http://www.fgdc.gov/metadata/geospatial-metadata-standards#nap
[3] http://inspire.jrc.ec.europa.eu/index.cfm/pageid/48
[4] http://www.oceannet.org/marine_data_standards/medin_data_guide2.html
[5] http://www.oceannet.org/marine_data_standards/medin_disc_stnd.html
[6] http://www.oceannet.org/marine_data_standards/other_marine_data_standards/
[7] http://www.fgdc.gov/metadata/geospatial-metadata-standards
[8] http://www.fgdc.gov/metadata/metadata-publications-list
[9] http://www.fgdc.gov/metadata/online-metadata-resources
[10] http://www.nodc.noaa.gov/General/NODC-Submit/submit-guide.html
[11] http://marinemetadata.org/


Množiny údajov POI pre Severnú Ameriku - geografické informačné systémy

BJ Holtgrewe, senior produktový manažér/technický evanjelista spoločnosti MapPoint, hovorí o dovozcovi priestorových údajov

Svet funkcií obchodného mapovania poskytovaný v programe MapPoint 2002 je pomerne bohatý, keď sa zhoduje s špičkovými funkciami poskytovanými tradičnými geografickými informačnými systémami (GIS). Podľa plánu je služba MapPoint zameraná na koncových používateľov, ktorí hľadajú riešenie každodenného mapovania podniku, a podľa návrhu nevyžaduje titul z kartografie.

Typický znalostný pracovník vie, čo chce s mapami robiť, ale vníma ich ako doplnok svojej bežnej každodennej činnosti a poslania, a nie ako konečný výsledok. Výhody bohatého hľadania adries, plánovania trasy, zahrnutých demografických údajov, podrobných integrovaných máp a schopnosti to všetko zladiť s ľahko zrozumiteľnou rodinnou aplikáciou Office na začlenenie vlastných údajov už uložených v programe Microsoft Excel, Access, Outlook, SQL Súbory oddelené serverom alebo textom jednoducho znižujú zložitosť a umožňujú im vykonávať skutočnú prácu s mapami bez problémov.

Na opačnom konci spektra je obecenstvo kartografov, ktorí každý deň žijú a čelia problémom s mapovaním pomocou špičkových aplikácií GIS, ktoré poskytujú spoločnosti ako ESRI a MapInfo. Kartograf má pokročilé znalosti o priestorových súboroch údajov a o tom, ako z nich vyťažiť maximum. Môžu poskytnúť cenný prehľad o problémoch, ktorých riešenie môže byť veľmi zložité a ktoré často vyžadujú vytvorenie, úpravu a údržbu základných máp.

Tento tradičný svet GIS vyžaduje úroveň priestorového povedomia a technického know-how, ktoré by sa považovalo za nadbytočné a ťažko odôvodniteľné peniazmi a časom pre mnohé podniky a obchodné potreby. To neznamená, že nie sú dôležité. Nebyť schopností a oddanosti kartografov spoločnosti Microsoft, základné mapy používané v programe MapPoint by neexistovali. Bez špičkových aplikácií GIS by cenné, ale komplexné úrovne priestorovej analýzy používané vládnymi agentúrami a veľkými podnikmi neboli možné.

Oba konce tohto kontinua poskytujú jedinečné vlastnosti a slúžia dôležitým účelom. Základným problémom doteraz je, že medzi týmito dvoma prístupmi je medzera, ktorá bráni koncovému používateľovi využívať výhody oboch prístupov. Realita je taká, že v definovateľnom počte scenárov reálneho sveta môžu mať užívatelia obrovský prospech, ak by tieto dva svety mapovania dokázali ľahko spolupracovať. Pozrime sa na prístup pomocou nového modelu rozšíreného objektu MapPoint 2002, ktorý poskytuje prostriedky na vytvorenie mosta medzi nimi a príbuznými, ale rozdelenými prístupmi.

Mostný stavebný materiál

Najzrejmejším spoločným prvkom zdieľaným medzi špičkovými systémami GIS a MapPoint 2002 je ich používanie súborov priestorových údajov, ale prístup ku každému je jedinečný. Používatelia ESRI môžu vytvárať a zdieľať súbory SHAPE. Používatelia služby MapInfo môžu vytvárať a zdieľať súbory vo formáte TAB a MIF. Existujú dokonca aj softvérové ​​produkty tretích strán navrhnuté na ľahký prenos súborov údajov z jedného formátu do druhého.

Tieto formáty súborov GIS sa používajú na ukladanie základných máp a zodpovedajúcich dátových vrstiev koncových používateľov. Kvalita a pokrytie základných máp závisí od zdroja a množstva úprav a opráv, ktoré môže koncový používateľ vykonať. To môže byť veľmi dobrá vec alebo to môže byť veľmi zdrvujúca aktivita. Ak ste kartograf a robíte špičkové analýzy alebo potrebujete schopnosť zmeniť základnú mapu, považovali by ste to za nevyhnutné.

Na rozdiel od toho MapPoint používa veľmi rozsiahle integrované základné mapy, ktoré nemožno upravovať. Tieto mapy obsahujú politické a administratívne hranice (napr. Sčítacie plochy, PSČ, okresy, metropolitné oblasti, štáty, krajiny atď.) A rozsiahlu dopravnú sieť.

Severoamerické vydanie z roku 2002 obsahuje viac ako 6,4 milióna upraviteľných ulíc a ciest. Európske vydania z roku 2002 obsahujú viac ako 4,8 milióna upravených ulíc a ciest. Cestné siete obsahujú uvedenie obmedzení odbočenia, jednosmernosť a päť rôznych rýchlostných klasifikácií. Mapy tiež obsahujú rozsiahlu zbierku osídlených miest a bodov záujmu (POI). Zdroje týchto základných máp zahŕňajú dodávateľov priestorových údajov Navigation Technologies, Geographic Data Technologies Inc., CompuSearch, Inc. a údaje zozbierané a vyvinuté spoločnosťou Microsoft za posledných desať rokov.

Rozsiahly výskum ukazuje, že drvivá väčšina koncových používateľov chce mapy používať, nie ich získavať, vytvárať a udržiavať. Vzhľadom na široký rozsah pokrytia, ktorý poskytujú severoamerické a európske edície MapPoint, dnes jednoducho nie sú k dispozícii lepšie mapy, takže problémy súvisiace s „valcovaním“ vlastných máp zmiznú.

Podľa plánu nie je možné mapy MapPoint nahradiť vlastnými mapami pomocou prístupu popísaného v článku alebo inou metódou, ale tým by sa negovala jedna z kľúčových výhod, ktoré MapPoint poskytuje. Tiež by ste si mali uvedomiť, že MapPoint 2002 nie je navrhnutý tak, aby bol prehliadačom SHAPE, TAB alebo MIF.

Ale čo keby ste mohli vziať svoje súbory GIS a importovať ich do súborov MapPoint? Poskytla by taká úroveň integrácie, ktorá by poskytovala skutočnú hodnotu?

Pozrime sa, ako to môžeme urobiť pomocou jazyka Visual Basic na vytvorenie doplnku MapPoint 2002 COM a rozšíreného objektového modelu MapPoint 2002.

Import množín údajov GIS do MapPoint

Schopnosť produktu MapPoint 2002 pracovať v súlade s priestorovými množinami údajov vytvorenými vo formátoch MapInfo a ESRI je funkcia, o ktorú požiadalo mnoho podnikových zákazníkov. Medzi výhody, ktoré by to prinieslo, patria:

1. Integrácia komplexných alebo jemnejších tvarov zrnitosti do programu MapPoint vytvoreného pomocou špičkových algoritmov GIS alebo priestorových súborov údajov, ktoré sú získané alebo vytvorené v systémoch GIS.
2. Uľahčite jednoduchšie priestorové dotazy a integráciu údajov programu Excel, Access, Outlook a SQL Server.
3. Poskytnite spôsob kombinovania súborov údajov, ktoré boli vytvorené oddelene v prostrediach GIS a MapPoint.
4. Jednoduchá distribúcia máp vašim koncovým používateľom, ktoré obsahujú rozsiahle kombinované údaje.

Toto rozšírenie je možné vytvoriť buď ako doplnok COM, alebo pomocou vytvorenia aplikácie Visual Basic pomocou nového ovládacieho prvku MapPoint 2002 ActiveX. Nie je to hneď po vybalení funkcia, ale je to príklad toho, ako sa služba MapPoint môže funkčne rozrásť do mnohých ďalších oblastí.

Vytvorili sme ukážku doplnku MapPoint COM v jazyku Visual Basic, ktorý používa nové rozšírené metódy objektového modelu MapPoint a preberá súbory dátových bodov GIS natívneho zdroja a importuje ich ako sady pripínačov MapPoint spolu s akýmkoľvek natívnym priradením priradeným ku každému bodu (napr. Názov, adresa, zemepisná šírka/dĺžka atď.). Natívne polygóny GIS, krivky, čiary a zaoblené obdĺžniky je možné importovať a vytvoriť tak vrstvu kreslených objektov MapPoint, ktoré je možné zobraziť na mape MapPoint. Kópiu vzorového kódu a „fungujúci“ doplnok COM .dll COM nájdete na adrese http://msdn.microsoft.com/mappoint.

Prostredníctvom funkcií objektového modelu MapPoint môžete nastaviť farbu a veľkosť čiary, farbu výplne tvaru a dokonca presunúť mnohouholníky a čiary za cestnú sieť MapPoint.

Veľká časť kódu v tejto ukážke má viac do činenia s čítaním súborov ESRI SHAPE a súborov MapInfo MIF. Získanie informácií extrahovaných z týchto súborov a ich umiestnenie na mapu MapPoint je jednoduchá časť.

Po importovaní do MapPoint je možné polygóny použiť na vizualizáciu a na vytváranie priestorových dotazov (t. J. Dotazy typu point-in-poly v kóde VB a export do Excelu pomocou používateľského rozhrania aplikácie MapPoint) akýchkoľvek dátových vrstiev MapPoint obsiahnutých v mape MapPoint. Môžu sem patriť dopyty na množiny pripínačov MapPoint alebo demografické údaje alebo údaje o koncových používateľoch zobrazené v tieňovanej oblasti MapPoint, v tieňovanom kruhu, v kruhu s veľkou veľkosťou, viacnásobnom symbole, koláčovom grafe, koláčovom grafe s veľkými tabuľkami, stĺpcovom grafe a/alebo v stĺpcovom grafe série v sérii. Dotazy môžu zahŕňať viac vrstiev informácií naraz.

Táto ukážka a ďalšie funkcie dostupné prostredníctvom objektového modelu uspokoja mnohých koncových používateľov, ale budú mať prirodzené limity, ktoré neuspokoja extrémne situácie.

Hoci tento príklad importu do GIS ukazuje, ako importovať čiary a krivky GIS, je dôležité poznamenať, že ich nemožno pridať do transportnej vrstvy MapPoint a nebude smerovateľné. Pokiaľ ide o MapPoint, sú to len jednoduché čiary a krivky.

Tento ukážkový kód nepodporuje import akýchkoľvek tvarov, ktoré obsahujú otvory. Čas od času budú súbory údajov v systémoch GIS obsahovať objekty v tvare „šišky“.

Táto ukážka neposkytuje funkčné exporty importovaných vrstiev GIS z MapPoint. Malo by byť možné napísať takúto funkciu, ale vyžadovalo by to rozsiahlejšie kódovanie jazyka Visual Basic.

Uvedomte si, že doplnok COM pre MapPoint, kód jazyka Visual Basic a priestorové súbory ESRI a MapInfo sú iba ukážky používané na zvýraznenie možností, ale môžete prísť na to, že doplnok COM funguje dobre s našimi súbormi bezo zmeny. Môžete si tiež vziať ukážkový kód a podľa potreby ho rozšíriť a upraviť.

Import súborov ESRI SHAPE a súborov MapInfo do mapy MapPoint 2002 je len jedným príkladom toho, ako môže vývojár funkčne rozšíriť službu MapPoint pomocou nového modelu rozšírených objektov. Toto rozšírenie je vytvorené buď ako doplnok COM, alebo vytvorením aplikácie Visual Basic pomocou nového ovládacieho prvku MapPoint 2002 ActiveX. Nie je to hneď po vybalení funkcia, ale je to príklad toho, ako sa služba MapPoint môže funkčne rozrásť do mnohých ďalších oblastí.

MapPoint 2002 je navrhnutý pre každodenné obchodné mapovanie a veľmi technické a komplexné problémy GIS nechávame na aplikáciách GIS. Ak chcete vytvárať a upravovať svoje vlastné priestorové súbory údajov, odporúčam použiť aplikácie GIS, ako sú napríklad programy ESRI a MapInfo. Ak chcete integrovať výhody svojich súborov priestorových údajov so silou MapPoint, bude sa vám páčiť táto ukážka kódu.

Diskutujte o tomto príbehu vo fóre. Autor: BJ Holtgrewe
E -mail: bjholt (AT) microsoft.com
URL: http://www.microsoft.com
BJ Holtgrewe je senior produktový manažér/technický evanjelista v divízii Microsoft Business Tools. Trávi každú bdelú hodinu šírením evanjelia produktov spoločnosti Microsoft týkajúcich sa polohy, vrátane MapPoint, zákazníkom, vývojárom, dodávateľom softvéru, poskytovateľom riešení certifikovaných spoločnosťou Microsoft a takmer každému ďalšiemu, kto bude počúvať - ​​budete mať trvalé spomienky, ak si sadnete vedľa neho na dlhý let! Ako člen geografickej produktovej jednotky pomáha BJ formovať víziu pre produkty spoločnosti Microsoft, ktoré majú geografické a geografické funkcie.

Pred svojou úlohou technického evanjelistu slúžil BJ ako plánovač produktov pre MapPoint. Keď sa prvýkrát pripojil k tímu, pôsobil ako vedúci programového manažéra v systéme Microsoft Map Building System. BJ sa v súčasnosti objavuje v iniciatíve spoločnosti Microsoft .NET a je držiteľom dvoch patentov v oblasti informovanosti o polohe. Je rečníkom na mnohých konferenciách a seminároch a v súčasnosti je autorom knihy o programe MapPoint 2002.

Pred životom v spoločnosti Microsoft bol konzultantom projektu a dizajnu a pracoval pre softvérové ​​spoločnosti na východnom pobreží a v Európe. Vo svojom voľnom čase rád cestuje po svete (niekto potrebuje skontrolovať presnosť máp!). Má nevyliečiteľnú chuť do európskej profesionálnej cyklistiky a starých tlačených máp. Ešte predtým vo svojej histórii bol BJ vášnivým inštruktorom parašutizmu, medzinárodne hodnoteným rozhodcom parašutizmu a potápačom pod hladinou a hľadaním.