
이전 포스팅에 이어 공간데이터를 본격적으로 다루어보겠습니다. 데이터 불러오기는 이전 포스팅을 참고해주세요. geopandas는 아래와 같은 분석을 할 때 쉽게 사용할 수 있습니다. within : 포함되는지 여부 contains : 포함하고 있는지 여부 intersects : 교차하는지 여부(경계에 닿아 있기만 해도됨) crosses : 교차하는지 여부(내부를 지나가야 함) distance : 두 공간 객체 사이의 직선(최단)거리를 계산한다. 저번 포스팅에서 intersects를 다루었는데 오늘은 공간 데이터를 다룰 때 꼭 쓰게되는 기법들에 대해서 다뤄보겠습니다. 1. within within은 객체 A가 객체 B에 포함되는지 여부를 알아내는 방법입니다. 바로 예시로 알아보겠습니다. 서울 상권 DB에서 ..

오늘은 저번 글의 결과인 서울 읍면동 당 상점수를 바탕으로 단계구분도를 만들어보겠습니다. 단계구분도를 만들 때 유용한 library는 mapclassify가 있습니다. mapclassify는 Head tail break, Fisher Jenks, 분위수(Quantiles) 등 속성 값의 클레스(등급)을 나눌 때 유용하게 사용할 수 있습니다. 보통 등급을 매길 때 많이 쓰는 분위수는 다음과 같이 구할 수 있습니다. import mapclassify as mc c10 = mc.Quantiles(seoul['count'], k=10) f, ax = plt.subplots(1, figsize=(9, 9)) seoul.assign(cl=c10.yb).plot(column='cl', categorical=True,..

저번글에 이어서 geopandas를 계속 소개하겠습니다. geopandas.org 여기 사이트에 들어가면 geopandas에 모든 기능이 나와 있습니다. 참고하셔도 좋을 것 같습니다. 오늘 포스트할 내용은 geopandas를 이용한 좌표체계 바꾸기와 intersect입니다. 첫번째로 읍면동안에 상점의 개수가 몇개인지 세어보겠습니다. 저번 포스팅에서 이어서 작업을 진행하겠습니다. 찾기 귀찮으신분은 아래의 코드를 사용해주시면 됩니다. import geopandas as gpd import pandas as pd EMD = gpd.read_file('./EMD_202005/EMD.shp',encoding = 'ANSI') seoul = EMD[EMD['EMD_CD'].str.startswith('11')] s..

안녕하세요. 이번 포스트에서는 공간정보를 다룰 때 꼭 사용하게되는 geopandas를 다루어 보겠습니다. geopandas는 공간정보를 담은 .shp, .geojson, .csv 파일을 파이썬에서 분석할 수 있게 메모리에 불러오면서 shapely와 연계해서 공간분석을 지원하는 라이브러리 입니다. Anaconda, Window로 개발하신다고 하면 anaconda prompt 창에서 다음을 입력해주시면 됩니다. conda install geopandas 앞으로 다룰 데이터를 소개하겠습니다. polygon 데이터를 다루기 위해 전국 읍면동 데이터를 여기서 다운 받아 주세요. point 데이터를 다루기 위해 여기서 전국 상권데이터를 다운 받아 주세요. 본 포스팅에서는 이 파일 중 '소상공인시장진흥공단_상가(상권..
[한국 좌표계 정리] 주로 좌표계를 정할 때는 2가지를 GCS(Geographic coordinate system),PCS(projected coordinate system)를 정해야한다. 이는 다음과 같이 쉽게 풀어쓸 수 있다. GCS: 어떤 지구본을 쓸까PCS: 어떻게 지도(2D)로 나타낼까(project) 예를들어 한국 도로명주소가 UTM-K, GRS80 좌표계라고 하면 GCS가 GRS80, PCS가 UTM-K인 것이다. 또한 GRS80=WGS84 임을 유의하자. ※ ARC를 쓸 때 같은 타원체를 지칭하지만 다른 이름으로 불리는 경우가 있다. 이는 고맙게도 biz-gis 유저 조덕연씨가 정리해둔 것이 있다. (출처: http://www.biz-gis.com/index.php?mid=pds&docum..
GIS 분야에서 빅데이터는 어떠한 연구가 진행되고 있나요?앞으로 어떤 연구가 있을까요? 이번 포스트를 들어가기전에 저는 개인적으로 빅데이터를 공부하는 학생이라는 점을 다시한번 상기시켜 드립니다.학생이기에 잘은 모르지만 'Geospatial big data handling theory and methods: A review and research challenges, Songnian Li 등 9명, 2016', 같은 review 논문들을 읽고 여기서 나오는 몇가지를 공유하고자 합니다. (나중에 시간이 되면 자세한 논문 리뷰를 포스트 할 계획입니다.) ▶ VGI 현재 공간 빅데이터의 뜨거움 감자는 VGI(Volunteered Geo-spatial Information)가 아닐까 싶습니다. VGI는 여러 포멧..
이번 포스트는 GIS에서의 빅데이터의 의미를 살펴보겠습니다!GIS라는 단어를 처음 접하신 분이 있을 수 있으니 위키백과의 정의를 한번 보고 가겠습니다. GIS는 지리공간적으로 참조가능한 모든 형태의 정보를 효과적으로 수집, 저장, 갱신, 조정, 분석, 표현할 수 있도록 설계된 컴퓨터의 하드웨어와 소프트웨어 및 지리적 자료, 인적자원의 통합체이다. 즉 '공간정보의 관련되 모든 것이다' 라고 간단하게 정의하고 넘어가죠. (이것만 자세히 설명해도 2~3 포스트가 나올 것 같긴하네요.) GIS에서의 빅데이터는 저는 앞으로 공간 빅데이터라고 부르겠습니다. 여기서 공간 정보라고 하면 여러가지로 정의할 수 있겠습니다만, 저는 '좌표를 가지고 있는 정보, 혹은 좌표에 대한 정보' 라고 보겠습니다. 공간 빅데이터는 3V..
▶ 기본 개념 우리가 통상 보는 지도는 등거리지도(Equidistant Map, 이하 EM)이다. EM은 지리적인 정보를 찾을 때는 유용하지만 시간이라는 factor을 고려해야 할 때 불편함을 준다. (이전 포스트를 참고) 이전 포스트에 추가로 Ray Hong은 새로운 개념 GAP(Geo-contextual Anchoring Projection)와 SRC(Scalable Road-network Construction)을 적용하여더 나은 Distance Cartogram(이하 DC)를 만들었다. 여기서 DC는 사용자가 지정한 위치에서 다른 지점까지의 걸리는 시간을 바탕으로 만든 지도를 뜻한다.이 때 시간은 실제 거리(physical distance)와 비례하지 않을 수 있다. (교통사정과 도로의 접근성 등..
- Total
- Today
- Yesterday
- 지도학
- shp파일 읽기
- 빅데이터
- data mining
- Knowledge Discovery
- contains
- 공간관계
- terminology
- within
- 좌표계
- VGI
- 시각화
- #빅데이터
- Cartography
- geopandas
- #big data
- mapclassify
- intersect
- KD
- 공간빅데이터
- visualization
- GIS
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |