1. 연구 배경 및 목적
2. 기존의 거리 기반 접근성 연구
3. 데이터 및 분석 방법
1) 데이터
2) 분석 방법
4. 분석 결과
1) 시설 및 수요자 수에 따른 분석결과
2) 도로망 형태에 따른 분석결과
3) 거리함수별 연산시간 비교
5. 결론
1. 연구 배경 및 목적
특정 시설에 대한 접근성은 다양한 방법으로 정의될 수 있지만 대표적인 방법 중 하나는 수요자의 위치와 대상 시설 간 거리에 기반한 것이다. 지점 간 거리 측정은 다양한 거리 함수(distance metrics)를 사용해 이루어질 수 있는데, 과거에는 직선 거리(Euclidean distance)나 맨해튼 거리(Manhattan distance)가 주로 활용되었다. 직선 거리와 맨해튼 거리는 연산이 간단하고 직관적인 이해가 가능하다는 장점이 있지만, 실제 지점 간 이동에 소요되는 시간과 괴리가 있을 수 있다는 한계가 있다. 이에 최근 연구에서는 도로 링크를 따라 거리를 측정하는 네트워크 거리(network distance)가 활용되고 있으며, 국내에서도 도로망 데이터가 공공데이터로 제공되고, 지점 간 네트워크 거리를 반환해주는 서비스도 등장하면서 네트워크 거리를 사용한 연구가 활성화되고 있다(심재헌・조연호, 2011).
네트워크 거리는 실제 차량이나 보행자가 이동하는 경로를 따라 거리를 측정하기 때문에 우리가 체감하는 지점 간 접근성을 보다 정확하게 나타낼 수 있다. 또한, 분석 과정에 교통량이나 다양한 실시간 도로 상황을 반영할 수도 있기 때문에 결과의 신뢰성도 높아지게 된다. 그러나 네트워크 거리는 직선 거리에 비해 거리 측정에 사용되는 데이터가 많고, 연산에 필요한 시간과 비용 또한 늘어난다는 점에서 한계를 가진다. 만약 네트워크 거리와 직선 거리를 사용했을 때 도출되는 결과에 유의미한 차이가 없다면 상당한 시간과 비용을 쏟아 네트워크 거리를 계산할 필요가 없을 수 있다.
물론 두 지점이 직선 도로 위에 놓인 경우가 아니라면 직선 거리와 네트워크 거리는 항상 다른 값을 가지며, 도로의 모양이 복잡할수록 방법 간 차이가 커지게 된다. 그러나 예를 들어 특정 지점에서 상대적으로 가까운 목적지를 선택하는 것이 분석의 목적이라면, 절대적인 거리 차이에 관계 없이 두 거리 함수가 같은 결과를 보일 수도 있다. 따라서 거리 함수의 선택이 접근성 연구에 어떻게 영향을 미치는지 체계적으로 파악하고, 그 결과를 토대로 주어진 상황에서 가장 연산 효율적인 거리 함수를 선택할 수 있다면 전체 분석에 소요되는 시간적, 경제적 비용을 절감할 수 있을 것이다.
본 연구에서는 특정 수요자의 위치에서 가장 가까운 대상 시설을 탐색한 결과가 거리 함수 선택과 수요자의 수, 대상지의 공간적 분포에 따라 어떻게 달라지는지 확인해 보고자 한다. 직선 거리와 네트워크 거리는 일반적으로 비례 관계에 있지만, 도로망의 밀도와 구조가 네트워크 거리에 영향을 미치기 때문에 비례 수준은 도로망 구조에 따라 달라진다(Cubukcu and Taha, 2016). 특히 격자형 도로망에서는 직선 거리와 네트워크 거리의 차이가 최소화된다는 연구 결과도 있다(Hua et al., 2018). 이에 본 연구에서는 실증적 분석을 위한 사례 지역을 격자형 도로망 구조를 갖는 서울시 강남구 일대와 비격자형 도로망의 종로구 일대로 설정하여 비교해 볼 것이다. 무작위로 분포한 수요자 위치에서 고속철도역, 대형 소매점, 커피숍 등 다양하게 분포한 대상 시설까지 최단 거리를 계산하고, 거리 함수에 따른 결과 차이가 작아지거나 실질적으로 없어지는 경우를 확인하는 것이 본 연구의 목적이다.
기존 연구에서는 주로 도로망 구조에 따라 직선 거리와 네트워크 거리 간 절대적 차이에 초점을 맞춰 분석을 했지만, 본 연구는 최단 거리 지점 탐색이라는 상황에서 거리 함수를 비교한다는 점에서 차이가 있다. 이러한 연구 결과는 차량에 탑재된 내비게이션 등 비교적 낮은 연산 능력을 갖춘 엣지(edge) 장비에서 인근 관광지 등을 효율적으로 검색하고 추천하는데 활용될 수 있다. 또한, 향후 시설 접근성 연구나 공간적 형평성 연구에서 사례 지역에 적합한 거리 함수 선택의 판단 근거로 사용될 수도 있을 것이다.
본 논문의 구성은 다음과 같다. 우선 다음 장에서는 접근성과 거리 함수에 대한 관련 선행연구를 간략히 정리하고, 연구의 차별성을 다시 한번 확인한다. 이후 분석에서 사용한 시설 데이터 종류와 공간적 분포를 기술하고, 거리를 비교한 방법에 관해 설명할 것이다. 연구 결과는 직선 거리와 네트워크 거리의 절대적 차이와 상대적 차이로 나누어 보여주고, 해당 결과를 기반으로 거리 함수가 접근성 평가에 미치는 영향을 요약하고자 한다.
2. 기존의 거리 기반 접근성 연구
접근성은 학문 분야나 대상 객체에 따라 다양하게 정의될 수 있다. 보편적으로 접근성은 특정 지점이 다른 지점에서 얼마나 도달하기 쉬운지를 의미하는데, 이에 대한 연구는 과거부터 꾸준히 이루어져 왔다. 접근성은 토지이용, 교통, 도시계획, 입지이론 등 여러 분야에서 중요한 개념으로 활용되고 있다. 예를 들어 교통 분야에서는 접근성 관점에서 교통 체증을 줄이고 접근성을 높이기 위해 버스 노선이나 정류장과 같이 세부적인 수준에서 측정 방법을 제시한 연구도 있고(전철민, 2007), 교통망의 시간 거리와 교통수단의 운행 횟수, 요금 등을 통해 서울로의 접근성을 평가하고 이를 토대로 수도권 도시의 계층성을 분석한 연구도 있다(한대호・홍현철, 2008).
도시계획이나 입지이론 분야에서는 지리정보시스템과 네트워크 분석을 사용해 지방 소도시에 입지한 생활밀착형 사회기반시설(social overhead capital; SOC)의 접근성이 빈집 분포 패턴 및 입지에 어떤 영향을 미치는지 연구한 사례도 있으며(이종수・김선덕, 2021), 시설 접근성이 노인의 주거 입지 수요에 어떤 영향을 미치는지 정량적으로 파악한 연구도 있다(이유진・최명섭, 2018). 이에 앞서 송재선 등(2010)은 필지별 접근성을 계산하고, 이를 바탕으로 특정 지점에 가장 적합한 공공시설 종류를 제안했다는 점에서 도시계획 및 입지 분야의 접근성 연구로 볼 수 있다.
이렇듯 접근성은 여러 분야에서 주요한 연구 주제로 다루어지며, 여기서 접근성을 측정하는 방법은 결과에 상당한 영향을 미칠 수 있는 중요한 문제가 된다. 과거에는 직선 거리를 활용한 연구가 비교적 많았는데, 공간적 형평성 관점에서 대구의 공공 체육시설 접근성을 분석한 김대은 등(2010)이나 서울에 소재한 노인 대상 주간보호시설 접근성을 계산한 손정렬・오수경(2007)의 연구가 그러한 예다. 직선 거리는 서울 시내 다가구, 다세대주택의 대중교통 및 기초생활 인프라 접근성을 측정한 백두진・김재태(2016)의 연구를 비롯해 현재도 계속 활용되고 있으며, 특정 시설이 밀집한 지역을 탐색하는 군집 분석 등에도 유용하게 쓰인다.
그러나 최근에는 도로망 데이터가 공공데이터로 제공되고, 오픈소스 소프트웨어나 인터넷 지도 서비스를 통해 네트워크 거리의 계산이 손쉬워지면서 접근성 연구에 네트워크 거리를 사용한 사례도 증가하고 있다(이진우・윤갑식, 2018; 임수진・김찬호, 2020; 홍지수・문지석, 2023). 또한, 권오성・오수경(2017)처럼 직선 거리를 통해 거점지역 간 인접성을 우선 평가하고 다시 네트워크 거리를 사용하여 정확한 최소비용 거리를 탐색하는 등 직선 거리와 네트워크 거리를 상호보완적으로 활용한 연구도 있다.
네트워크 거리는 실제 두 지점 간 물리적 이동을 위해 필요한 거리를 현실적으로 나타낼 수 있지만, 직선 거리에 비해 연산에 필요한 데이터도 많고, 최단거리 탐색을 위해서는 최적화 알고리즘 사용이 필요해 계산에 비교적 오랜 시간이 소요된다. 이에 분석의 효율성 측면에서 직선 거리와 네트워크 거리를 비교하는 연구도 이루어져 왔으나(Cubukcu and Taha, 2016; Tatit et al., 2024), 앞서 기술한 바와 같이 대부분 두 거리 간 절대적 차이에 초점을 맞춘다는 점에서 본 연구와 차이가 있다. 또한, 기존의 연구들은 대부분 거리 측정 지점의 공간적 분포나 연구 지역의 특성을 거리 비교에 반영하지 않았다는 점에서 한계도 갖는다.
본 연구는 단순히 직선 거리와 네트워크 거리의 절대적 차이에 초점을 맞춘 기존 연구와 달리 서로 다른 규모와 공간적 분포를 갖는 시설 종류를 선정하고, 각각에서 거리 함수가 접근성 측정에 미치는 영향을 확인하고자 한다. 즉, 접근성 평가의 대상이 고속철도역이나 구청, 시청 등과 같이 드물게 분포하는 시설인지, 카페나 학원과 같이 지점 수가 많고 밀집도가 높은 시설인지에 따라 두 거리 함수의 효용성이 달라질 수 있는지 살펴볼 것이다. 또한, 도로망 형태에 따라 직선 거리와 네트워크 거리의 차이가 달라진다는 기존 연구 결과를 고려하여, 도로망 형태로 인한 영향을 통제하기 위해 격자형과 비격자형으로 서로 다른 도로망 구조를 갖는 지역을 선택해 실증적 분석을 진행할 것이다.
3. 데이터 및 분석 방법
1) 데이터
본 연구에서는 크게 세 가지 데이터를 사용한다. 첫 번째는 시설의 수요자 위치를 나타내는 포인트 데이터로 ArcGIS Pro의 ‘Create Random Points’ 도구를 사용해 생성하였다. 수요자 수에 따라 결과가 달라질 수도 있기 때문에 수요자 위치에 해당하는 포인트를 10개, 100개, 1000개로 달리하여 데이터를 만들고 각각을 활용해 분석을 수행할 것이다.
두 번째 데이터는 수요자가 방문하고자 하는 시설 데이터이다. 본 연구는 각 수요자에게 가장 가까운 시설이 직선 거리를 사용했을 때와 네트워크 거리를 사용했을 때 어떻게 달라지는지 확인하는 것을 목표로 한다. 분석 대상 시설은 시설 수와 공간적 분포를 고려해 선정하였으며, 고속철도역, 구청, 중학교, 대규모점포, 편의점, 카페가 최종적으로 사용되었다. 시설 데이터는 원자료 제공 기관에서 공간데이터로 제공하는 경우 그대로 분석에 사용할 수 있었고, 주소만 제공하는 경우는 지오코딩을 통해 경위도 좌표를 추출하였다(표 1).
표 1.
연구 데이터 목록
마지막으로 도로망 데이터는 Python의 OSMnx 패키지를 사용해 오픈스트리트맵(OpenStreetMap)의 도로망 데이터를 수집, 사용하였다. 국가교통정보센터에서 제공하는 표준 노드 링크 데이터에는 전국 주요 도로의 데이터가 담겨 있지만, 이면도로에 관한 정보는 포함되어 있지 않다. 반면 오픈스트리트맵에서 제공하는 도로망 데이터에는 이면도로도 포함되어 있기 때문에, 본 연구에서는 이를 활용하였다.
2) 분석 방법
본 연구에서는 도로망 형태와 시설물 종류별 밀도 변화에 따라 직선 거리상 최단거리 시설물과 네트워크 거리상 최단거리 시설물의 변화를 탐색하고자 하였다. 우선 격자형 도로망 지역과 비격자형 도로망 지역을 선정한 후, 각 지역에서 직선 거리와 네트워크 거리를 사용하여 수요자에서 가장 가까운 시설을 탐색하였다. 수요자 위치는 Cubukcu and Taha(2016)의 연구와 Tatit et al.(2024)의 연구를 참조하여 연구 지역 내에서 임의로 n개의 지점을 생성하였다. 직선 거리와 네트워크 거리를 사용했을 때 같은 결과가 나타난 수요자를 확인하여 일치율을 계산하였으며, 결과가 같은 경우에는 우회지수(detour index)를 산출하였다.
일치율은 거리 측정 방법에 따라 최단 거리로 도달할 수 있는 시설물이 어느 정도로 동일한지를 나타내는 지표이다. 일치율은 다음 수식과 같이 두 방법의 결과가 일치하는 경우에서 두 방법의 결과가 일치하지 않는 경우를 뺀 후 수요자의 수를 나눈 값이다.
우회지수는 네트워크를 따라 지점 간 이동을 할 때 직선 거리와 비교해 어느 정도 우회가 필요한지 보여주는 지표이다. 우회지수는 다음 수식과 같이 두 지점 사이의 최단(最短) 네트워크 거리에서 직선 거리를 나눈 후 100을 곱하여 계산한다. 우회지수가 100보다 클수록 직선 거리에 비해 도로망을 따라 많은 거리를 이동해야 하고, 우회지수가 100에 가까워질수록 두 거리 함수 간 차이가 작아짐을 의미한다.
격자형 도로망 지역과 비격자형 도로망 지역을 선정하기 위해서는 남고은・양승우(2023)의 도로망 형태 구분 지표를 사용하였다. 해당 연구에서는 도로망의 비격자 정도를 다음 수식과 같이 연결점과 교차점의 비율을 통해 계산했다.
여기서 연결점(connecting point)은 간선에서 직선의 선형이 변한 점을 의미하고 교차점(interaction point)은 다른 간선과 교차하는 점을 나타낸다(남고은・양승우, 2023). 격자형 도로망에서는 일반적으로 연결점 수가 비격자형 도로망에 비해 적어, 수식의 값이 상대적으로 낮게 나타난다.
반면 비격자형 도로망에서는 교차점의 수가 연결점의 수와 비슷하거나, 연결점이 교차점보다 많아 비율이 상대적으로 크게 나타난다. 본 연구에서는 비격자 정도와 면적을 고려해 비격자 정도가 낮은 강남구(세곡동 제외), 서초구(양재동 일대), 송파구 일대 지역을 격자형 도로망 지역(그림 1 좌측), 비격자 정도가 비교적 높은 종로구, 중구, 성북구, 동대문구, 중랑구 일대를 비격자 도로망 지역으로 선정하였다(그림 1 우측). 비격자 정도는 격자형 도로망 지역에서 약 5.31, 비격자형 도로망 지역에서 7.32로 나타났다.
분석 대상 시설은 격자형과 비격자형 도로망 지역에서 최대한 비슷한 지리적 분포를 갖는 것으로 선택하였다. 지리적 분포의 유사성은 지점의 군집 수준을 나타내는 지표인 VMR(Variance-to-Mean Ratio)을 기준으로 판단하였다. VMR은 다음 수식과 같이 평균과 분산의 비율로 정의되며, 값이 클수록 강한 수준의 군집을 이루고 있는 것으로 판단할 수 있다.
다만 VMR은 비공간적(aspatial) 지표이기 때문에, VMR 값이 큰 시설도 지도를 통해 특정 지점에 밀집된 분포인지 아니면 다핵중심형인지 확인하고 이를 선택 과정에 고려하였다. 이러한 과정을 통해 고속철도역, 구청, 중학교, 편의점, 대규모 점포, 카페까지 여섯 개 시설물을 분석 대상으로 선정하였고, 각 지역 내 시설물 수와 VMR 값은 표 2, 공간적 분포는 그림 2와 같다.
표 2.
시설별 수와 VMR
시설 | 격자형 도로망 지역 | 비격자형 도로망 지역 | ||
수 | VMR | 수 | VMR | |
고속철도역 | 1 | ≤0.1 | 1 | ≤0.1 |
구청 | 3 | 0.95 | 5 | 1.03 |
중학교 | 64 | 0.99 | 63 | 1.00 |
대규모점포 | 160 | 1.77 | 213 | 4.26 |
편의점 | 1146 | 4.03 | 1191 | 4.44 |
카페 | 7882 | 91.86 | 6536 | 42.93 |
직선 거리를 기준으로 가장 가까운 시설을 탐색하는 데에는 ArcPy의 ‘Near’ 함수를 사용하였다. ‘Near’ 는 입력 피쳐에서 직선 거리상 가장 가까이 있는 대상 피쳐를 찾아 거리와 고유 번호를 속성 테이블에 추가한다. 이 기능을 활용하여 임의로 생성한 수요자 위치에서 가장 가까운 시설까지의 거리와 해당 시설의 고유 번호를 수집하였다.
네트워크 거리 분석에는 Python의 NetworkX 패키지와 오픈스트리트맵의 도로망 데이터를 NetworkX 패키지에서 활용할 수 있게 해주는 OSMnx 패키지를 사용하였다. 직선 거리와 달리 도로망에서 두 지점 간 이동 경로는 경우의 수가 매우 많기 때문에 최적화 알고리즘의 사용이 필수적이다. 본 연구에서는 그리디 알고리즘(greedy algorithm)의 일종인 다익스트라 알고리즘(Dijkstra algorithm)을 활용하였다. 다만 이러한 알고리즘 기반의 연산은 직선 거리 계산에 비해 매우 많은 시간이 소요되기 때문에, 각 수요자 위치에서 직선 거리 기준 일정 반경 내에 위치한 시설로 대상 피쳐를 제한하고 병렬 처리를 적용하여 연산의 효율성을 높일 수 있도록 하였다.1)
수요자에서 최단거리로 도달할 수 있는 시설까지의 직선 거리와 네트워크 거리를 계산한 후에는 두 거리 측정 방법에 따라 최단 거리 시설물 일치율을 계산하였다. 두 거리 측정 방법의 결과가 동일한 경우에는 우회 지수를 산출하여 도로 유형의 변화에 따라 직선거리와 네트워크 거리 간 거리 차이가 어느 정도로 발생하는지 알아보고자 하였다. 추가적으로 수요자 수, 시설물의 변화에 따른 연산 시간 변화도 기록하여 거리 측정 방법의 효용성을 평가하고자 하였다.
4. 분석 결과
1) 시설 및 수요자 수에 따른 분석결과
그림 3은 격자형 도로망 지역과 비격자형 도로망 지역에서 시설과 수요자 수에 따라 두 거리 함수의 일치율이 어떻게 변화하는지 보여주는 그래프이다. 그래프를 통해 구청, 중학교 등 숫자가 많지 않은 시설은 거리 함수에 관계 없이 최근린 시설이 비슷하게 나타나지만(높은 일치율), 카페나 편의점처럼 흔하게 분포하는 시설은 거리 함수의 영향을 비교적 크게 받는 것을 확인할 수 있었다(낮은 일치율).
수요자 수(n) 또한 최근린 시설 탐색 결과에 다소 영향을 주는 것으로 나타났다. 이는 수요자가 많을수록 다양한 위치에서 최근린 시설을 탐색하게 되고, 도로망의 복잡성에 따라 네트워크 거리 기준 최근린 시설이 달라지는 사례가 누적되기 때문으로 보여진다.
수요자 수 증가에 따른 일치율 변화는 도로망 유형에 관계 없이 시설의 수가 적을수록 크게 나타났다. 격자형 도로망 지역과 비격자형 도로망 지역 모두에서 시설 수가 두 번째로 적은 구청은 수요자 수가 증가할수록 일치율이 크게 낮아진 반면, 시설 수가 1000개 이상인 편의점과 카페는 수요자 수에 따른 변화가 비교적 적었다. 시설이 많으면 수요자와 시설 간 거리가 가까워져 도로망의 영향을 상대적으로 덜 받게 되지만, 시설 수가 적으면 수요자가 시설로 이동하는데 선택할 수 있는 경로가 많아지면서 도로망의 영향을 더 많이 받게 된다. 예를 들어, 구청은 카페보다 시설 수가 적기 때문에, 수요자의 위치에서 가까운 시설을 선택하는 과정에서 이동해야 하는 거리가 늘어날 가능성이 크다. 이 과정에서 선택할 수 있는 경로가 많아지고, 도로망 구조에 따라 네트워크 거리 기준 최근린 시설이 달라질 가능성이 높아진다. 이에 따라 시설이 적을 경우 수요자 수 증가에 따라 일치율이 더 민감하게 반응하게 되는 것이다.
그림 4는 시설별 거리 함수 간의 우회지수를 시각적으로 나타낸 것이다. 우회지수는 직선 거리와 네트워크 거리 간의 차이를 측정하여, 두 거리 함수를 통해 측정되는 거리가 얼마나 일치하는지를 파악하는 데 사용된다. 본 연구에서는 두 거리 함수가 동일한 시설을 선택한 경우만을 대상으로 하여 우회지수를 계산하였다.
분석 결과, 격자 도로망 지역과 비격자 도로망 지역 모두에서 시설 수가 증가할수록 우회지수가 증가하는 경향을 보였다. 이는 시설의 개수가 많아질수록 수요자가 선택할 수 있는 시설이 인근에 위치하게 되어, 시설까지의 절대적인 거리인 직선거리가 줄어들기 때문이다. 우회지수는 네트워크 거리를 직선거리로 나눈 값이므로, 시설의 수가 많아질수록 두 거리의 차가 크게 반영되어 우회지수가 증가하는 것으로 예상된다.
예를 들어, 시설의 수가 적은 구청보다 시설의 수가 많은 편의점이 수요자로부터 가까운 거리에 위치할 가능성이 높다. 따라서 편의점은 수요자의 위치로부터 도착지까지의 경로에서 개별 도로망이 미치는 영향이 상대적으로 커지게 된다. 이 경우 수요자의 위치에서 시설까지의 도로망 형태와 밀도가 더욱 중요한 변수로 작용하게 된다. 즉, 시설의 수가 많아질수록 도로망의 특성이 더 크게 반영되어 우회지수가 증가하는 것으로 해석된다.
또한, 일반적으로 수요자 수가 증가할수록 우회지수 또한 증가하는 것으로 나타났다. 수요자가 적을수록 직선거리가 길어지기 때문에, 네트워크 거리와 직선거리 차이의 영향이 작게 나타나기 때문이다. 반면, 수요자가 많아질수록 다양한 위치에서 시설을 선택하는 사례가 증가하면서, 직선거리와 네트워크 거리 간 차이가 비율상 더 크게 반영되는 경향이 나타난다. 이러한 결과는 시설이 많을수록, 수요자가 많아질수록 도로망의 특성이 더욱 중요한 변수로 작용하여 우회 지수가 증가하는 것으로 해석할 수 있다.
대부분의 분석 결과는 시설의 개수가 증가할수록 우회지수가 높아지는 경향을 보였지만, 격자형 도로망 지역의 카페에서는 상반된 결과가 나타났다. 격자형 도로망 지역에서는 우회지수가 감소하는 경향이 확인되었으며, 특히 수요자의 수가 적을수록 우회지수가 급격하게 낮아졌다. 격자지역은 비격자 지역에 비해 카페의 수가 많고 일부 지역에 카페가 밀집되어있다. 때문에 최근린 시설을 선택하는 과정에서 미세한 거리 차이에도 큰 영향을 받을 수 있다. 그 결과 두 거리 측정 방식에서의 최근린 시설 일치율이 매우 낮게 나타났다. 최근린 시설이 동일하게 선택된 경우는 격자형 도로 네트워크 상에서 수요지점과 시설이 단순 직선 도로로 연결되어 있을 가능성이 높다. 이 경우 네트워크 거리와 직선거리 간 차이가 작아 우회지수가 낮게 산출되는 것으로 판단된다.
2) 도로망 형태에 따른 분석결과
도로망 형태에 따른 직선거리와 네트워크 거리간의 일치율과 우회지수를 비교하였다. 그림 5는 도로망 유형별 일치율를 비교하기 위해 시각화한 것이다. 분석 결과 비격자형 도로망인 지역에서 일치율이 더 낮은 경향을 보였다. 특히, 시설의 개수가 증가하고 수요자의 규모가 확대될수록 비격자형 도로망에서의 일치율이 급격하게 감소하였다. 이는 비격자형 도로망의 불규칙적인 도로망 형태가 영향을 미친 것으로 생각된다. 불규칙적인 형태의 도로망일수록 경로의 다양성이 증가되며, 이에 따라 최단거리 계산이 복잡해질 수 있다(Davies and Johnson, 2015). 불규칙적인 교차로나 골목길 등 다양한 형태의 도로가 존재하므로 직선거리와 네트워크 거리간의 차이가 커질 수 있다. 반면, 격자형 도로망은 규칙적으로 배열된 도로 구조로 인해 가능한 경로의 수가 상대적으로 제한적이기 때문에 두 거리 함수별로 선택되는 최단 거리 시설간의 차이가 작을 수 있다고 해석하였다.
하지만, 시설의 입지 특성에 따라 격자형 도로망에서도 두 거리함수 별 차이가 크게 날 수 있다. 격자형 도로망인 지역이더라도 시설이 일부지역에 높은 밀도로 군집되어있는 경우 일치율이 매우 낮게 나타날 수 있다. 본 연구에서 사용한 시설 중 하나인 카페는 격자형 도로망과 비격자형 도로망 지역 간의 군집 정도가 상이한 시설이다. 격자형 도로망 지역에서는 일부 지역에 매우 높ㅇ느 밀도로 군집되어있며, 비격자형 도로망 지역에서는 그 정도가 덜했다. 밀도가 높은 시설일수록 미세한 거리에도 민감하게 반응하기 때문에 일치율이 낮아질 수 있다.
하지만, 격자형 도로망에서도 시설의 입지 특성에 따라 두 거리 함수 간의 차이가 크게 나타날 수 있다. 격자형 도로망은 일반적으로 규칙적인 형태를 갖추고있어 비격자형에 비해 일치율이 높게 나타나지만, 특정 시설이 일부 지역에 높은 밀도로 군집되어 있을 경우 두 거리함수의 일치율이 낮아질 수 있다. 본 연구에서 분석 대상으로 사용된 카페는 격자형 도로망과 비격자형 도로망 지역 간의 군집 정도가 상이했다. 격자형 도로망 지역에서는 일부 지역을 중심으로 매우 높은 밀도로 군집되어 있었던 반면, 비격자형 도로망 지역에서는 전체 연구 지역에 걸쳐 균등하게 분포되어있었다.
이와 같은 분포 특징은 시거리 측정 방식에 따른 민감도를 증가시키는 요인으로 작용할 수 있다. 즉, 시설의 밀도가 높을수록 도로망을 따라 측정된 실제 이동 거리와 직선거리 간의 차이가 상대적으로 크게 나타날 가능성이 높다고 판단된다. 때문에 거리함수를 선택할 때 도로망의 형태뿐만 아니라 시설의 분포패턴 또한 중요한 요인으로 고려되어야한다.
그림 6은 도로망 형태에 따른 우회지수를 나타낸 것이다. 우회지수를 확인한 결과, 비격자형일 도로망의 경우 격자형 도로망에 비해 우회지수가 상대적으로 더 낮게 나타났다. 이는 비격자형 도로망에서 실제 이동경로와 직선거리의 차이가 상대적으로 적다는 것을 의미한다.
격자형 도로망의 경우 도로가 일정한 패턴과 간격으로 정형화되어있기 때문에 방향 전환이 일정한 패턴을 갖게 된다(Davies and Johnson, 2015). 때문에 일부 시설까지의 거리를 측정할때 직선거리로 계산한 거리와 도로 네트워크상의 거리 차이가 커질 수 있다. 반면 비격자형 도로망은 격자지역에 비해 도로의 연결방식과 경로선택이 유연하기 때문에 직선거리를 활용한 거리 계산과의 차이가 작아질 수 있다.
3) 거리함수별 연산시간 비교
직선거리는 두 지점 간의 유클리드 거리를 계산하는 단순한 방식이기 때문에 빠른 연산이 가능하지만, 네트워크 거리는 도로망을 기반으로 실제 이동 경로를 반영해야 하므로, 최단 경로를 탐색하는 알고리즘이 사용되는 과정에서 매우 높은 연산 비용이 발생한다. 특히, 네트워크 거리 계산은 도로망 그래프의 복잡성에 따라 연산량이 기하급수적으로 증가할 수 있으며, 도로망이 조밀하고 경로 선택지가 많은 도심 지역에서는 연산 시간이 더욱 길어질 가능성이 크다. 실제 본 연구에서 직선 거리의 계산은 10초 이내로 가능했지만, 네트워크 거리는 같은 사양의 컴퓨터에서 50분에서 80분 정도 소요되었다.
최근 컴퓨터 성능 향상과 다양한 최적화 기법의 개발로 연산 속도가 빨라지고 있지만 여전히 대규모 네트워크 거리 분석에는 상당한 시간이 소요된다. 특히 본 연구처럼 다수의 출발지와 목적지가 존재하는 경우 시간비용이 높아진다. 네트워크 거리는 현실적인 이동 경로를 반영하기 때문에 정확성이 높기 때문에 최근 많은 연구에서 사용된다. 하지만 연구 목적이나 분석의 맥락에 따라 높은 정확도보다 빠른 연산시간이 중요한 경우도 존재한다. 거시적인 관점에서의 공간 분석이나 대략적인 접근성을 평가하는 경우, 직선거리 기반 계산이 충분히 유용한 대안이 될 수 있다. 특히, 실시간 분석이 요구되는 경우 직선거리의 빠른 연산 속도는 매우 중요한 장점으로 작용할 수 있다. 때문에 거리 측정 방법을 선택할 때는 연산의 정확도와 시간비용을 함께 고려해야한다. 네트워크 거리의 높은 연산 비용을 감수할 만큼의 정밀한 분석이 필요한 경우가 아니라면, 직선 거리를 활용한 분석이 효율적일 수 있다.
5. 결론
본 연구 결과를 통해 다양한 시설의 접근성을 거리 기반으로 측정할 때, 거리를 계산하는 방법, 즉 거리 함수에 따라 결과가 크게 달라질 수도 있음을 확인할 수 있었다. 연산에 비교적 많은 시간이 소요되는 네트워크 거리 측정을 직선 거리로 대체할 수 있는 상황을 파악하고자, 본 연구에서는 다양한 공간적 분포와 규모를 가진 여섯 종류의 시설을 도착지로 선정하고, 무작위로 생성한 출발지에서 가장 가까운 시설을 탐색하였다. 이 과정에서 도로망의 형태에 따라 결과가 달라질 수도 있기 때문에, 격자형 도로망 지역과 비격자형 도로망 지역에서 각각 분석을 수행했다. 분석 결과, 도착지로 선정한 시설의 수와 밀집 정도에 따라 거리 함수가 접근성 평가에 미치는 영향이 달라지는 것으로 나타났다. 또한, 시설의 수가 많아지고, 밀도가 높아질수록 전반적으로 일치율은 감소하고 우회지수는 커지는 것으로 확인되었다. 특히, 개수가 많고 일부 지역에 밀집되어있는 시설은 일치율이 급격하게 낮아지는 것으로 나타났으며, 이 경우는 예외적으로 우회지수가 낮게 나타났다.
또한, 도로망의 형태에 따라 일치율과 우회지수에 유의미한 차이가 있음을 확인하였다. 격자형 도로망에서의 일치율이 상대적으로 높게 나타났다. 불규칙한 형태를 가지고있는 도로망일수록 경로 선택의 다양성이 증가하므로 격자형 도로망에 비해 비격자형 도로망에서의 일치율이 낮아질 수 있다고 해석하였다. 우회지수의 경우 격자형 도로망에서 더 높았으며, 이는 선택된 최근린 시설이 같은 경우 비격자형 도로망의 경로선택 유연성이 직선거리와의 차이를 줄인 것으로 판단된다.
본 연구는 네트워크 거리 기반의 접근성 연구가 활발해지고 있는 상황에서 직선 거리의 효용성을 확인하고자 거리 함수가 분석 결과에 미치는 영향을 체계적으로 조사했다는 점에서 의의가 있다. 반복적인 모의 실험 결과, 네트워크 거리 대신 직선 거리를 사용할 수 있는 상황을 확인할 수 있었다. 거리 함수에 따라 연산 시간에 많은 차이가 나는 수요 지점의 수가 많고, 대상 지점의 수가 상대적으로 적은 상황에서 직선 거리를 효율적으로 분석에 사용할 수 있을 것이다. 향후 좀 더 많은 실증적 분석과 검증을 거친다면 분석 대상 시설의 수와 밀집도, 지리적 분포 유형에 따라 가장 효과적인 거리 함수를 추천할 수 있을 것으로 기대된다.
그러나 본 연구에서는 시설의 숫자와 밀도만을 고려해 분석 대상을 선정하였기 때문에, 시설의 공간적 분포를 구체적으로 세분화하지 못했다는 한계를 갖는다. 또한 거리 함수도 직선 거리와 네트워크 거리만을 사용하여 비교가 다소 단순하게 이루어졌다. 이는 향후 연구에서 보다 다양한 분포를 갖는 시설을 분석에 포함하고, 비교 대상이 되는 거리 함수도 더 늘려 보다 활용성이 높은 연구 결과를 도출할 수 있을 것이다.
많은 연구에서 접근성 유형에 따라 거리 측정 방법을 달리 하는 것을 확인 할 수 있는데 이는 두 거리 함수가 보행 및 주행 접근성 측정 여부에 따라 그 효용성이 달라질 수 있기 때문이다. 또한 본 연구는 서울시를 대상으로 분석한 연구로, 시설의 배치 및 교통 등이 상이한 지방의 중소도시권을 대상으로 분석한다면 다른 결과가 나올 수 있다. 이는 연구 지역을 확장하여 보다 일반화된 결론을 도출할 수 있을 것이다. 다만 데이터와 분석의 규모를 키우게 되면 연산에 매우 많은 시간이 소요되기 때문에, 이를 위한 자원을 확보한 후에 후속 연구가 이루어져야 할 것으로 보인다.