1. 서론
지형(landform)은 지구 지표면의 뚜렷한 형태를 의미하며, 이러한 지형과 이를 형성한 작용을 연구하는 지형학에서 형태, 지형 형성 작용 및 이들 사이의 관계는 지형의 기원과 발달을 이해하는데 매우 중요하다(Huggett, 2011). 이는 곧 지형의 인지 및 분류에 형태와 형성 작용 모두 중요한 부분을 차지하고 있다는 것을 의미한다. 이러한 지형 분류의 결과물인 지형분류도(geomorphological map)는 형태, 지형, 지형 형성 작용 및 지구 지표면을 이루고 있는 물질을 체계적으로 기록하기 위한 지형평가 기법 중 하나로(Griffiths, 2004), 지형의 형성 작용에 초점을 맞춘 성인적 분류(generic classification)와 형태 자체를 중요하게 생각하는 형태적 분류(morphometric classification)를 통해 제작된다(김태호, 2003).
지형의 인지, 분류 그리고 지도화나 모델링을 위해, 지형도, 위성영상과 더불어, DEM(Digital Elevation Model), DSM(Digital Surface Model) 및 이를 기반으로 한 다양한 자료(Maxwell and Shobe, 2022)가 이용되어 왔다. 전통적으로 이용되어 오던 특정 지형을 촬영한 사진뿐만 아니라, 최근에는 무인 항공기(Unmanned Aerial Vehicle)의 보급과 더불어 항공사진 및 항공사진의 처리를 통해 생산된 정사사진(orthophoto 또는 orthomosaic image)도 다양한 지형 연구를 위해 널리 활용되고 있다. 보다 최근 딥러닝(deep learning)이나 머신러닝(machine learning)의 확산은 다양한 학문 분야에 새로운 가능성을 열어주고 있으며, 이는 지리학 분야에서도 마찬가지이다(강영옥, 2023). 딥러닝이나 머신러닝을 기반으로, 사진이나 이미지에 포함된 모양, 표면 및 색상과 같은 특징을 추출하기 위해 입력된 픽셀로부터 자동으로 최적의 특징을 추출하고 이를 통해 사진이나 이미지의 분류를 시도(김동우 등, 2020)하는 합성곱신경망(Convolutional Neural Network, 이하 CNN)을 이용한 연구가 특히 많이 진행되어 왔다.
CNN은 1998년 Yann LeCun이 소개한 이래로 널리 사용되고 있는 신경망으로, 이미지 인식 분야에서는 매우 강력한 성능을 발휘하고 있으며, 최근에는 음성 인식이나 자연어 처리에도 사용되고 있다(김진중, 2017). 컨볼루션층(convolutional layer), 풀링층(pooling layer) 그리고 전결합층(fully connected layer)으로 이루어져 있는 CNN에서 이미지는 컨볼루션층으로 입력되고, 컨볼루션층과 풀링층이 반복된 후 전결합층으로 연결되며, 전결합층도 반복되어 최종 전결합층이 출력층이 된다(최재원, 2019; 그림 4 참조). 컨볼루션층에서는 다양한 필터를 통해 이미지의 특징을 추출하고, 풀링층에서는 이미지를 여러 영역으로 구획하고 각 영역을 대표하는 값을 추출해 새로운 이미지를 만들며, 앞에서 처리된 자료를 전결합층을 통해 최종 분류한다(최재원, 2019; 김동우 등, 2020).
국내에서 CNN은 건축(안종규・조항만, 2023; 조하영・이진국, 2023; 한유진・이현수, 2023), 치안, 방재(최경주・전민성, 2016; 정영식 등, 2023; 조민지 등, 2024; 김소망・강영옥, 2025), 의료(윤재웅 등, 2017; 임지영 등, 2022; 장준용 등, 2024), 경관, 관광(강영옥 등, 2021; 이주경・손용훈, 2022; 성정한・이경진, 2023), 산림, 생태(김동우 등, 2020; 신우철 등, 2023; 심우담・이정수, 2024), 군사(이현기・마정목, 2022; 이영균・마정목, 2023; 김영완 등, 2024), 원격탐사(변상영 등, 2023; 2024), 농축산업(김준기 등, 2019; 최영우 등, 2022; 송지수 등, 2023; 장동화 등, 2024)과 같이 매우 다양한 분야에 적용되어 왔다. 차량(서창진, 2018; 이상엽, 2021)이나 선박(백운영・강상길, 2023)의 종류를 파악하는 연구 그리고 정사사진, 위성영상, DSM을 이용해 도로(이재관・최진무, 2025)나 건물(이대건 등, 2022)을 추출하는 연구도 이루어졌다.
해외의 경우, 여러 지역에서 위성영상, 정사사진, 항공사진, LiDAR(Light Detection And Ranging), DEM, 경사, 사면향, 사면 곡률(curvature) 및 지형 습윤 지수(Topographic Wetness Index)와 같은 다양한 지형, 수문, 환경 변수를 활용하여, 사구(van der Merwe et al., 2022; Tang et al., 2023; Daynac et al., 2024; Lu and Mokarram, 2026), 야르당(Gao et al., 2025), 암석 빙하(Robson et al., 2020; Erharter et al., 2022), 산악 빙하(Xie et al., 2022), 전쟁으로 형성된 지형(Feizizadeh et al., 2025), 권곡(Mao et al., 2024), 산사태 발생 지역 또는 산사태 민감도 평가(Huang et al., 2020; Yi et al., 2020; Chang et al., 2024; Luo et al., 2025; Wu et al., 2025), 해안선 변화(Khan et al., 2024), 습지(Mainali et al., 2023), 우곡의 침식 민감도 평가(Liu et al., 2023; 2024; 2025; Zheng et al., 2026), 화산 지형, 빙하 지형(Garajeh et al., 2022)과 같이 여러 지형의 분포와 탐지 또는 지도화 관련 연구가 이루어졌다. 예를 들어, Du et al.(2019)은 멀티 모달(multi-modal) CNN의 개념을 이용해, DEM, 경사, 흐름 누적(flow accumulation), 사면 곡률, 지형 습윤 지수, 음영 기복도를 기반으로, 중국에서 풍성 지형, 건조 지형, 뢰스, 카르스트 지형, 하천 지형 및 주빙하 지형을 지도화하기도 하였다.
그러나 이러한 연구는 대부분 다양한 래스터 자료에 기반하여 특정 지형만을 분류하고 있어, 사진 자료를 통한 다양한 지형의 분류에 관해서는 거의 연구되지 않았다. 더구나 국내 지형학 분야에서는 CNN을 이용한 이미지 기반 지형 분류와 관련한 연구가 전혀 이루어지지 않은 상태이며, 딥러닝이나 머신러닝 기반 지형 연구도 매우 소수에 불과하다(윤혜연 등, 2025). 따라서 본 연구에서는 이미지 인식에 탁월한 성능을 발휘하는 CNN을 이용해, 전국자연환경조사 사진 자료를 바탕으로 총 21개 종류의 지형을 이미지에 기반하여 분류해 보고, CNN을 이용한 이미지 기반 지형 분류의 한계점 및 의의를 살펴보고자 한다.
2. 연구 방법
CNN을 이용한 이미지 기반 지형 분류를 위해, 본 연구에서는 1997년(제2차 조사)부터 2023년(제5차 조사)까지 이루어진 전국자연환경조사의 사진 자료를 이용하였다. 우선 약 3,500건의 전국자연환경조사 보고서에서 52,000여 장의 사진 자료를 추출한 후, 제5차 전국자연환경조사 지침(국립생태원, 2019)에 따라 지형 명칭을 통일시키고(예, 하성단구 → 하안단구, 단애 → 급애), 지형별로 사진 자료를 분류하였다. 충분한 사진 자료를 확보하기 위해, 500장 이상의 사진 자료가 있는 총 26개 종류의 지형을 선별하였으며, 흑백 사진과 구름, 안개, 식생으로 과도하게 가려 해당 지형을 인지하기 어려운 사진은 모두 제외하였고, 가급적 해당 지형의 전경을 촬영한 사진을 이용하였다. 또한 20,000여 장의 개별 사진을 확인해, 해당 지형을 명확하게 표현해 주고 있는 사진 자료만을 선별하였다. 이러한 과정을 거쳐 급애(cliff), 암석돔(dome), 토르(tor), 애추(talus), 폭포(waterfall), 포트홀(pothole), 하식애(stream cliff), 선상지(alluvial fan), 곡저평야(valley plain), 하천습지(riverine wetland), 하안단구(river terrace), 호소성습지(lacustrine wetland), 기반암하상(rock river bed), 범람원(floodplain), 인공호수(artificial lake), 해식애(sea cliff), 파식대(wave-cut platform), 시스택(sea stack), 간석지(tidal flat), 자갈해안(pebble beach) 및 모래해안(sand beach)과 같은 총 21개 종류의 지형 및 16,104장의 사진 자료를 선정하였다(그림 1, 2). 본 연구에서는 사진의 특정 부분만 잘라내거나 해상도 조절 및 가로/세로 비율의 변화와 같은 사진의 편집은 이루어지지 않았으며, 전국자연환경조사 보고서에서 가장 고해상도로 추출된 사진 원본을 이용해 이미지 기반 지형 분류를 시도하였다. 다만 제5차 전국자연환경조사 지침(국립생태원, 2019)에는 토르와 토르군(tor group)으로 구분되어 있지만, 본 연구에서는 모두 토르로 간주하였으며, 포트홀 역시 포트홀, 포트홀군(pothole group) 및 마린포트홀(marine pothole)로 나누어져 있지만, 과거 조사에서는 이러한 구분을 적용하지 않아 모두 포트홀로 통일시켜, 분석을 진행하였다.
500장 이상의 지형별 사진 자료를 약 3:1:1의 비율로 무작위로 나누어 직접적인 학습에 이용되는 훈련 자료(train data), 학습 결과의 검증 자료(validation data) 및 최종 결과의 예측을 위한 확인 자료(confirmation data)로 활용하였다. 충분한 훈련 자료를 확보하기 위해, 수평 반전(horizontal flip), 수직 반전(vertical flip), 20% 이내 수평 이동(horizontal shift), 20% 이내 수직 이동(vertical shift), 70~ 130% 사이 확대/축소(zoom in/out), 30% 이내 X축 방향 기울이기(X-axis shear), 30% 이내 Y축 방향 기울이기(Y-axis shear) 그리고 -45~+45° 사이 회전(rotation)과 같은 이미지 증강(image augmentation)을 거쳐 8배의 훈련 자료를 추가로 제작하여 학습에 이용하기도 하였다(그림 3).
훈련 자료의 수가 특정 범주에 치중되어 있으면 훈련 과정에서 불균형한 자료를 과도하게 학습하게 된다(심우담・이정수, 2024). 따라서 본 연구에서는 자료의 수 및 이미지 증강이 CNN을 이용한 이미지 기반 지형 분류에 어떠한 영향을 미치는지 파악하기 위해, 6가지 분석 조건으로 이미지 기반 지형 분류를 시도하였다. 우선 testA는 지형별 모든 사진 자료를 임의로 약 3:1:1의 비율로 훈련, 검증, 확인 자료로 구분하고, 이미지 증강은 실시하지 않았으며, testB는 지형별로 500장의 사진을 임의로 선정하여 이를 3:1:1의 비율로 훈련, 검증, 확인 자료로 구분하고, 이미지 증강은 실시하지 않았다. testC 및 testD는 동일한 데이터 세트에 대한 이미지 증강의 영향을 알아보기 위해, testA와 testB를 각각 복사하여 훈련 자료에 대해 이미지를 증강하였다. 반면 testE와 testF는 데이터 세트에 따라 분석 결과가 달라질 수 있음을 확인하기 위해, 지형별 사진을 새롭게 구분하였다. 이에 따라, testE는 지형별 모든 사진 자료를 임의로 약 3:1:1의 비율로 훈련, 검증, 확인 자료로 새롭게 구분하고, 훈련 자료에 대해 이미지 증강을 실시하였다. testF의 경우, 지형별로 500장의 사진을 임의로 새롭게 선정하여 이를 3:1:1의 비율로 훈련, 검증, 확인 자료로 구분한 후, 훈련 자료에 대해 이미지를 증강하였다. 이상의 방법을 통해, 분석 조건별로 서로 다른 100개의 데이터 세트를 만들어 동일한 방법으로 분석하였으며, 확인 자료를 바탕으로 특정 사진을 어떠한 예측 확률(predicted probability)로 어떤 지형으로 판단하였는지를 산출하고, 분석 조건별 그리고 지형별 정확도(accuracy) 및 특정 지형으로 잘못 분류된 비율(misclassified rate)을 계산하여, CNN을 이용한 이미지 기반 지형 분류가 갖는 한계점 및 의의를 살펴보았다. 본 연구에서는 Python 3.12를 이용해 모든 과정을 처리하였으며, CNN을 이용한 이미지 기반 지형 분류의 전체적인 구조(architecture)는 그림 4와 같다.
3. 연구 결과
분석 조건 및 지형에 따라 상관계수는 상당한 차이를 보이지만, 분석 조건별 100개 데이터 세트의 평균 정확도와 예측 확률 사이에는 모두 비례 관계가 확인되었다(표 1). 따라서 본 연구에서 정확도가 높은 지형은 상당히 높은 수준의 신뢰도 하에 예측이 이루어진 것으로 생각된다.
표 1.
평균 정확도와 평균 예측 확률 사이의 상관계수(R)
| landform | testA | testB | testC | testD | testE | testF | all data |
| cliff | 0.557*** | 0.460*** | 0.555*** | 0.331*** | 0.451*** | 0.373*** | 0.746*** |
| dome | 0.507*** | 0.431*** | 0.586*** | 0.354*** | 0.668*** | 0.494*** | 0.602*** |
| tor | 0.503*** | 0.316** | 0.258** | 0.142 | 0.475*** | 0.189 | 0.499*** |
| talus | 0.496*** | 0.591*** | 0.408*** | 0.360*** | 0.328*** | 0.367*** | 0.547*** |
| waterfall | 0.331*** | 0.131 | 0.399*** | 0.045 | 0.356*** | 0.298** | 0.495*** |
| pothole | 0.280** | 0.465*** | 0.446*** | 0.438*** | 0.302** | 0.422*** | 0.552*** |
| stream cliff | 0.447*** | 0.334*** | 0.406*** | 0.303** | 0.503*** | 0.243* | 0.785*** |
| alluvial fan | 0.377*** | 0.232* | 0.276** | 0.102 | 0.384*** | 0.419*** | 0.463*** |
| valley plain | 0.230* | 0.358*** | 0.348*** | 0.349*** | 0.467*** | 0.332*** | 0.499*** |
| riverine wetland | 0.538*** | 0.445*** | 0.417*** | 0.354*** | 0.439*** | 0.485*** | 0.867*** |
| river terrace | 0.477*** | 0.176 | 0.377*** | 0.411*** | 0.290** | 0.178 | 0.384*** |
| lacustrine wetland | 0.528*** | 0.488*** | 0.330*** | 0.273** | 0.592*** | 0.501*** | 0.490*** |
| rock river bed | 0.280** | 0.364*** | 0.354*** | 0.297** | 0.394*** | 0.315** | 0.389*** |
| floodplain | 0.369*** | 0.392*** | 0.340*** | 0.251* | 0.379*** | 0.230* | 0.383*** |
| artificial lake | 0.546*** | 0.286** | 0.259** | 0.346*** | 0.369*** | 0.451*** | 0.637*** |
| sea cliff | 0.434*** | 0.454*** | 0.233* | 0.321** | 0.213* | 0.246* | 0.766*** |
| wave-cut platform | 0.323** | 0.317** | 0.353*** | 0.354*** | 0.341*** | 0.507*** | 0.612*** |
| sea stack | 0.359*** | 0.401*** | 0.314** | 0.276** | 0.494*** | 0.461*** | 0.626*** |
| tidal flat | 0.493*** | 0.490*** | 0.554*** | 0.465*** | 0.475*** | 0.423*** | 0.671*** |
| pebble beach | 0.181 | 0.270** | 0.262** | 0.170 | 0.234* | 0.222* | 0.460*** |
| sand beach | 0.495*** | 0.483*** | 0.411*** | 0.499*** | 0.413*** | 0.461*** | 0.460*** |
CNN을 이용한 이미지 기반 지형 분류의 지형별 그리고 분석 조건별 정확도를 그림 5에 나타내었다. 훈련 자료에 대한 이미지 증강은 실시하지 않고, 모든 원자료를 이용한 testA의 지형별 평균 정확도는 13.8~75.4%의 범위를 나타내며, 하천습지가 가장 높은 평균 정확도를 그리고 호소성습지가 가장 낮은 평균 정확도를 보인다. 하천습지 이외에, 폭포, 하식애, 인공호수, 해식애 및 모래해안에서도 60% 이상의 높은 평균 정확도를 확인할 수 있는 데 반해, 암석돔, 애추, 선상지, 하안단구, 호소성습지, 시스택 및 자갈해안은 40% 이하의 낮은 평균 정확도를 나타내며, 특히 하안단구 및 호소성습지에서는 20% 이하의 매우 낮은 평균 정확도가 확인된다. 이외의 지형 중, 포트홀, 기반암하상 및 간석지는 50~60% 사이의 평균 정확도를 그리고 급애, 토르, 곡저평야, 범람원 및 파식대는 40~50% 사이의 평균 정확도를 나타낸다. testA의 전체 평균 정확도는 약 48.2%이다.
임의로 500장의 지형별 사진을 선별하고 훈련 자료에 대한 이미지 증강은 실시하지 않은 testB의 경우, testA에 비해 자료가 감소했음에도 불구하고 전체 평균 정확도는 약 48.9%로 큰 차이를 보이지 않는다. 지형별 평균 정확도는 20.2~68.7%의 범위로, 지형 사이의 평균 정확도 차이는 감소하였다. 인공호수가 가장 높은 평균 정확도를 나타내며, 가장 낮은 평균 정확도는 하안단구에서 확인된다. 하안단구 이외에, 급애, 선상지, 하천습지 및 호소성습지도 40% 이하의 낮은 평균 정확도를 나타내며, 인공호수와 더불어, 폭포, 포트홀 및 모래해안도 60% 이상의 높은 평균 정확도를 보인다. 이외의 지형 중, 암석돔, 애추, 기반암하상, 범람원, 해식애, 시스택 및 간석지는 50~60% 사이의 평균 정확도를 그리고 토르, 하식애, 곡저평야, 파식대 및 자갈해안은 40~50% 사이의 평균 정확도를 나타낸다.
testA의 훈련 자료에 대해 이미지 증강을 실시한 testC의 지형별 평균 정확도는 23.2~78.0%의 범위를 나타내며, 전체 평균 정확도는 약 55.4%로 testA에 비해 약간 증가하였다. 해식애 및 하안단구가 각각 가장 높고 낮은 평균 정확도를 보이며, 해식애 이외에 폭포, 포트홀, 하식애, 하천습지, 기반암하상, 인공호수, 간석지 및 모래해안에서도 60% 이상의 높은 평균 정확도가 확인된다. 하안단구와 더불어, 암석돔, 선상지 및 호소성습지도 40% 이하의 낮은 평균 정확도를 나타낸다. 이외의 지형 중, 급애, 토르, 애추, 곡저평야, 범람원 및 파식대에서는 50~60% 사이의 평균 정확도를 그리고 시스택 및 자갈해안에서는 40~50% 사이의 평균 정확도를 확인할 수 있다.
testB의 훈련 자료를 이미지 증강한 testD의 지형별 평균 정확도는 24.5~77.7%의 범위를 나타내, testC에 비해 지형 사이의 평균 정확도 차이는 감소하였지만, 전체 평균 정확도는 약 55.5%로 큰 차이를 보이지 않는다. testC와 마찬가지로 하안단구가 가장 낮은 평균 정확도를 나타내지만, 가장 높은 평균 정확도는 인공호수에서 확인된다. 인공호수와 더불어, 암석돔, 폭포, 포트홀, 기반암하상, 해식애, 시스택, 간석지 및 모래해안도 60% 이상의 높은 평균 정확도를 보인다. 하안단구 이외에, 40% 이하의 낮은 평균 정확도는 급애(약 25.3%)에서도 확인된다. 이외의 지형 중, 토르, 애추, 하식애, 곡저평야, 범람원 및 파식대는 50~60% 사이의 평균 정확도를 그리고 선상지, 하천습지, 호소성습지 및 자갈해안은 40~50% 사이의 평균 정확도를 나타낸다.
전체 사진 자료를 그대로 이용하고 새로운 데이터 세트의 훈련 자료에 대한 이미지 증강을 실시한 testE는 약 55.1%의 전체 평균 정확도를 나타내, testC 및 testD와 큰 차이를 보이지 않는다. 또한 testC 및 testD와 동일하게, 하안단구가 약 22.7%의 가장 낮은 평균 정확도를 나타내지만, 가장 높은 평균 정확도는 하천습지(약 78.6%)에서 확인된다. 하천습지와 함께, 폭포, 하식애, 인공호수, 해식애 및 모래해안도 70% 이상의 매우 높은 평균 정확도를 그리고 포트홀, 기반암하상 및 간석지는 60% 이상의 높은 평균 정확도를 나타낸다. 하안단구 이외에, 암석돔, 선상지 및 호소성습지는 40% 이하의 낮은 평균 정확도를 보인다. 이외의 지형 중, 급애, 토르, 애추, 곡저평야 및 파식대에서는 50~60% 사이의 평균 정확도가 그리고 범람원, 시스택 및 자갈해안에서는 40~50% 사이의 평균 정확도가 확인된다.
지형별 사진 자료가 500장으로 testD와 동일하지만, 새로운 데이터 세트의 훈련 자료를 이미지 증강한 testF의 지형별 평균 정확도는 23.5~77.8%의 범위를 나타내며, 전체 평균 정확도는 약 55.7%로 testC, testD 및 testE와 큰 차이를 보이지 않는다. 인공호수 및 하안단구가 각각 가장 높고 낮은 평균 정확도를 보이며, 인공호수와 더불어, 암석돔, 폭포, 포트홀, 기반암하상, 해식애, 시스택, 간석지 및 모래해안도 60% 이상의 높은 평균 정확도를 나타낸다. 반면 급애에서는 약 25.2%의 낮은 평균 정확도가 확인된다. 이외의 지형 중, 토르, 애추, 하식애, 곡저평야, 범람원, 파식대 및 자갈해안은 50~60% 사이의 평균 정확도를 그리고 선상지, 하천습지 및 호소성습지는 40~50% 사이의 평균 정확도를 나타낸다.
이상의 분석 결과를 정리하면, 급애, 하식애 및 하천습지와 같이 자료가 상대적으로 많은 지형은 임의로 500장을 선정하여 분석하였을 경우 자료 감소에 따라 정확도 역시 감소하는 경향을 나타내지만, 암석돔, 호소성습지 및 시스택과 같이 자료가 상대적으로 적은 지형은 오히려 정확도가 증가하는 모습을 보인다. 이는 결국 훈련 자료의 수가 분석 결과에 분명히 영향을 미치고 있음을 의미하며, 추후 CNN을 이용한 이미지 기반 지형 분류 연구에 반드시 고려되어야 할 변수로 생각된다. 그러나 폭포, 하식애 및 선상지와 같은 일부 지형은 이러한 경향과는 차이를 나타내, 지형 자체의 특성도 일정 부분 영향을 미치고 있는 것으로 판단된다. 또한 지형에 따라 정도의 차이는 있지만, 이미지 증강에 따라 모든 지형의 평균 정확도가 증가하였다. 따라서 보다 정확한 분류 결과를 위해서는 이미지 증강이 CNN을 이용한 이미지 기반 지형 분류에 반드시 포함되어야 할 것으로 생각된다. 다만 본 연구에서 사용된 기하학적인 이미지 증강 기법 이외에, 지형 분류를 위한 효과적인 이미지 증강 기법에 관해서는 추가적인 연구가 요구된다.
폭포, 인공호수 및 모래해안은 분석 조건과 관계없이 모두 60% 이상의 높은 평균 정확도를 보이지만, 하안단구는 모두 40% 이하의 낮은 평균 정확도를 나타낸다. 또한 애추, 포트홀, 기반암하상, 해식애 및 간석지에서는 대체로 비교적 높은 평균 정확도를 그리고 선상지 및 호소성습지에서는 대체로 비교적 낮은 평균 정확도를 확인할 수 있다.
해당 지형이 어떠한 지형으로 잘못 분류되었는지를 보여주기 위해, 잘못 분류된 비율의 평균이 10% 이상인 지형을 분석 조건별로 표 2에 정리해 두었으며, testD의 지형별 잘못 분류된 비율의 변화를 그림 6에 나타내었다. 급애는 동일한 산지 지형인 암석돔, 토르 및 애추로 잘못 분류되는 경우가 많았으며, 급경사 지역이라는 공통점이 있는 하식애로 잘못 분류되기도 하였다. 암석돔의 경우, 모든 분석 조건에서 급애가 10% 이상의 비율을 보이고, 토르는 분석 조건에 따라 약간 다르지만 급애로 잘못 분류되기도 하였다. 애추는 급애 또는 하식애로 잘못 분류되었다.
표 2.
잘못 분류된 비율의 평균이 10% 이상인 지형
폭포는 분석 조건과 관계없이 모두 기반암하상으로 잘못 분류되었고, 포트홀 역시 기반암하상으로 잘못 분류되는 경우가 많았지만, 분석 조건에 따라 폭포로 잘못 분류되기도 하였다. 하식애의 경우 일부 분석 조건에서 애추로 잘못 분류되었으며, 선상지는 곡저평야, 하천습지, 하안단구 및 범람원과 같이 다양한 지형으로 잘못 분류되었다. 곡저평야는 선상지와 유사하게, 선상지, 하천습지 및 하안단구로 잘못 분류되는 경우가 많았고, 하천습지는 습지라는 공통점을 갖는 호소성습지로 그리고 보통 하천습지와 인접해 분포하는 범람원으로 잘못 분류되기도 하였다. 하안단구의 경우, 선상지나 곡저평야와 비슷하게, 선상지, 곡저평야, 하천습지 및 범람원처럼 다양한 지형으로 잘못 분류되었으며, 호소성습지는 습지라는 공통점을 갖는 하천습지로 그리고 호소성습지가 잘 발달하는 인공호수로 잘못 분류되는 경우가 많았다. 기반암하상은 대부분 폭포로 잘못 분류되었지만, 분석 조건에 따라 포트홀로 잘못 분류되기도 하였으며, 범람원은 곡저평야 또는 하천습지로 잘못 분류되는 경우가 많았다. 인공호수는 testA에서만 하천습지가 10% 이상의 비율을 기록하였다.
해식애는 분석 조건에 따라 시스택으로 잘못 분류되기도 하였으며, 파식대는 보통 파식대 배후에 나타나는 해식애나 자갈해안으로 잘못 분류되었다. 시스택은 분석 조건과 관계없이 모두 해식애로 잘못 분류되었고, 간석지는 testA에서만 모래해안이 10% 이상의 비율을 기록하였다. 자갈해안의 경우, 모든 분석 조건에서 파식대 및 모래해안으로 잘못 분류되었으며, 모래해안은 testB에서만 간석지가 10% 이상의 비율을 나타낸다.
지금까지 잘못 분류된 비율의 평균이 10% 이상인 지형을 중심으로 잘못 분류된 사례를 살펴보았다. 그러나 잘못 분류된 비율의 평균이 10% 이하이지만, 비교적 높은 비율을 나타내는 경우도 상당히 많다. testD의 급애를 예로 들면, 암석돔, 토르 및 애추가 10% 이상의 평균 비율을 나타내지만, 하식애도 약 8.4%의 비교적 높은 평균 비율을 보인다(그림 6A). 또한 선상지의 경우, 10% 이상의 평균 비율은 곡저평야, 하안단구 및 범람원에서 확인되지만, 하천습지 또한 약 7.7%의 비교적 높은 평균 비율을 나타낸다(그림 6H). 이러한 결과는 특정 지형과 잘못 분류된 지형 사이에 사진에서 발견되는 공통적인 특징이 있음을 의미한다.
다만 지형에 따라 특정 지형으로 잘못 분류되는 사례가 아예 없는 경우도 있다. testD를 예로 들면(그림 6), 토르는 곡저평야, 범람원 및 인공호수로, 폭포는 암석돔 및 범람원으로, 선상지 및 곡저평야는 포트홀로, 기반암하상은 암석돔으로, 범람원 및 간석지는 폭포로, 인공호수는 토르로 그리고 시스택은 곡저평야로 잘못 분류된 사례가 아예 없다. 이는 이러한 지형은 사진에서 발견되는 공통적인 특징이 아예 없음을 나타낸다.
4. 토론
본 연구에서는 전국자연환경조사 사진 자료를 바탕으로 CNN을 이용한 이미지 기반 지형 분류를 시도해 보았다. 지형을 표현하는데 사진이라는 도구는 과거는 물론 현재에도 매우 효과적이고 유용한 방법 중 하나이며, 이러한 사진에 표현된 지형의 특징에 기초한 지형 분류는 지형분류도 제작에 새로운 가능성을 제시해 줄 수 있을 것으로 기대된다.
그러나 특정 지형을 촬영한 사진에 기반한 지형 분류는 사진에서 발견되는 특징만을 고려하기 때문에, 지형의 형태에 기초한 형태적 분류에 해당한다. 지형의 종류를 파악해 낼 수 있다는 점에서 일정 부분 성인적 분류도 가능하지만, 특정 지형을 형성한 다양한 작용을 반영하지 못하기 때문에 성인적 분류는 어렵다. 또한 본 연구에서는 가급적 해당 지형의 전경을 촬영한 사진을 이용하였기 때문에, 선상지, 곡저평야, 하안단구 및 범람원과 같은 지형을 촬영한 사진은 해당 지역의 토지이용이나 토지피복을 나타낼 뿐, 유사한 하천 작용으로 형성된 지형을 구분해 낼 수 없다. 이러한 이유로 폭포, 인공호수 및 모래해안과 같이, 형태적인 요소가 특징적인 지형 또는 형태 자체가 지형을 분류하는 데 중요한 지형의 분류 정확도는 높지만, 하안단구처럼 지형 형성 작용이나 경사, 하상비고와 같이 사진만으로는 파악할 수 없는 요소가 특징적인 지형의 분류 정확도는 낮게 산출된 것으로 생각된다. 이처럼 분류 정확도가 낮은 일부 지형 중 어느 정도 이상의 규모를 갖는 지형은 DEM, 경사 및 하계망과 같은 다양한 자료가 추가된다면 분류 정확도를 높일 수 있을 것으로 기대된다. 다만 보통 규모가 작은 토르, 폭포, 포트홀 및 기반암하상과 같은 지형은 래스터 자료의 공간 해상도가 제한적이기 때문에, 분류 정확도를 높이는 데 한계가 있을 것으로 생각된다. 소규모 지형의 경우, LiDAR 또는 사진 측량(photogrammetry) 기법을 활용한 고해상도(1m 이하) DSM이 대안이 될 수 있지만, 전국자연환경조사와 같이 전국 단위에서 이루어지는 조사 사업에서 이를 구축하는 데에는 현실적인 제약이 따를 것으로 예상된다.
사진 이외의 추가적인 자료를 이용하기 위해서는 해당 사진이나 지형의 위치 정보는 매우 중요하게 작용한다. 그러나 그림 1에 나타낸 바와 같이, 전국자연환경조사를 통해 확인된 지형 중 위치 정보가 누락된 자료가 적지 않을 것으로 생각된다. 예를 들어, 본 연구에서 분석된 총 16,104장의 사진 자료 중 약 9.2%에 해당하는 사진 자료의 위치 정보가 존재하지 않는다. 더구나 위치 정보의 신뢰도에 의문인 자료도 많다(그림 1B, 1D 참조). 이러한 점 역시 이미지 기반 지형 분류에 있어 한계점으로 작용할 수 있다. 한편 위치 정보가 정확하다고 하더라도, 해당 지형의 공간적인 범위를 어떠한 기준으로 산정할 것인가 역시 큰 문제가 될 수 있다. 최근 전국자연환경조사에서는 원자료 입력시스템을 도입하여 위치 정보 및 공간적 범위의 정확도를 개선하고 있다. 그러나 신뢰도 확보를 위해, 해당 시스템을 통해 구축된 자료만을 분석 대상으로 한정할 경우, 도입 시기가 비교적 최근이라는 점에서 다양한 지형에 대한 충분한 자료 확보에 한계가 있을 수 있다.
본 연구에서 분석된 총 21개 종류의 지형은 형태만을 고려한다면 공통적인 특징을 갖는 몇 개의 범주로 구분할 수 있다(그림 2 참조). 우선 급애, 암석돔, 토르, 하식애, 해식애 및 시스택은 급경사의 기반암이 노출된 지역이라는 공통점이 있으며, 특히 급애 및 암석돔은 보는 각도에 따라 서로 다르게 인식되기도 한다. 폭포, 포트홀 및 기반암하상은 하상에 기반암이 노출된 지역이라는 공통적인 특징을 갖는다. 하천과 인접한 완경사 지역이라는 측면에서 곡저평야, 하안단구 및 범람원 그리고 비교적 완경사 지역으로 범위를 확대하면 선상지까지도 포함 가능할 것으로 생각된다. 또한 이러한 지형은 대체로 유사한 토지이용이나 토지피복을 나타낸다. 하천습지 및 호소성습지는 분포 지역에서는 차이를 보이지만 습지라는 공통점을 나타내고, 인공호수는 호소성습지가 잘 발달하는 지역이라는 특징을 갖는다. 자갈해안 및 모래해안은 구성 물질의 크기에 차이가 있지만 매우 유사한 형태의 지형으로 볼 수 있다. 이러한 형태적인 공통점으로 인해, 이미지 기반 지형 분류 시 해당 범주 내에서 다른 지형으로 잘못 분류될 가능성이 크다. 전술한 바와 같이, 잘못 분류된 비율의 평균이 10% 이상인 지형을 살펴보면, 형태적인 측면 또는 토지이용이나 토지피복에서 일정 부분 공통점이 있음을 확인할 수 있다(표 2, 그림 6 참조). 이러한 특정 지형 사이의 형태적인 공통점은 결국 이미지 기반 지형 분류의 또 다른 한계점으로 작용할 수 있다.
전국자연환경조사에서는 보존 가치가 높은 지형의 경우 지속적으로 재조사가 이루어지고 있으며, 이 과정에서 지형 명칭이 변경되는 경우도 많다. 다시 말해, 동일한 지형이 조사자에 따라 다른 지형으로 분류되기도 한다. 예를 들어, 그림 3는 경남 합천군 가야산국립공원 남산제일봉(1,054 m) 정상부로, 2000년에는 산정으로 조사되었으나 2012년, 2014년에는 토르로 재조사되었다. 이러한 지형 명칭의 변경은 해당 지형 중 어떤 부분을 더 강조할 것인가와 같이 조사자 사이의 주관적인 판단 차이로 생각된다. 그러나 지형 명칭의 변경은 동일 지형을 촬영한 사진 자료가 서로 다른 지형의 원자료로 활용될 수 있음을 의미하며, 이로 인해 분류 정확도가 낮아질 수 있다. 또한 일정한 공간적 범위 내에서 다양한 지형이 나타날 경우, 해당 지역을 어떤 지형으로 분류할 것인지는 조사자의 주관적인 판단에 기초한다. 이는 결국 유사한 사진 자료가 서로 다른 지형의 원자료로 이용될 수 있다는 것을 의미하며, 이 역시 이미지 기반 지형 분류의 정확도를 낮출 수 있다.
이미지 기반 지형 분류에 있어, 또 다른 한계점은 식생이나 인공 구조물과 같이 지형 이외의 요소가 특정 지형과 함께 사진에 표현된다는 점이다. 특히 식생의 경우, 대부분의 지형을 촬영할 때 피할 수 없으며, 호소성습지 및 인공호수와 같이 일부 지형은 식생의 존재 여부에 따라 지형 분류가 달라지기도 한다. 따라서 이러한 식생이나 인공 구조물이 분류 정확도를 낮추는 요인으로 작용하거나, 특정 지형이 잘못 분류될 가능성도 있다. 더구나 식생으로 과도하게 피복되어 있으면, 해당 지형의 인지 자체가 불가능하다. 다만 전술한 바와 같이, 본 연구에서는 구름, 안개, 식생으로 과도하게 가려 해당 지형을 인지하기 어려운 사진은 모두 제외하였지만, 대부분의 사진에 식생은 존재하고 이러한 식생으로 인해 분류 정확도가 낮아질 수 있을 것으로 생각된다. 또한 분류 정확도를 높이기 위해서는 원자료 자체가 정제되어야 한다. 다시 말해, 특정 지형을 잘 표현해 주고 있는 사진 자료만을 활용해야 이미지 기반 지형 분류의 정확도를 높일 수 있다.
전술한 한계점과 유사한 맥락에서, 특정 지형을 촬영할 때 원하는 지형 이외에 다른 지형도 같이 촬영될 수 있으며, 서로 다른 지형이 인접해 있는 경우도 많다(그림 2 참조). 예를 들어, 애추는 급애와 인접해 있으며, 파식대의 배후에는 보통 해식애가 자리 잡고 있다. 간석지는 자갈해안이나 모래해안과 연속적으로 분포해 있는 경우도 있다. 이러한 분포 특성은 해당 지형의 이미지 기반 지형 분류에 큰 문제가 될 수 있다. 즉 인접한 지형이 강조될 경우, 해당 지형이 인접한 지형으로 잘못 분류될 가능성도 있고, 해당 지형의 특징에 인접한 지형의 특징이 반영될 수도 있다. 이러한 문제는 특정 사진에서 해당 지형을 잘 표현해 주고 있는 부분만 잘라내는 방법을 통해 어느 정도 보완할 수 있지만, 추가적인 처리와 이에 따른 시간이 필요하다.
이러한 여러 한계점에도 불구하고, CNN을 이용한 이미지 기반 지형 분류는 지형 분류나 지형 연구에 새로운 가능성을 제시해 줄 수 있을 것으로 생각된다. 상당한 시간이 소요되기는 하지만, 대용량의 자료 처리가 가능하다는 점에서 매년 많은 양의 자료가 축적되는 전국자연환경조사와 같은 조사 사업의 자료를 적극적으로 활용할 수 있고, 지속적인 자료 축적으로 분류 정확도 개선이 가능할 것으로 생각된다. 또한 전술한 바와 같이, 사진 자료만으로는 지형 분류에 일정한 한계가 있기 때문에, 사진 자료와 더불어 다양한 자료를 바탕으로 이루어지는 멀티 모달 CNN(Du et al., 2019)이 대안이 될 수 있다. 딥러닝 기반 지형 분류는 성인적 분류에 한계가 있음이 분명하지만, 멀티 모달 CNN의 개념을 통해 일정 부분 극복할 수 있을 것으로 생각된다. 특히 지형의 종류 자체를 판단할 수 있다는 점에서 지형의 형태적 분류에 새로운 대안을 제시해 줄 수 있을 것으로 기대된다.
전술한 바와 같이, CNN을 이용한 이미지 분류는 다양한 분야에서 널리 활용되어 왔지만, 아직 국내 지형학 분야에서는 적용된 바가 없다. 그러나 CNN을 이용한 이미지 분류는 화분, 식물규소체 및 규조의 동정에도 이용될 수 있으며, 이를 통해 동정의 객관성을 높이거나 고기후 변화 관련 연구에 도움을 줄 수 있을 것으로 기대된다. 또한 기존에 개발된 다양한 애플리케이션을 기반으로 광물 및 암석의 분류에도 확장 적용이 가능하다. 나아가 다양한 공간 정보 기반 자료를 이용하여 분류 정확도가 개선된다면, 로드뷰, 거리뷰 및 스트리트뷰와 같은 자료를 통해 지형을 탐지, 분류할 수 있는 애플리케이션을 활용하여, 일반 대중의 지형 접근성을 높이는 데에도 기여할 수 있을 것으로 기대된다. 다만 이러한 CNN을 이용한 이미지 분류의 활용을 위해서는 반드시 다양한 형태와 충분한 자료를 통한 분류 정확도 개선이 선행되어야 할 것이다.
5. 결론
본 연구에서는 21개 종류의 지형에 대한 16,104장의 전국자연환경조사 사진 자료를 바탕으로 CNN을 이용한 이미지 기반 지형 분류를 시도해 보고, 이러한 지형 분류의 한계점 및 의의를 살펴보았다.
6가지 분석 조건의 전체 평균 정확도는 48.2~55.7%의 범위를 나타내며, 폭포, 인공호수 및 모래해안과 같이 형태적인 측면이 중요한 지형의 분류 정확도는 높지만, 하안단구처럼 형태보다는 지형을 형성한 작용이 중요한 지형은 낮은 분류 정확도를 나타내었다. 이외에, 형태적인 측면이 중요한 애추, 포트홀, 기반암하상, 해식애 및 간석지도 비교적 높은 분류 정확도를 보이며, 선상지 및 호소성습지에서는 비교적 낮은 분류 정확도가 확인되었다. 사진에서 발견되는 형태적인 특징이 유사한 지형 그리고 토지이용이나 토지피복이 유사한 지형은 서로 잘못 분류되기도 하였다. 자료의 수에 따라 그리고 이미지 증강의 적용 여부에 따라서도 분류 정확도에 차이를 나타내, 추후 이미지 기반 지형 분류에 있어 반드시 고려되어야 할 변수로 생각된다. 다만 자료의 수가 정확도에 미치는 영향은 지형에 따라 달라지기도 하며, 사진에서 발견되는 공통적인 특징이 없는 지형 사이에는 잘못 분류되는 경우가 아예 없기도 하였다. 지형 분류에 적합한 이미지 증강에 관해서는 추후 연구가 이루어져야 할 것으로 생각된다.
인간은 형태뿐만 아니라, 식생, 하천이나 바다, 기반암 분포, 경사, 사면향, 하상비고 및 주변 지형과의 관계와 같은 다양한 정보를 바탕으로 지형을 인지, 분류한다. 그러나 CNN을 이용한 이미지 기반 지형 분류는 사진에 반영된 특정 지형의 특징만을 고려한다. 이러한 태생적인 한계는 특히나 전국자연환경조사와 같이 숙련된 인간의 인지에 의한 지형 분류보다 정확도가 낮을 수밖에 없음을 의미한다. 다만 사진 자료 이외의, 고도, 경사, 기반암, 위성영상 및 항공사진 등 다양한 자료가 추가된다면 분류 정확도를 보다 높일 수 있을 것으로 기대되며, 지형 분류나 지형 연구에 새로운 가능성을 제시해 줄 수 있을 것으로 생각된다.








