Research Article

Journal of the Korean Geographical Society. 30 June 2021. 247-264
https://doi.org/10.22776/kgs.2021.56.3.247

ABSTRACT


MAIN

  • 1. 서론

  • 2. 관련 연구

  •   1) 딥러닝을 이용한 관광 사진 분류

  •   2) 관광객과 거주자 간 관광 활동의 차이

  • 3. 데이터 수집 및 분석방법

  •   1) 데이터 수집 및 관광객 분류

  •   2) 관광 사진 분류체계 및 관광 사진 분류를 위한 딥러닝 모델

  •   3) 관광 활동 유형별 주요 방문지 분석

  • 4. 분석결과

  •   1) 관광객과 거주자의 서울 이미지

  •   2) 관광객과 거주자의 주요 방문지 분석

  •   3) 관광객과 거주자의 관광 활동 유형별 차이 분석

  • 5. 결론

1. 서론

최근 소셜네트워크서비스(SNS)의 사용이 일상화되고, 이와 관련된 방대한 양의 데이터가 생산되고 있다. 사람들은 SNS를 통해 본인의 활동, 의견 등을 표출하고, 다른 사람과 이를 교류한다. 특히 관광과 관련하여 사람들은 SNS를 통해 관광 정보를 얻고, 여행 중에는 글이나 사진을 게시하여 다른 사람들과 공유하며, 관광 활동 후에는 관광지에서의 사진을 게시한다. 이러한 SNS 데이터는 관광지에서의 대표 관광요소 및 관광객이 관광지에 대해 갖는 이미지를 나타내는 것으로 평가되고 있다(Parra-López et al., 2011; Donaire et al., 2014; Hunter, 2016). 전 세계적으로 관광시장의 경쟁이 치열해지면서 관광지에 대해 갖는 이미지(tourist destination image)는 매우 중요한 개념이 되었다. Hunt(1975)는 관광 이미지를 “개인 혹은 일련의 사람들이 그들이 살고 있지 않은 장소에 대해 갖게 되는 인상”이라고 정의한 바 있다. 이러한 관광 이미지 형성에 있어 기존에는 관광공사와 같은 기관에서 형성하는 이미지가 주요했다면 최근에는 관광객들이 생성하는 사용자 생성 콘텐츠(User Generated Contents, UGC)가 주요한 역할을 하는 것으로 평가되고 있다(Gilbert and Hancock, 2006; Hunter, 2013). 이러한 배경하에 관광 분야에서 사용자들이 생성하는 SNS를 분석하는 연구가 급증하고 있다.

SNS 데이터 중 특히 위치기반 SNS(Location Based Social Network Service, LBSN)는 위치정보를 포함하고 있어 다양한 분석에 활용되어 왔다. 특히 플리커 데이터는 사진을 공유하는 대표적인 SNS로 사진 메타 데이터에 위치 및 시간 정보를 포함하고 있어 다양한 연구의 기초자료가 되었다. 플리커가 게시된 위치정보를 이용한 주요 방문지역(Region of Attraction, ROA) 분석(김나연・강영옥, 2019; 김나연 등, 2019; Kádár, 2014; García-Palomares et al., 2015; Kádár and Gede, 2013; Leung et al., 2016), 이동패턴 분석(이주윤 등, 2019; Yuan and Medal, 2016; Liu et al., 2018; Zheng et al., 2012; Kurashima et al., 2013; Vu et al, 2015; Farzanyar and Cercone, 2015), 사진에 태그된 텍스트를 이용한 도시 이미지나 감성 분석(박예림 등, 2019; 이혜진・강영옥, 2020a, 2020b; Lee and Kang, 2021; Kisilevich et al., 2013; Gentile, 2011; Rattenbury and Naaman, 2009) 등의 연구가 이루어졌다. 그러나 대부분의 연구가 사진의 메타 데이터에 포함된 위치정보를 이용하거나 사진에 태그된 텍스트를 이용한 연구가 주를 이루었다. 관광객이 게시한 사진이 관광 이미지 형성에 중요함이 인식되면서 관광객이 게시한 사진을 분석하는 연구들이 이루어졌지만(Pan et al., 2014; Kim et al., 2014) 사진의 시각적 내용에 대한 분석은 매우 제한적이었다. 이는 사진의 시각적 내용을 분석할 수 있는 방법론의 한계 때문이었다.

최근 인공지능영역에서 컴퓨터 비전과 이미지 처리 기술이 발전하면서 사진을 분석하는 기술도 빠르게 발전하고 있다. 특히 대용량의 데이터에 맞춰 잘 훈련된 모델들이 공개되면서 전이학습(transfer learning)을 통해 다른 영역에 이를 적용하는 것이 증가하고 있다. 관광영역에서도 사전훈련된 모델들을 기반으로 관광 사진을 분류하고, 이를 토대로 관광지 이미지를 분석하는 연구들이 시작되고 있다. 하지만 사전 훈련된 모델을 사용하는 경우 해당 지역의 독특한 경관이나 관광지 특성 등을 제대로 반영하지 못하는 문제점이 나타나고 있다(Kim et al., 2020; Kang et al., 2021). 본 연구의 목적은 한국특성에 맞게 훈련시킨 딥러닝 모델을 활용하여 SNS 사진을 분류하고, 이를 통해 관광객과 거주자의 관광 활동의 차이를 밝히고자 한다. 이를 위해 첫째, 지난 6년간 서울지역 내 게시된 플리커 데이터를 수집한 후 플리커 사용자를 관광객과 거주자로 분류하고, 둘째, 수집된 플리커 사진 데이터를 딥러닝 모델을 활용하여 분류한 후, 셋째, 관광객과 거주자의 주요 방문지, 관광 활동 유형별 주요 방문지와 활동의 차이를 분석하였다.

2. 관련 연구

1) 딥러닝을 이용한 관광 사진 분류

컴퓨터 비전이란 컴퓨터를 활용하여 영상으로부터 의미 있는 정보를 추출하는 방법을 연구하는 분야로, 사람이 눈으로 사물을 보고 인지하는 과정을 컴퓨터가 하게끔 만들어 주는 학문 분야라 할 수 있다. 컴퓨터가 카메라와 동영상에서 디지털 이미지와 딥러닝 모델을 사용하여 객체를 정확하게 식별하고 분류하는 작업을 말하며, 객체 식별 및 분류정확도가 빠르게 발전하여 최근에는 사람보다 더 우수한 정확도로 시각적 정보를 감지하는 능력을 갖게되었다. 컴퓨터 비전과 관련된 연구는 최근 들어 딥러닝 기반 이미지 분류모델 중 하나인 합성곱신경망(CNN, Convolutional Neural Networks)이 소개되면서 빠르게 발전하고 있다. CNN의 대표적인 아키텍처로 AlexNet(Krizhevsky et al., 2012), GoogLeNet(Szegedy et al., 2015), ResNet(He et al., 2016), VGGNet(Simonyan and Zisserman, 2015), DenseNet(Huang et al., 2017), MobileNet(Howard et al., 2017) 등이 있다. 딥러닝 기반 이미지 분류에서 모델을 훈련시키기 위해서는 라벨이 부여된 데이터 셋이 필요하다. 딥러닝에 활용되는 대표적인 데이터베이스는 ImageNet이었고, ImageNet의 경우 14,197,122장의 이미지를 1,000개의 객체로 라벨링 한 데이터를 보유하고 있다. AlexNet, VGGNet, ResNet 등 많은 딥러닝 모델들이 ImageNet 데이터를 기반으로 모델의 성능을 평가받았다. 객체 분류를 나타내는 데이터베이스 외에도 씬을 분류한 데이터베이스도 있는데 대표적인 데이터 셋으로 SUN 데이터 셋(Xiao et al., 2010)과 Place 데이터 셋(Zhou et al., 2017)이 있다. SUN 데이터 셋은 108,754의 이미지를 397개의 씬으로 분류한 데이터 셋이며, Place 데이터 셋은 약 1000만 여장의 사진을 434개의 씬으로 구분한 데이터 셋이다. CNN 모델들이 이미지 인식에 뛰어난 성능을 보이는 것이 확인되면서 전이학습을 통해 대용량의 데이터로 훈련된 모델들을 다양한 분야에 적용하는 연구들도 증가하고 있다(Hussain et al., 2018). 전이학습이란 우수한 성능의 모델을 처음부터 훈련시키기엔 시간과 비용이 많이 들기 때문에 사전훈련된 모델의 파라미터 값을 대부분 고정한 채로, 훈련 가능한 새로운 레이어를 추가해 모델을 훈련시키는 방법을 말한다.

최근 들어 관광영역에서도 딥러닝 기술을 이용하여 사진의 시각적 내용을 분석하고, 이를 통해 관광 이미지를 분석하려는 연구들이 시작되고 있다. Zhang et al.(2019, 2020)은 Place365 데이터 셋을 훈련하여 만든 ResNet-101 모델을 사용하여 베이징과 홍콩지역에 게시된 플리커 사진을 통해 해당 지역의 관광지 이미지를 분석하였다. Chen et al.(2020)도 Place365_ResNet모델을 사용하여 플리커 사진을 분류하고, 런던지역의 도심지역과 비도심 지역 간 관심 지역의 차이와 계절별 역동성을 분석하였다. 한편 Kim et al.(2020)은 Inception V3 모델을 사용하여 서울방문 관광객이 게시한 플리커 사진을 분류하고, 이를 통해 서울 관광 이미지를 분석한 바 있다. 해당 연구에서 서울방문 관광객이 게시한 사진 38,891장을 Inception V3 모델을 사용하여 분류한 후 분류결과의 정확도를 확인한 결과 전체 정확도는 27.93%에 불과하며, 한국의 단독주택을 감옥으로 분류하거나 한국의 전통적인 건축물, 특이한 경관을 오 분류하는 문제점을 지적하면서 지역적인 특성을 반영할 수 있도록 관광 사진 분류 카테고리를 만들고 모델을 재훈련 시켜야 할 필요성을 제시하였다. 사전 훈련된 모델을 사용하는 경우 한계점에 대해 Chen et al.(2020)도 Place365 데이터 셋에 맞춰 훈련된 모델을 플리커 사진 분류에 적용하는 경우 분류가 제대로 되지 않을 가능성에 대해 문제점으로 제시한 바 있다. 특히 관광에서는 해당 지역의 독특한 경관이나 문화재, 체험활동 등이 관광 이미지 형성에 중요할 수 있는데, 사전훈련된 모델은 지역 특성을 제대로 식별하지 못할 가능성이 있기 때문이다. 이러한 필요성에 근거하여 Kang et al.(2021)은 대한민국 방문 관광객이 게시한 사진의 특성을 바탕으로 관광 사진 분류 카테고리를 개발하고, 이에 맞춰 사진을 분류할 수 있도록 Inception V3 모델을 재훈련한 딥러닝 모델을 연구하고, 공개하였다(https://github.com/ewha-gis/Korea-Tourists-Urban-Image). 해당 모델은 top 1 정확도 85.77%, top 5 정확도 95.69%로 상대적으로 높은 정확도를 갖고 있어, 본 연구에서 관광 사진 분류는 Kang et al.(2021)의 연구에서 한국 실정에 맞게 훈련한 딥러닝 모델을 사용하였다.

2) 관광객과 거주자 간 관광 활동의 차이

SNS 데이터 분석에 있어 관광객과 거주자 간 차이에 대한 분석은 관광객과 거주자 간 맞춤형 관광서비스 제공전략 및 관광서비스 개발에 대한 주요 아이디어를 얻을 수 있다. 조재희・서일정(2016)은 지오트윗 데이터를 수집하여 거주자와 관광객의 방문지와 이동반경의 차이를 분석하였다. 서울시를 대상으로 250미터 그리드 셀단위로 거주자와 방문객의 방문 셀 수 비교결과 방문 셀의 수는 거주자가 훨씬 많은 반면, 공간 이동성 지수는 외국인 방문객이 더 높음을 확인하였다. García-Palomares et al.(2015)는 파노라미오에 지오태깅된 위치정보를 활용하여 유럽 8개 도시에서 관광객과 거주자 간 방문지역의 차이를 분석하였다. 8개 도시를 헥사곤형태로 분할하여 관광객과 거주자가 게시한 사진 수를 비교하였는데 관광객은 거주자에 비해 방문하는 장소는 상대적으로 한정된 반면 이동 거리는 더 길게 나타났으며, 관광객의 방문지역은 8개 유럽 도시 가운데 상대적으로 관광객이 적은 도시에서 집중도가 높게 나타남을 밝혔다. Kádár and Gede(2013)는 부다페스트 지역을 대상으로 플리커 사진의 위치정보를 이용하여 거주자와 관광객의 주요 방문지 및 게시한 사진의 밀도분석을 수행하였다. 분석결과 관광객들은 주요 관광 명소 주변에서만 사진을 찍었지만, 지역 주민들은 레크레이션 공간이나 관광객에게 알려지지 않은 지역을 방문하는 것으로 나타났으며, 하루 방문한 관광객과 하루에서 열흘 사이로 방문한 관광객 사이에도 관광 패턴의 차이가 있음을 보여주었다. 이 외에 Yuan and Medel(2016), Liu et al.(2018) 등도 지오태깅된 플리커나 트윗 데이터를 이용하여 거주자와 관광객의 이동 차이를 밝히는 연구를 진행하였다. 관광영역에서 관광객과 거주자 간 관광 활동의 차이를 밝히는 연구들을 살펴보면 방문지역의 차이나 이동 거리의 차이 등을 밝히는 연구가 주를 이룸을 알 수 있으며, 실제 관광 활동 가운데에도 어떤 차이를 보이는지를 분석하는 연구는 이뤄지지 못하고 있음을 알 수 있다. 본 연구에서는 관광객과 거주자가 게시한 사진 분석을 통해 방문지역의 차이뿐 아니라 관광 활동의 차이를 밝히고자 한다.

3. 데이터 수집 및 분석방법

1) 데이터 수집 및 관광객 분류

플리커 데이터의 수집은 플리커에서 제공하는 공개 API(Application Programming Interface)를 통해 이루어졌다. 데이터 수집기간은 2013년 1월 1일부터 2018년 12월 31일까지 6년이며, 대한민국 범위에서 업로드된 사진 데이터를 크롤링하였다. 총 326,296건의 사진 데이터를 수집하였고, 사용자 수로는 5,609명이었다. 플리커 사용자 가운데 거주자와 관광객이 포함되어 있기 때문에 관광객 추정이 필요하였다. 각 사용자의 거주국 추정을 위해 마지막으로 사진을 올린 시점으로부터 이전 3년 동안 사용자가 전 세계에 업로드한 데이터를 크롤링하였다. 전 세계를 범위로 수집된 데이터는 2,281,800건이며, 사용자 수로는 5,609명이었으나, 사용자에 의해 게시물이 삭제되거나, 위경도 및 시간적 오류가 있는 데이터를 제거한 후 최종 수집된 데이터는 2,281,586건이며, 사용자 수로는 5,384명이었다.

수집된 전체 사용자 5,384명 중 프로필에 본인의 거주국 정보를 기입한 사용자는 2,020명(1,284,469건), 거주국 정보를 기입하지 않은 사용자는 3,364명(997,334건)으로 나타났다. 관광객 여부는 거주지 정보에 대한민국이 아닌 곳을 기재하거나, 대한민국을 15일 이내로 단기적으로 방문하거나, 최장체류 국가, 최빈 방문국, 가장 사진을 많이 촬영한 국가 등의 정보를 이용하여 거주국이 대한민국이 아닌 다른 국가로 추정되는 경우 관광객으로 추정하였으며, 거주지 추정 모델 적용결과 분류정확도는 89.1%로 도출되었다(강영옥 등, 2019). 대한민국을 방문한 관광객은 총 3,259명, 거주자는 2,125명이며, 이들이 게시한 사진 중 결측이 있는 데이터를 제외하고 각각 168,216건, 160,466건 추출할 수 있었다. 관광객과 거주자의 방문지역과 관광 활동의 차이를 상세히 분석하기 위해 연구대상 지역은 서울로 한정하였으며, 관광객 2,264명이 게시한 80,553장, 거주자 1,298명이 게시한 67,116장 등 총 147,669장의 사진이 분석의 대상이 되었다.

본 연구에서 데이터 수집은 python 3.6.5를 사용하였으며, 모델 전이학습과 이미지 분류에는 Tensorflow 1.13.0을 사용하였다. 모델 훈련과 사진 분류를 위한 실험환경은 Amazon Web Service(AWS)를 기반으로 하였고(OS는 Ubuntu 16.04, GPU는 NVIDIA Tesla v100 128 GB 8개, vCPU 64, RAM 488GB), 사진 데이터의 공간분석을 위한 GIS프로그램으로는 QGIS 3.6과 ArcGIS Pro 2.20을 활용하였다.

2) 관광 사진 분류체계 및 관광 사진 분류를 위한 딥러닝 모델

사진의 분류체계는 사진을 어떠한 목적에 따라 어떻게 분류할 것인가를 정하는 기준이 되기 때문에 해당 지역의 관광특성을 반영할 수 있도록 분류체계가 잘 만들어져야 하고, 개념적인 분류뿐 아니라 실제 딥러닝 모델을 통해 사진이 잘 분류될 수 있도록 해야 한다. 본 연구에서 기준으로 한 관광 사진 분류체계는 한국관광공사의 보고서, 실제 관광 활동 관련 앱에서 분류하는 체계, 관광 이미지 분석 등을 토대로 만든 관광 사진 분류체계(조나혜 등, 2019)를 초안으로 딥러닝 모델 훈련 과정에서 훈련데이터 구축 및 모델 훈련 후 정확도 평가 과정을 거쳐 최종 수정된 관광 사진 분류체계(Kang et al., 2021)를 기준으로 하였다. 최종분류체계는 표 1과 같이 75개의 씬으로 구분하였으며, 향후 관광 활동 유형별 해석의 용이성을 고려하여 12개의 카테고리로 그룹화하였다. 관광 사진 분류에는 세계 어느 지역에서나 볼 수 있는 일반적인 도시경관이나 자연경관 외에도 한국의 관광요소를 고려하는 거리 음식, 전통시장, 한국에서 즐길 수 있는 한복체험, 겨울철 체험 놀이, 전통공연, 한국의 거리에서 발견되는 벽화, 한옥마을, 한국의 궁궐에서 독특한 처마와 지붕, 그리고 독특한 건축물 등 한국적 요소들이 포함된 것을 확인할 수 있다. 75개의 씬 별 대표 사진은 그림 1과 같다. 마지막의 ‘분류 어려운 항목’은 실제 플리커 사용자들이 게시한 사진 가운데 초점이 흐리거나 불명확한 사진, 특정 부분을 확대한 사진 등 의미 없는 사진을 분석에서 제외하기 위한 씬으로 1차 모델에서 분류 어려운 사진을 걸러내고, 2차 분류에서는 해당 씬을 제외한 후 74개 씬별로 사진을 분류하였다.

표 1.

관광 사진 분류체계

카테고리 씬(scene)
음식 및 식당 음식, 길거리 음식, 디저트, 커피 및 차, 주류, 음식점 내부
쇼핑 재래시장, 상점가 상점 내부, 장난감 가게, 포장상품
체험활동 여가 놀이, 겨울 즐길 거리, 조망하기, 소원 쓰기, 전통한복체험, 무대공연, 스포츠 관람, 전통공연 관람,
등불 불꽃 축제
문화 및 유물 전쟁기념물, 유물, 고지도 및 현대미술, 실내조형물 및 전시관 내부, 실외조형물, 동상
도시경관 건물 경관, 건물 내부, 주택 경관, 스카이라인, 벽화 및 트릭아트, 서구식 건축물, 도로와 인도, 교량 및 다리,
광장 및 도심하천, 타워, 야경, 도시시설물
교통 자동차, 버스, 기차와 지하철, 플랫폼, 비행기, 오토바이와 자전거, 배, 차량 내부
자연경관 하늘, 산, 골짜기, 강, 바다, 꽃, 공원 및 산책로, 계절 경관
사람들 셀프카메라 및 단체 사진, 인파 및 군중
한국전통건축물 고궁, 왕좌 및 고궁 내부, 전각 및 정자, 기와집 및 돌담, 초가집 및 움집, 문살 및 한옥 내부, 서까래, 탑,
연등 및 제단
동물 강아지, 고양이, 동물, 물고기, 새 및 곤충
안내판 및 석조물 안내판, 기념비 와 거대석조물
숙소 및 비즈니스 숙소, 컨퍼런스
기타 분류 어려운 항목

https://static.apub.kr/journalsite/sites/geo/2021-056-03/N013560301/images/geo_56_03_01_F1.jpg
그림 1

75개 씬별 대표 사진

본 연구에서 사진 분류를 위한 딥러닝 모델은 Inception V3 모델을 전이 학습하여 재훈련 시킨 모델을 사용하였다(그림 2). Inception V3모델은 ImageNet 데이터 셋에 맞춰 훈련되었을 때 Top 1 에러율 17.3%, Top 5 에러율 3.58%로 이미지 분류를 위한 합성곱신경망 모델 가운데 분류성능이 좋은 모델 가운데 하나이다. 해당 모델을 75개 씬을 분류할 수 있도록 재훈련하기 위해 75개 씬별 대표 사진 300장을 추출하여 훈련데이터 셋을 구축한 후, 모델의 성능향상과 데이터 과적합 문제를 해결하기 위해 데이터 증강기법(data augmentation)을 적용하였다. 데이터 증강기법은 데이터 셋 내의 이미지를 변환하여 데이터 수를 증가시키는 방법으로, 자르기, 뒤집기, 확대, 축소, 이동 등 다양한 변환을 적용하여 학습 데이터의 수를 크게 늘릴 수 있다. 이를 통해 각 이미지의 정보에 영향을 주지 않고, 각 이미지의 표현을 변형함으로써 훈련 데이터 셋을 늘릴 수 있는 방법이다. 본 연구에서 데이터 증강기법에 적용된 사진 효과는 관광 사진이라는 특징을 고려하여 회전(Rotation), 확대(Zoom), 가로 뒤집기(Width Shift), 밝기 조절(Brightness), 층 밀리기(Shear)를 사용하였다. 모델의 훈련과 정확도 평가를 위해 전체 데이터 셋은 훈련용, 검증용, 테스트용으로 전체 데이터를 60%, 20%, 20% 비율로 나누어 사용하였다. 사진 수의 확대와 관련해서는 이미지 수를 점진적으로 늘려가면서 총 5개 사례의 성능을 확인하였다(표 2). 사례 1은 데이터 증강을 적용하지 않은 원본(22,384) 훈련 데이터 셋으로 생성된 모델이며, 사례 2부터 사례 5까지는 데이터 증강기법을 통해 훈련 데이터 셋을 원본 이미지의 2배로부터 5배까지 증가시킨 후 생성된 모델이다. 모델에 사용된 하이퍼 파라미터는 옵티마이저는 아담, 학습률은 0.0001, 배치사이즈는 128로 설정하였다. 모델에서 자체적으로 평가하는 정확도는 데이터 증강을 통한 사진 수가 증가할수록 정확도가 향상하는 것으로 나타났다.

https://static.apub.kr/journalsite/sites/geo/2021-056-03/N013560301/images/geo_56_03_01_F2.jpg
그림 2

재훈련된 Inception V3 모델 아키텍처 (출처 : Kang et al., 2021)

표 2.

데이터 증강기법 적용 사례별 정확도 비교(훈련 데이터에 적용)

사례 데이터 증강 총 사진 수 학습률 스탭 배치사이즈 정확도
1 적용 안 함 22,384 0.0001 10,000 128 0.855
2 1배 44,433 0.0001 15,000 128 0.888
3 2배 65,824 0.0001 20,000 128 0.907
4 3배 86,693 0.0001 25,000 128 0.919
5 4배 106,541 0.0001 30,000 128 0.921

데이터 증강기법 적용에 따른 모델 정확도를 검증용 데이터 셋에 적용한 결과는 표 3과 같다. 분류정확도 평가를 위해 33,643장의 검증용 데이터 셋에는 라벨을 부여하고, Top 1 정확도와 Top 5 정확도, 재현율(recall), 정밀도(precision), F1 값를 계산하였다. Top 1 정확도는 모델에서 가장 높은 점수로 예측된 라벨(Top 1)과 수동으로 라벨링 한 실제값과 비교하여 일치하는 경우를 참(true)로 분류한 결과이며, Top5 정확도는 모델에서 예측한 점수가 높은 상위 5개의 라벨(Top 1, Top 2, Top 3, Top 4, Top 5) 중에서 실제값이 존재하는 경우를 참(true)으로 분류한 결과이다. 본 연구에 포함된 데이터의 경우 카테고리별로 포함되어 있는 사진의 수가 다양하게 나타났다. 예를 들면 33,643장의 검증용 데이터 셋 중에서 ‘셀피’ 사진이 2,074장, ‘조망’사진이 44장으로 카테고리 간 이미지 수가 불균형하기 때문에 카테고리별 정확도의 평균으로 계산하는 정확도보다는 정밀도와 재현율의 조화평균으로 계산되는 F1 값으로 모델의 성능을 평가하는 것이 바람직한 것으로 판단하였다. 따라서 최종모델은 원본 훈련 데이터 셋에 데이터 증강기법을 통해 사진 수를 4배로 증가시킨 사례 4를 사용하도록 하였다.

표 3.

데이터 증강기법 적용 사례별 정확도 비교(검증 데이터에 적용)

정확도 사례 1 사례 2 사례 3 사례 4 사례 5
Top 1 정확도 73.51% 72.45% 72.78% 72.99% 72.73%
Top 5 정확도 91.82% 92.00% 91.96% 92.07% 92.00%
재현율(Recall) 0.7489 0.7613 0.7610 0.7607 0.7631
정밀도(Precision) 0.6858 0.6957 0.7000 0.7036 0.7015
F1 값(score) 0.7159 0.7270 0.7292 0.731025 0.731021

테스트 데이터 셋에 적용한 최종모델의 정확도 평가에는 전체 사진의 약 20%에 해당하는 약 33,192장 중 ‘분류하기 어려움’ 카테고리의 사진 510장을 제외한 32,682장의 사진을 사용하였다. 최종모델은 사례 4를 사용하였으며, 하이퍼 파라미터는 아담 옵티마이저, 학습률은 0.0001, 배치 사이즈는 128, 스텝은 25,000을 적용하였다. 최종모델의 Top 1 정확도는 85.77%, Top 5 정확도는 95.69%였으며, F1 값은 0.8485로 나타났다. 이는 Inception V3 모델을 ImageNet 데이터 셋에 적용하였을 때 성능인 Top 1 정확도 기준 82.7%보다 더 높은 분류성능을 보이는 것이다(표 4).

표 4.

단계별 최종모델의 성능평가

훈련 데이터 검증 데이터 테스트 데이터
Top 1 accuracy 91.9% 79.58% 85.77%
Top 5 accuracy - 92.66% 95.69%
F1-score - 0.7946 0.8485

3) 관광 활동 유형별 주요 방문지 분석

사진이 집중적으로 게시된 장소를 파악하기 위해 플리커 사진의 메타 데이터에 포함된 경, 위도 좌푯값을 기반으로 DBSCAN(density-based spatial clustering of application with noise) 방법을 활용하여 데이터의 공간적 클러스터를 찾고, 주요 방문지를 확인하였다. DBSCAN 알고리즘은 데이터의 밀도를 기준으로 군집을 형성하는 밀도기반 클러스터링 알고리즘으로, 군집 형성의 임계거리 eps와 최소 데이터 수 MinPts를 입력받는다. 임계거리 eps 내에 최소 데이터 수 MinPts 이상의 데이터가 있다면 해당 데이터가 하나의 클러스터를 형성하는 것을 핵심 개념으로 한다(Ester et al., 1996; Schubert et al., 2017). DBSCAN을 적용하려면 인접 반경 eps 및 밀도 임계값 즉, 최소 포인트 수인 MinPts를 결정해야 한다. 따라서 클러스터 형성 시 매개변수를 어떻게 설정하느냐에 따라 다른 형태의 군집이 추출되기 때문에 적절한 값을 찾는 것이 중요하다. 본 연구에서 MinPts는 150~300, eps는 150~500개 범위의 조합으로 실험을 진행하였으며, 주요 관광지의 도출 여부를 기준으로 평가하여 최종적으로 검색반경 500m, 최소 점 개수 300개를 최적값으로 설정한 후 클러스터를 도출하였다.

4. 분석결과

1) 관광객과 거주자의 서울 이미지

서울지역에 게시된 147,669장의 사진을 대상으로 최종모델을 적용하여 사진을 분류한 결과는 그림 3, 4와 같다. 그림 3은 관광객과 거주자의 74개 씬 별 사진 비율을 내림차순으로 정리한 내용이며, 그림 5는 카테고리별 사진의 비율을 관광객 기준 내림차순으로 정리한 것이다. 씬 별로 살펴보면 관광객은 ‘셀프카메라 및 단체 사진’,‘음식’, ‘고궁’,‘컨퍼런스’,‘건물 경관’ 순으로 많은 사진을 찍으며, 거주자는 ‘셀프카메라 및 단체 사진’,‘음식’, ‘안내판’, ‘컨퍼런스’,‘군중’ 순으로 나타났다. 특히 ‘셀프카메라 및 단체 사진’,‘음식’은 관광객과 거주자 모두에서 높은 비율로 나타나 셀피에 대한 선호도와 SNS에서 차지하는 음식 사진의 중요성을 알 수 있다. 특히 관광객에서는 ‘고궁’, ‘건물 경관’이 거주자보다 높은 순위를 차지하여 서울의 전통적 요소와 독특한 건물 경관에 대한 선호도를 알 수 있다. 관광객과 거주자 간 선호의 차이는 카테고리별 분석에서 잘 드러난다. 관광객은 ‘도시경관’, ‘한국전통건축물’, ‘음식 및 식당’, ‘쇼핑’, ‘체험활동’ 순으로 선호하며, 거주자는 ‘음식 및 식당’, ‘도시경관’, ‘사람들’, ‘자연경관’, ‘쇼핑’ 순으로 사진을 많이 찍었음을 알 수 있다. 서울을 방문하는 관광객의 경우 독특한 도시경관과 전통적 건축물에 대해 많은 매력을 느끼지만 거주자의 경우 일반적인 SNS 특성으로 볼 수 있는 셀피를 포함한 사람 사진, 음식 및 식당 사진이 많고, 관광객보다 자연경관에 대한 사진을 많이 찍어 고층빌딩이 밀집된 도시에서 자연적 요소에 대한 선호가 상대적으로 높음을 알 수 있다.

https://static.apub.kr/journalsite/sites/geo/2021-056-03/N013560301/images/geo_56_03_01_F3.jpg
그림 3

관광객과 거주자의 74개 씬 별 사진 비율

https://static.apub.kr/journalsite/sites/geo/2021-056-03/N013560301/images/geo_56_03_01_F4.jpg
그림 4

관광객과 거주자의 관광 활동 카테고리별 사진 비율

2) 관광객과 거주자의 주요 방문지 분석

사진이 많이 게시되는 곳은 관광지로서 매력적인 장소로 인지되는 곳이라 할 수 있다. 사진이 집중적으로 게시된 장소를 파악하기 위해 DBSCAN방법을 통해 클러스터를 도출하고, 클러스터로 도출된 점의 최외곽 점을 컨벡스 헐(convex hull)로 구축한 후 지도로 나타낸 결과는 그림 5, 6과 같다. 도출된 ROA 내에 포함되는 주요 관광지와 ROA에 포함된 사진과 사용자 수를 정리한 내용은 표 5와 같다. 그림 5의 관광객 ROA와 그림 6의 거주자 ROA를 비교해 보면 관광객 ROA가 더 집중된 형태를 보이지만 거주자 ROA는 상대적으로 크기가 작고 더 넓은 지역에 분산되어 있음을 알 수 있다. 실제로 관광객 ROA는 12개가 도출되었으며, 거주자의 경우 19개의 ROA가 도출되었다. 관광객의 경우 ROA에 포함된 사진은 서울 전체 관광객이 게시한 사진 80,553장의 약 87.7%에 해당하는 70,639장이지만, 거주자의 경우 전체 67,116장 중 55.6%에 해당하는 37,291장의 사진만이 ROA에 포함되어 거주자가 사진을 게시하는 지역이 다양하게 분포함을 알 수 있다.

https://static.apub.kr/journalsite/sites/geo/2021-056-03/N013560301/images/geo_56_03_01_F5.jpg
그림 5

관광객 ROA

https://static.apub.kr/journalsite/sites/geo/2021-056-03/N013560301/images/geo_56_03_01_F6.jpg
그림 6

거주자 ROA

표 5.

ROA별 주요 관광지 및 사진 수

ROA 주요 관광지 관광객 거주자
사진 수 사용자 수 사진 수 사용자 수
종로 고궁(경복궁, 창덕궁, 덕수궁, 경희궁), 삼청동, 인사동, 청계천,
시청, DDP, 남대문시장, 명동, 남산 서울 타워, 남산, 남산골 공원
51,693 1,895 19,595 742
이태원 이태원, 경리단길 - - 2,008 155
용산 전쟁 박물관, 국립 중앙 박물관, 용산 가족 공원 5,456 74 662 83
롯데월드 롯데월드, 롯데월드타워, 석촌 호수 3,624 149 1,174 112
잠실 잠실종합운동장, 탄천, 잠실한강공원 - - 432 48
홍대-신촌 이화여자대학교, 신촌, 연남동, 연희동, 합정역, 상수역, 홍대역 1,796 559 6,140 265
노량진 노량진 수산시장 1,787 120 - -
압구정 가로수 길 1,414 274 545 85
코엑스 코엑스, 봉은사 1,299 275 1,507 153
반포 반포한강공원, 반포 센트럴 시티, 고속터미널역 804 137 559 61
잠원 잠원한강공원 - - 500 10
방배 방배카페 거리 - - 701 22
여의도 IFC mall, 한강 공원, 여의도 공원 762 179 519 75
올림픽 공원 올림픽 공원 715 49 - -
강남역 강남역 531 255 1,254 159
경희대 경희대학교, 평화의 전당 487 32 -
서울대 서울대, 샤로수길, 낙성대 - - 1175 15
한성대 한성대, 삼선골목시장 - - 520 19
합계 70,368 3,998 37,291 2,004

관광객과 거주자가 선호하는 ROA를 살펴보면 관광객이 가장 선호하는 ROA는 종로 ROA이며, 관광객이 게시한 사진의 약 64.2%가 이 지역에 밀집되어 관광객의 방문지가 도심에 밀집되어 있음을 알 수 있다. 그다음으로는 용산, 롯데월드, 홍대-신촌, 노량진 순으로 나타났는데 게시된 사진 수와 방문자 수의 순위에 많은 차이가 있어서 방문자 순으로는 홍대-신촌, 압구정, 코엑스, 강남역 등이 선호됨을 알 수 있다. 거주자의 경우 종로가 가장 많이 방문하는 장소이기는 하지만 게시된 사진의 비율은 29.2%에 불과한 것을 알 수 있다. 다음으로 방문이 많은 지역은 홍대-신촌, 이태원, 코엑스, 강남역 순이며, 사용자 순으로도 유사하게 나타남을 알 수 있다. 종로는 관광객과 거주자 모두 1위로 선호하는 방문지이며, 홍대-신촌 ROA 역시 인기 있는 방문지임을 알 수 있다. 하지만 도출된 ROA에 차이를 보이는 지역도 있다. 관광객에게는 노량진, 올림픽공원, 경희대 등이 ROA로 도출되었지만, 거주자들에게는 해당 장소가 도출되지 않았으며, 거주자들에게 나타난 ROA 가운데 이태원, 잠실, 잠원, 방배, 서울대, 한성대 등은 관광객에게는 나타나지 않아 관광객들은 노량진 수산시장을 선호하며, 거주자들이 알고 있는 몇몇 매력적 장소들이 관광객들에게는 인지되지 않고 있음을 알 수 있다.

도출된 ROA가 어떤 이미지로 인식되는지를 분석하기 위해 해당 장소에 게시된 사진을 12개의 관광 활동 유형별로 분석하여 ROA와 관광 활동 카테고리 간 매트릭스 히트맵으로 작성한 것은 그림 7, 8과 같다. 그림 7은 관광객의 사진을 분류한 것으로 종로 ROA의 경우 가장 많은 사진이 게시된 카테고리는 도시경관이 21.1%, 한국전통건축물이 21.1%로 관광객에게 종로는 독특한 도시경관과 전통건축물이 혼재된 매력적인 장소로 인지됨을 알 수 있다. 용산의 경우 ‘문화 및 예술’, ‘도시경관’, ‘안내 및 석조물’ 사진이 많아 용산 전쟁기념관과 국립중앙박물관에서 찍은 다양한 유물 및 조형물 사진이 많음을 알 수 있다. 이러한 특성은 거주자에게도 유사하게 나타나지만, 종로의 경우 관광객보다 도시경관이나 한국전통건축물 사진의 비율이 낮음을 알 수 있고, 용산의 경우 전쟁기념관에서는 전쟁기념물 사진이 많지만, 거주자에게는 용산가족공원도 선호됨을 알 수 있다. 롯데월드 ROA 경우 관광객, 거주자 모두 놀이공원에서의 체험활동, 롯데 타워와 같은 도시경관 관련된 사진이 많음을 알 수 있다.

https://static.apub.kr/journalsite/sites/geo/2021-056-03/N013560301/images/geo_56_03_01_F7.jpg
그림 7

ROA와 관광 카테고리 간 매트릭스 히트맵(관광객)

https://static.apub.kr/journalsite/sites/geo/2021-056-03/N013560301/images/geo_56_03_01_F8.jpg
그림 8

ROA와 관광 카테고리 간 매트릭스 히트맵(거주자)

주요 방문지에서 관광 활동이 유사한 지역도 있지만, 관광객과 거주자가 같은 장소를 상이하게 즐기는 경우도 나타난다. 홍대 ROA의 경우 관광객은 ‘음식 및 식당’, ‘도시경관’, 그리고 ‘쇼핑’ 순으로 사진이 많지만, 거주자는‘음식 및 식당’ 관련 사진이 많고, 독특한 음식이나 식당에서 셀피를 선호함을 알 수 있다. 여의도 ROA의 경우 관광객은 ‘숙소 및 컨퍼런스’ 목적으로 주로 방문하지만, 거주자는 여의도 공원, 한강 공원을 방문하여 셀피, 음식, 도시경관 사진을 많이 찍는 것을 알 수 있다. 강남역 ROA도 관광객은 ‘도시경관’, ‘음식 및 식당’, ‘쇼핑’을 위해 방문하는 장소지만, 거주자들은 ‘음식 및 식당’을 목적으로 방문하는 비율이 훨씬 높음을 알 수 있다.

3) 관광객과 거주자의 관광 활동 유형별 차이 분석

관광 활동 유형별 방문 장소의 차이를 분석하기 위해 관광객과 거주자가 게시한 사진을 관광 활동 유형별로 분류한 후 관광 활동 유형별 ROA를 분석하였다. 관광 활동 유형별 분석은 관광객 기준 사진 게시가 많은 6개 카테고리를 대상으로 하였으며, 6개 관광 활동 카테고리별 DBSCAN을 이용하여 ROA를 추출한 결과는 그림 9와 같으며, ROA별로 카테고리 내 포함되는 씬을 매트릭스 히트맵으로 나타낸 것은 그림 10과 같다. ‘도시경관’ 카테고리의 경우 관광객은 주로 종로-광화문을 중심으로 한 도심에서 사진을 촬영하는 반면 거주자는 도심 외에 반포, 강남역 등 강남지역에서 경관 사진을 게시하는 특성을 보인다. 특정 씬을 찍는 장소가 집중된 곳도 파악할 수 있는데 건물 경관 사진의 경우 관광객은 DDP의 독특한 돔형 사진과 조형물을 찍지만, 거주자는 DDP 외에도 강남역의 독특한 건물 경관 사진을 많이 찍은 것을 알 수 있다. 벽화 및 트릭아트의 경우 관광객은 이화벽화 마을과 홍대에서 사진을 찍지만, 거주자는 낙산공원에서 사진을 많이 찍는 것을 알 수 있다. 야경의 경우 관광객은 도심의 광화문, 남산타워, DDP, 홍대 등 주요 ROA마다 유사하게 야경사진을 찍어서 게시하는 반면 거주자는 반포 및 강남역-테헤란로 지역에서 야경사진을 많이 게시하여 차이를 보인다. ‘한국전통건축물’ 카테고리의 경우 관광객이 주로 방문하여 사진을 촬영하는 장소는 경복궁-창덕궁, 덕수궁이지만 거주자는 경희궁에서도 많은 사진을 찍어, 경희궁이 관광객에게는 덜 인지 되어 있음을 알 수 있다.

https://static.apub.kr/journalsite/sites/geo/2021-056-03/N013560301/images/geo_56_03_01_F9.jpg
그림 9

관광 활동 카테고리별 ROA

https://static.apub.kr/journalsite/sites/geo/2021-056-03/N013560301/images/geo_56_03_01_F10.jpg
그림 10

관광 활동 유형별 매트릭스 히트맵

‘음식 및 식당’ 카테고리의 경우 관광객 ROA는 관광객이 주로 방문하는 전체 ROA와 별로 다르지 않게 나타나지만, 거주자의 경우 이태원, 가로수길, 코엑스, 서촌, 경리단길, 한강진, 연희동 등 보다 세분된 장소들이 나타나 색다른 음식과 카페 및 식당을 찾아 다양한 곳을 방문함을 알 수 있다. 이 카테고리에서 특이한 점은 길거리 음식과 관련된 씬이다. 관광객들은 명동에서 길거리 음식 사진을 많이 찍고, 인사동, DDP에서도 길거리 음식 사진이 많이 게시됨을 알 수 있다. ROA별 길거리 음식 씬의 비율을 보았을 때 거주자의 경우 서촌 정도가 비슷하게 나온다. 이는 관광객에게 서울에서 즐길 수 있는 길거리 음식은 새로운 흥미 거리이며, 관광요소가 됨을 나타내는 것으로 해석할 수 있다. ‘쇼핑’ 카테고리에서 특이한 점은 관광객들이 선호하는 장소 가운데 광장시장이라는 재래시장이 나타나며 광장시장에서 재래시장 씬의 비율이 매우 높다는 것이다. 거주자의 경우 재래시장으로 인지되는 씬은 인사동 정도에서 유의하게 나타나지만, 관광객의 경우는 광장시장 외에도 명동-남대문시장, DDP 등에서도 재래시장적 요소를 갖는 씬의 비율이 높아서 관광객에게 재래시장은 관광에서 매우 매력적 요소로 인지됨을 알 수 있다.

‘체험활동’ 카테고리와 관련하여 관광객에게는 롯데월드 놀이공원, 남산타워의 사랑의 자물쇠, 경복궁과 남대문시장의 전통한복체험, 잠실종합운동장에서 K-pop 공연, 경복궁과 시청에서 전통공연과 수문장 교대식, 시청 근처의 등불축제가 선호됨을 알 수 있다. 거주자의 경우 롯데월드 놀이공원, 남산타워의 사랑의 자물쇠가 선호되는 것은 유사하지만 전통한복을 체험하는 장소로는 인사동이나 DDP가, 무대공연 관람 장소로는 잠실종합운동장, 홍대, DDP, 야구경기관람을 위해 고척스카이돔을 방문하는 것으로 나타나며 전통공연이나 등불축제에 대한 선호는 관광객에 비해 높지 않음을 알 수 있다. 마지막 ‘문화 및 예술’ 카테고리 경우 경복궁-광화문, 전쟁기념관, 국립중앙박물관, DDP 등 관광객과 거주자가 방문하는 ROA가 유사한 것으로 나타났다. 다만 거주자의 경우 홍대에서 볼 수 있는 독특한 실내외 조형물 사진을 더 많이 게시하는 특징을 보이는 정도였다.

5. 결론

본 연구는 2013년부터 2018년까지 6년간 서울 범위에 게시된 플리커 사진의 사용자를 관광객과 거주자로 분류하고, 사용자가 게시한 사진을 한국 관광특성을 반영하는 관광 활동 카테고리에 따라 합성곱 신경망모델을 사용하여 사진을 분류하고, 관광객과 거주자의 주요 방문지, 주요 방문지에서의 관광 활동의 차이를 분석하였다. 사진 분류결과, 관광객의 주요 방문지는 도심에 집중된 패턴을 보이지만, 거주자는 상대적으로 분산된 형태를 보이며, 도출된 주요 방문지 외에도 다양한 곳을 방문하여 사진을 게시함을 알 수 있었다. 관광객은 건물 경관, 스카이라인과 타워, 길거리 음식, 재래시장, 한복체험, 전통공연 등을 선호하며, 거주자는 야경, 디저트 및 카페, 유동인구가 많은 상점가, 스포츠 관람과 같은 관광 활동을 더 선호하는 것으로 나타났다. 관광 활동 카테고리별 분석을 통해 관광객은 명동, 인사동, DDP 등에서의 길거리 음식, 광장시장과 남대문시장 등 재래시장에서의 쇼핑, 경복궁과 남대문시장에서의 전통한복체험, 시청에서의 수문장 교대식, 이화벽화 마을과 홍대에서의 트릭아트를 선호함을 알 수 있으며, 거주자의 경우는 ‘도시경관’ 및 ‘음식 및 식당’ 카테고리에서 관광객보다 훨씬 다양한 곳을 방문하는 특징이 있음을 알 수 있었다.

본 연구는 대한민국 방문 관광객과 거주자의 관광 활동을 위치기반 SNS 사진을 통해 분석한 논문으로, 학문적 측면과 실용적 측면에서 의의가 있다. 학문적 측면에서는 위치를 포함하는 SNS의 사진 데이터에 딥러닝 모델을 적용하여 체계적으로 분석한 논문이며, 향후 다양한 연구가 적용 가능함을 제시하였다는 점에 의의가 있다. 관광 분야를 예로 들면 음식 사진만을 세분화하거나, 체험활동 카테고리만을 세분화하여 식문화나 체험활동 관련 상세분석이 가능하며, 본 연구에서는 이미지 분석 딥러닝 모델 가운데 이미지 분류모델(image classification)을 활용하였지만, 특정 객체만을 포함하는 사진을 분석하거나(object detection), 이미지에 캡션을 부여하는(image captioning) 기술과 위치정보를 결합하여 다양한 분석이 가능하다.

실용적인 측면에서 본 논문의 분석결과는 첫째 한국관광공사나 지방자치단체에서 국외 및 국내 관광객을 대상으로 어떤 관광마케팅을 해야 할지에 대한 전략을 제시한다. 예를 들면 관광객이 선호하는 방문지에서의 선호 활동에 대해서는 집중적으로 홍보할 필요가 있으며, 거주자들이 선호하는 장소와 활동들은 외국인 대상 새로운 관광마케팅 아이템이 될 수 있다. 둘째 SNS 데이터에 인공 지능 기술을 접목하여 대용량의 사진 데이터를 빠르고 체계적으로 분석하는 방법론을 제시하였다는 점에 의의가 있다. 예를 들면 관광공사에서는 우리나라를 방문하는 관광객 가운데 매월 1,300명을 대상으로 방문 장소, 방문목적, 관광 활동, 쇼핑 품목 등을 조사하여 외래관광객 실태조사 보고서를 발행하고 관광 마케팅자료로 사용하고 있다(한국관광공사, 2019). 하지만 이러한 조사에는 많은 비용이 소요되며, 대표성의 문제, 심도있는 분석의 한계가 있을 수 있다. 본 연구에서 제안한 방법론은 대용량의 사진 데이터를 일관성 있게 빠르게 분류하며, 시계열 분석을 추가하여 변화의 흐름을 빠르게 파악하는 것이 가능하다. 최근에 사용자들은 텍스트를 통한 정보공유보다 사진이나 동영상 등 영상매체를 활용하는 추세가 빠르게 증가하고 있는데 이러한 이미지 자료에 인공 지능 기술이 어떻게 접목될 수 있는지를 구체적으로 제시하였다는 점에 의의가 있다.

다만 본 연구에서 플리커 사용자를 관광객과 거주자로 구분하였지만, 거주자의 경우, 서울 거주자와 서울에 거주하지 않고 서울을 방문하는 관광객의 특성은 다를 수 있다. 따라서 추후연구에서는 거주자를 서울 거주자와 국내 거주 서울 방문객으로 구분하여 분석하는 것이 필요하다. 또한, 최근에 SNS에 올리는 사진 중에 식문화는 매우 중요한 요소인데 현재 음식은 세분화하지 않아 이에 대해 훈련데이터 셋을 보강하여 모델을 훈련시키고 사진을 분류하는 작업이 필요하다고 판단하였다.

Acknowledgements

본 연구는 국토교통부 국토교통기술촉진연구사업의 연구비 지원(과제번호 20C TAP-C151886-02)에 의해 수행되었습니다.

References

1
강영옥・조나혜・이주윤・윤지영・이혜진, 2019, “경험적 모델과 머신러닝 기법을 활용한 SNS 사용자 분류방법 비교: 플리커 데이터의 관광객 분류방법,” 대한공간정보학회지, 27(4), 29-37. 10.7319/ksgis.2019.27.4.029
2
김나연・강영옥, 2019, “지오태깅된 사진 데이터를 활용한 서울방문 관광객의 주요 관광지 분석,” 한국지도학회지, 19(1), 35-46. 10.16879/jkca.2019.19.1.035
3
김나연・강영옥・김동은・박예림・이주윤, 2019, “소셜 네트워크 데이터를 활용한 서울방문 관광객의 선호 관광지 시공간 특성 분석,” 서울도시연구, 20(1), 81-96.
4
박예림・강영옥・김동은・이주윤・김나연, 2019, “플리커 데이터의 텍스트마이닝을 통한 서울방문 외국인 관광객의 서울 이미지 분석,” 한국지형공간정보학회지, 27(1), 11-23. 10.7319/kogsis.2019.27.1.011
5
이주윤・강영옥・김나연・김동은, 박예림, 2019, “궤적 데이터 마이닝을 통한 서울방문 관광객의 이동특성 분석,” 한국지도학회지, 18(3), 117-129. 10.16879/jkca.2018.18.3.117
6
이혜진・강영옥, 2020a, “소셜 미디어데이터 분석을 통한 부산방문 외국인 관광객의 선호 관광지 및 관광지 이미지 분석,” 한국도시지리학회지, 23(1), 101-114. 10.21189/JKUGS.23.1.8
7
이혜진・강영옥, 2020b, “토픽모델링과 LSTM기반 텍스트 분석을 통한 부산방문 외국인 관광객의 선호관광지 및 관광매력요인 분석,” 한국도시지리학회지, 23(3), 61-70. 10.21189/JKUGS.23.3.5
8
조나혜・강영옥・윤지영・박소연, 2019, “지능형 관광 서비스를 위한 관광 사진 분류체계 개발,” 한국지도학회지, 19(3), 87-101. 10.16879/jkca.2019.19.3.087
9
조재희・서일정, 2016, “지오트윗을 이용한 거주자와 방문자의 공간 이동성 연구,” 한국 IT 서비스학회 학술대회 논문집, 101-104.
10
한국관광공사, 2019, 외래관광객 조사보고서.
11
Chen, M., Arribas-Bel, D. and Singleton, A., 2020, Quantifying the Characteristics of the Local Urban Environment through Geotagged Flickr Photographs and Image Recognition, ISPRS International Journal of Geo-Information, 9, 264. 10.3390/ijgi9040264
12
Ester, M., Kriegel, H. P., Sander, J. and Xu, X., 1996, A density-based algorithm for discovering clusters in large spatial databases with noise. Kdd, 96(34), 226-231.
13
García-Palomares, J. C., Gutiérrez, J. and Mínguez, C., 2015, Identification of tourist hot spots based on social networks: A comparative analysis of European metropolises using photo-sharing services and GIS, Applied Geography, 63, 408-417. 10.1016/j.apgeog.2015.08.002
14
Gilbert, D. and Hancock, C., 2006, New York city and the transatlantic imagination, Journal of Urban History, 33(1), 77-107. 10.1177/0096144206290385
15
He, K., Zhang, X., Ren, S. and Sun, J., 2016, Deep residual learning for image recognition. Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, 770-778. 10.1109/CVPR.2016.90
16
Howard, A. G., Zhu, M., Chen, B., Kalenichenko, D., Wang, W., Weyand, T., Andreetto, M. and Adam, H., 2017, MobileNets: Efficient convolutional neural networks for mobile vision applications, arXiv:1704.04861.
17
Huang, G., Liu, Z., Van Der Maaten, L. and Weinberger, K. Q., 2017, Densely connected convolutional networks, Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, 4700-4708. 10.1109/CVPR.2017.243
18
Hunt, J. D., 1975, Image as a factor in tourism development, Journal of Travel Research, 13(3), 1-7. 10.1177/004728757501300301
19
Hunter, W. C., 2013, China’s chairman Mao: A visual analysis of hunan province online destination image, Tourism Management, 34(1), 101-111. 10.1016/j.tourman.2012.03.017
20
Hunter, W. C., 2016, The social construction of tourism online destination image: A comparative semiotic analysis of the visual representation of Seoul, Tourism management, 54(2), 221-229. 10.1016/j.tourman.2015.11.012
21
Hussain, M., Bird, J. J., and Faria, D. R., 2018, A study on cnn transfer learning for image classification. UK Workshop on Computational Intelligence, 191-202. 10.1007/978-3-319-97982-3_16
22
Kádár, B. and Gede, M., 2013, Where do tourists go? Visualizing and analysing the spatial distribution of geotagged photography, The International Journal of Geographic Information and Geovisualization, 48(2), 78-88. 10.3138/carto.48.2.1839
23
Kádár. B., 2014, Measuring tourist activities in cities using geotagged photography, Tourism Geographies, 16(1), 88-104. 10.1080/14616688.2013.868029
24
Kang, Y., Cho, N., Yoon, J., Park, S. and Kim, J., 2021, Transfer learning of a deep learning model for exploring tourists’ urban image using geotagged photos, ISPRS International Journal of Geo-Information, 10(3), 137. 10.3390/ijgi10030137
25
Kim, D., Kang, Y., Park, Y., Kim, N. and Lee, J., 2020, Understanding tourists’ urban images with geotagged photos using convolutional neural networks, Spatial Information Research, 28(2):241-255. 10.1007/s41324-019-00285-x
26
Kim, S. B., Kim, D. Y. and Wise, K., 2014, The effect of searching and surfing on recognition of destination images on Facebook pages, Computers in Human Behavior, 30, 813-823. 10.1016/j.chb.2013.07.010
27
Kisilevich, S., Keim, D., Natalia, A. and Gennady, A., 2013, Towards acquisition of semantics of places and events by multi-perspective analysis of geotagged photo collections, Geospatial Visualisation, 211-233. 10.1007/978-3-642-12289-7_10
28
Krizhevsky, A., Sutskever, I. and Hinton, G. E., 2012, Imagenet classification with deep convolutional neural networks, In Proceedings of the Advances in Neural Information Processing Systems, Lake Tahoe, NV, USA, 3-6 December 2012, pp. 1097-1105.
29
Kurashima, T., Iwata, T., Irie, G. and Fujimura, K., 2013, Travel route recommendation using geotagged photos, Knowledge and Information Systems, 37(1), 37-60. 10.1007/s10115-012-0580-z
30
Lee, H., and Kang, Y., 2021, Mining tourists’ destinations and preferences through LSTM based text classification and spatial clustering using Flickr data, Spatial Information Research. doi: 10.1007/s41324-021-00397-3 10.1007/s41324-021-00397-3
31
Leung, R., Vu, H.Q., Rong, J. and Miao Y., 2016, Tourists Visit and Photo Sharing Behavior Analysis: A Case Study of Hong Kong Temples. In: Inversini A. and Schegg R. (eds) Information and Communication Technologies in Tourism 2016. Springer, Cham. doi: 10.1007/978-3-319-28231-2_15 10.1007/978-3-319-28231-2_15
32
Liu, Q., Wang, Z. and Ye, X., 2018, Comparing mobility patterns between residents and visitors using geo‐tagged social media data, Transactions in GIS, 22(6), 1372-1389. 10.1111/tgis.12478
33
Pan, S., Lee, J., and Tsai, H., 2014, Travel photos: Motivations, image dimensions, and affective qualities of places, Tourism Management, 40, 59-69. 10.1016/j.tourman.2013.05.007
34
Parra-López, E., Bulchand-Gidumal, J., Gutiérrez-Taño, D. and Díaz-Armas, R., 2011, Intentions to use social media in organizing and taking vacation trips, Computers in Human Behavior, 27(2), 640-654. 10.1016/j.chb.2010.05.022
35
Rattenbury, T., and Naaman, M., 2009, Methods for extracting place semantics from Flickr tags, ACM Transactions on the Web, 3(1), 1-30. 10.1145/1462148.1462149
36
Schubert, E., Sander, J., Ester, M., Kriegel, H. P. and Xu, X., 2017, DBSCAN revisited, revisited: Why and how you should(still) use DBSCAN, ACM Transactions on Database Systems, 42(3), 1-21. 10.1145/3068335
37
Simonyan, K. and Zisserman, A., 2015, Very deep convolutional networks for large-scale image recognition, arXiv:1409.1556.
38
Szegedy, C., Liu, W., Jia, Y., Sermanet, P., Reed, S., Anguelov, D., and Rabinovich, A., 2015, Going deeper with convolutions, Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, 1-9. 10.1109/CVPR.2015.7298594
39
Vu, H. Q., Li, G., Law, R. and Ye, B. H., 2015, Exploring the travel behaviors of inbound tourists to Hong Kong using geotagged photos, Tourism Management, 46, 222-232. 10.1016/j.tourman.2014.07.003
40
Xiao, J., Hays, J., Ehinger, K. A., Oliva, A., and Torralba, A., 2010, Sun database: Large-scale scene recognition from abbey to zoo. In 2010 IEEE Computer Society Conference on Computer Vision and Pattern Recognition, 3485-3492. 10.1109/CVPR.2010.5539970
41
Yuan, Y. and Medel, M., 2016, Characterizing international travel behavior from geotagged photos: A case study of flickr, PloS one, 11(5), e0154885. 10.1371/journal.pone.015488527159195PMC4861279
42
Zhang, K., Chen, D. and Li, C., 2020, Tourism. How are tourists different? -Reading geo-tagged photos through a deep learning model, Journal of Quality Assurance in Hospitality & Tourism, 21(2), 234-43. 10.1080/1528008X.2019.1653243
43
Zhang, K., Chen, Y., and Li, C., 2019, Discovering the tourists’ behaviors and perceptions in a tourism destination by analyzing photos’ visual content with a computer deep learning model: The case of Beijing, Tourism Management, 75, 595-608. 10.1016/j.tourman.2019.07.002
44
Zheng, Y., Zha, Z. and Chua, T., 2012, Mining travel patterns from geotagged photos, ACM Transactions on Intelligent Systems and Technology, 3(3), 1-18. 10.1145/2168752.2168770
45
Zhou, B., Lapedriza, A., Khosla, A., Oliva, A. and Torralba, A., 2017, Places: A 10 million image database for scene recognition, IEEE Transactions on Pattern Analysis and Machine Intelligence, 40(6), 1452-1464. 10.1109/TPAMI.2017.272300928692961
페이지 상단으로 이동하기