다변량 통계기법을 이용한 시·공간적 수질변화의 평가: 임진강유역에 관한 연구

Assessment of Spatiotemporal Water Quality Variation Using Multivariate Statistical Techniques: A Case Study of the Imjin River Basin, Korea

Article information

J Korean Soc Environ Eng. 2017;39(11):641-649
Publication date (electronic) : 2017 November 30
doi : https://doi.org/10.4491/KSEE.2017.39.11.641
Han-River Environment Research Center, National Institute of Environmental Research
조용철, 이수웅, 류인구, 유순주
국립환경과학원 한강물환경연구소
Corresponding author E-mail: ilovmi@korea.kr Tel: 031-770-7221 Fax: 031-770-2268
Received 2017 June 19; Revised 2017 August 21; Accepted 2017 November 28.

Abstract

본 연구에서는 오염원의 변화 특성이 다양한 임진강유역을 대상으로 통계분석을 이용하여 상관분석, 주성분 및 요인 분석, 군집분석을 통해 수질특성을 파악하였다. 신천3 지점의 평균 수질농도가 BOD 13.4 mg/L, COD 19.9 mg/L, TN 11.145 mg/L, TP 0.336 mg/L, TOC 14.2 mg/L로 높게 나와 전체 유역 중 신천 유역에 대한 집중적인 수질관리가 필요한 것으로 나타났다. 전체 수질측정 자료의 상관분석 결과 COD는 TOC, BOD, TN 수질인자와 유의한 상관관계를 보여 유기물과 영양염류 인자간의 상관성이 높은 것으로 나타났다. 주성분분석 결과 전체 측정소 자료는 81.221%로 2개의 주성분, 계절별 자료는 96.241%로 3개의 주성분이 추출되었다. 요인분석 결과 전체 측정소 자료와 계절별 자료의 수질영향 요인은 공통적으로 BOD, COD, TN, TP, TOC 항목이 나타났다. 시·공간적 군집분석 결과 계절별 특성 및 토지이용에 따라 각각 4개, 3개 그룹으로 나타났다. 본 연구는 임진강유역을 중심으로 8년간 시·공간적 특성을 고려한 수질 요인을 분석한 것으로 향후 유역환경변화에 따른 임진강 유역의 수질 변화를 이해하기 위한 기초 분석 자료가 될 것이다.

Trans Abstract

In the study, the water quality of the Imjin River basin with pollutants of changing characteristics it was determined through statistical analysis, correlation analysis, principle component and factor analysis, and cluster analysis. Among all analyzed data points, the average water quality concentration at the Sincheon 3 site shows high levels of BOD 13.4 mg/L, COD 19.9 mg/L, T-N 11.145 mg/L, T-P 0.336 mg/L, TOC 14.2 mg/L, indicating that Sincheon basin requires intersive water quality management out of the entire drainage basin. The correlational analysis of comprehensive water quality data shows statistically significant correlation between COD, TOC, BOD, T-N water quality factors, as well as finding of high correlation between organic and nutrients. The principal component analysis show that 2 main components being extracted at 81.221% from the measuring station’s entire data, while seasonal data show 3 main components being extracted at 96.241%. Factor analysis of the entire data set and the seasonal data identify BOD, COD, T-N, T-P, TOC as the common factors influencing water quality. The spatial and temporal cluster analysis showed 4 groups and 3 groups, respectively, according to seasonal characteristics and land use. By analysing the water quality factors for the Imjin River basins over an 8 year period, with consideration to the spatial and temporal characteristics, this study will become the fundamental analytic data that will help understand the future changes of water quality in the Imjin River basin.

1. 서 론

한강 수계에 독립적인 유역을 형성하고 있는 임진강유역은 행정구역 상 경기도 북부에 속하며, 북한지역과 경계를 마주하고 있다. 이러한 지리적 위치로 인하여 개발이 제한되어 유역의 자연성 및 수생태계 환경이 잘 보전되었다. 하지만 경기북부지역의 개발에 따른 지속적인 인구 및 도시화지역의 증가와 함께 공장단지의 발달 등으로 인하여 수질오염도가 높아지는 추세를 보이고 있다[1]. 임진강유역에서 임진강 상류유역이 13만 ton/day, 하류유역 58만 ton/day, 한탄강유역 108만 ton/day으로 약 180만 ton/day 용수를 이용하고 있다. 이 중 농업용수가 114만 ton/day로 가장 높은 비중을 차지하였으며, 수도권과 가까운 하류유역과 한탄강유역이 상대적으로 높은 용수 사용량을 보였다[2]. 특히 임진강유역의 신천, 문산천 등은 경기 북부지역의 생활용수 및 농·공업용수의 주요 수자원으로 이·치수 목적으로 용수 활용뿐만 아니라 수질 보전 측면에서 중요한 의미와 가치를 갖는다[1].

임진강유역의 지속적인 발전을 위한 수질관리가 중요하며, 소하천을 포함한 오염원, 수질 변화를 파악하여야 하며 수질에 영향을 미치는 다양한 변수를 도출하여 유역 내 수질 특성을 정확하게 파악하는 것이 중요하다[3]. 최근에는 불확실한 수질자료의 해석에 관한 오류를 줄이고 신뢰성 있는 수질해석을 위해 다변량 통계분석을 이용한 많은 연구가 이루어지고 있다[4]. 다변량 통계분석(Multivariate Statistics Analysis)은 다양한 변수를 대상으로 차원(dimension)을 감소시켜 해석할 수 있으며, 복잡하고 다양한 수질의 특성을 가지는 요인을 해석하고 평가하는 유용한 분석방법이다. 다변량 통계기법에는 상관분석, 주성분분석, 요인분석, 회귀분석, 군집분석 등이 있다. 이러한 통계기법을 이용한 국내·외 연구결과에는 주성분분석을 이용한 New Jersey Passic River에서 시·공간적 변화 분석을 연구하였고[5], 주성분분석 및 요인분석을 이용한 Gomti River의 수질변화를 평가하였다[6]. 봄철 저수기 수질변동 특성에 관한 남한강 수계 연구를 통해 유량과 수질의 시공간적 변화특성을 파악하고 유량과 부하량과의 관계를 평가하였다[7]. 낙동강 창녕함안보 수계를 대상으로 수질변동 특성을 알아보았으며[8], 금강유역의 수질오염특성 연구를 통해 금강수계의 수질 특성을 평가하였다[3]. 영산강·섬진강수계 주요 유입지천을 대상으로 요인분석을 통해 수질에 영향을 미치는 주요 요인을 파악하였다[9]. 다변량 통계분석을 이용한 낙동강 상수원의 수질변화 특성 조사를 통하여 수리학적 측면에서의 영향 조사와 수질항목들 간의 상관관계 및 군집화 수질특성을 해석, 평가하였고[10], 다변량 통계기법을 이용하여 한강수계 지천의 수질평가를 하였다[11]. 수질오염총량관리 단위유역별 말단 수질 측정 자료를 다변량 통계분석을 적용하여 유역특성이 비슷한 지역을 분류하고 수질경향 및 주요 요인을 분석하였다[12]. 군집분석을 이용한 Zhangweinan River에 수질특성에 관한 연구 등 다양한 연구결과가 보고되고 있다[13].

따라서 본 연구에서는 다년간 수질측정망 자료를 바탕으로 임진강유역을 대상으로 지점별 수질 변동특성을 파악하였다. 임진강유역의 시·공간적으로 수질 인자간의 상관관계를 분석하였으며, 주성분 및 요인분석을 이용하여 수질에 영향을 미치는 주요 요인을 분석하였다. 군집분석을 이용하여 시·공간적으로 수질 유사성에 따른 그룹별 및 계절별 특성을 파악하였다. 이는 향후 임진강유역의 과학적이고 합리적인 수질관리를 위한 기초자료를 제공하는 목적이 있다.

2. 연구내용 및 방법

2.1. 연구대상 지역

임진강의 전체 유역면적은 8,118 km2이고 한국지역 내유역면적은 3,491 km2로 전체 유역면적의 43%에 해당하는데 이는 영산강 유역면적 3,469 km2과 비슷하다. 임진강수계는 북한에서 발원하여 연천군을 유역으로 하는 한탄강이 임진강으로 합류하고, 파주시를 관통하는 문신천이 유입되어 한강 하구로 흐른다. 전체 하천길이는 273.5 km이며 한국 내 하천길이는 91.1 km이다[2].

본 연구는 임진강유역의 수질측정망 지점인 임진강의 본류 2개 지점, 임진강의 지류 문산천 1개 지점, 임진강유역 내의 최대 지류인 한탄강의 본류 2개 지점, 한탄강의 지류영평천, 신천 등 2개 지점 등 총 7개 지점을 대상으로 선정하여 Table 1에 나타내었다. 조사지점은 임진강 단위유역의 말단지점으로서 임진강유역의 본류 지점과 본류로 유입되는 한탄강 및 지류 지점으로 유역 및 하천의 환경변화 등으로 오염원의 영향 분석 및 수질 등의 관리 필요성이 제기되는 지점이다.

Monitoring sites on Rivers and streams on Imjin River watershed

2.2. 조사항목 및 분석방법

임진강유역의 수질특성을 알아보기 위하여 시간적 범위는 2008년 1월부터 2015년 12월까지 총 8년간이며, 환경부 물환경정보시스템을 이용하여 수질자료를 수집하였다[14]. 분석항목은 수온(Water Temperature), 수소이온농도(pH), 전기전도도(EC), 용존산소(DO), 생물화학적 산소요구량(BOD), 화학적 산소요구량(COD), 부유물질(SS), 총질소(TN), 총인(TP), 총유기탄소(TOC) 등 총 10개 항목을 사용하였다. 통계분석 프로그램은 SPSS (Statistical Package the Social Science, ver. 14.0)를 이용하였으며, 통계분석기법 중 상관분석, 주성분 및 요인분석, 군집분석을 수행하였다. 본 연구에서는 임진강유역 7개의 수질측정망 지점을 대상으로 자료를 정리하였고, 계절별 자료를 정리하여 각각 다변량 통계분석을 실시하였다. 계절적 수질변동 특성을 파악하기 위하여 기온 및 강수량이 영향을 미치는 봄(3월~5월), 여름(6월~8월), 가을(9월~11월), 겨울(12월~2월)로 구분하여 통계분석에 실시하였다[3].

2.3. 자료의 통계적 분석

통계분석을 수행하기 전 자료의 정규성 분포를 알아보기 위하여 정규성 검정을 실시하였다. 정규성 검정에는 Shapiro-Wilk 및 Kolmogorov-Smirnov Test를 이용하였다. 정규성 검정 결과 모든 수질항목에서 유의확률 0.05 이하를 나타내어 정규분포를 따르지 않는 것으로 나타났다. 본 연구에서는 자료를 표준화 과정을 거쳐 다변량 통계분석을 이용하여 상관분석, 주성분 및 요인분석, 군집분석을 실시하였다. 자료의 표준화는 수질자료의 측정단위가 다르므로 이를 표준화하는 과정을 거치게 되는데 이러한 이유는 평균 0이며, 표준편차가 1이 되는 정규분포로 바꿔줌으로써 측정단위가 최종 결과에 미치는 영향을 제거하기 위해서이다[15].

상관분석(Correlation Analysis)은 변수 간에 가지고 있는 선형 관계를 수치적으로 나타내기 위한 분석방법이며, 피어슨 상관계수(Pearson correlation coefficient: r)를 이용하였다. 상관계수(r)는 -1≤r≤1의 값을 가지는데, 그 값이 -1≤r<0일 때는 음(-)의 상관관계를 가지고 0≤r<1일 때는 양(+)의 상관관계를 가진다. 또한 r의 절대 값이 0에 가까울수록 상관성이 낮다고 할 수 있고, 1에 가까울수록 상관성이 높다고 할 수 있다[16]. 주성분분석(Principal Component Analysis)은 자료를 간단하게 축소하여 다음에 추가적인 다른 통계기법을 적용하기 위한 사전분석이라 할 수 있다. 본 연구에서는 고유값(Eigen value)이 1.0 이상인 값을 갖는 주성분 축만을 고려하였다. 요인분석(Factor Analysis)은 변수들의 상관(Inter dependance)관계를 이용하여 비슷한 변수들끼리 묶어주는 방법이며 상관관계가 높은 변수들끼리 동질적인 몇 개의 집단으로 묶어 준다는 점에서 사용되고 있다[17]. 요인분석을 실행하기 전 자료에 대한 타당성을 알아보기 위해 표본적합도 검증(KMO test : Kaiser Meyer Olkin)과 단위행렬 검증(Bartlett test)을 실행하였다. KMO test는 자료에 대한 변수의 값이 타당성을 나타나는 척도로 1에 가까운 값일수록 요인분석의 타당성이 높고 0.5 이하일 경우에는 타당성 낮다. Bartlett test는 변수 간 상관행렬이 단위행렬인지 아닌지 검정하는 것을 말하다. 변수 간의 상관성이 높을수록 유의적 관계라 하며 0에 가까운 값일수록 유의성이 높다[3,18]. 요인패턴의 구조를 단순화시켜 요인 해석을 명확하기 위해 요인축을 회전시키며, 요인축을 회전하는 방법에는 크게 직교회전(Orthogonal Rotation)의 베리멕스(Varimax)회전 방법을 적용하여 분석하였다. 군집분석(Cluster Analysis)은 각 개체의 유사성을 측정하여 유사성이 높은 집단을 분류하고, 같은 군집에 속한 객체들의 유사성과 서로 다른 군집에 속한 개체간의 상이성을 규명하는 통계분석 방법이다. 본 연구에서는 계층적 군집분석을 이용하여 군집(Cluster)을 구하였다. 군집 대상간의 거리 측정은 모든 변수의 차이를 제곱하여 합산해서 결정하는 유클리디안 제곱거리(Squared Euclidean Distance) 방법을 적용하였고, 군집결합 방법은 평균거리를 두 군집간의 거리로정의하는 비가중 산술결합(Unweighted Pair-Group Method Arithmetic Average)을 적용하였다.

3. 결과 및 고찰

3.1. 시·공간적 수질변화 특성

임진강유역 수질측정망 지점의 수질특성을 알아보기 위하여 8년간 수질자료를 바탕으로 각 지점의 기초통계 자료를 Table 2에 나타내었다. 그리고 BOD, COD, SS, TN, TP, TOC 등 6개 수질항목별 지점별 오염물질 분포를 알아보고자 수질 농도분석 결과를 상자도식(Box Plot)으로 Fig. 1에 나타내었다.

Basic Statistics for observed water quality of monitoring sites in Imjin River from 2008 to 2015

Fig. 1.

Box plot of water quality values of each monitoring site from 2008 to 2015.

임진강유역의 수온변화 범위는 -0.1℃~32.3℃이며 높은 수온을 보인 지점은 평균 16.7℃로 나타난 신천3 지점이다. 이러한 이유는 신천3 지점 상류유역에 위치하고 있는 소규모 산업시설 및 축산농가 등 오염원의 영향으로 수온이 높은 것으로 판단된다. 계절별 평균 수온은 봄 13.7℃, 여름 24.7℃, 가을 15.7℃, 겨울 2.6℃로 나타나 전형적인 계절적 특성이 반영되어 나타났다. pH는 6.4~9.8 범위로 나타났으며 평균 8.0으로 나타났다. 상류지점에서 하류지점으로 갈수록 pH가 낮아지는 경향을 보였으며 계절에 상관없이 pH가 비슷한 값을 나타내어 계절의 영향은 없는 것으로 나타났다. EC는 조사기간 동안 53~5,060 μS/cm의 범위를 나타냈으며 평균 590 μS/cm으로 조사되었다. 신천3 지점과 한탄강3-1A 지점에서 각각 평균 1,710 μS/cm, 605 μS/cm으로 높게 나타났다. 한탄강3-1A 지점은 신천3 지점이 상류에서 유입되어 합류하기 때문에 신천3 지점의 영향을 크게 받는 것으로 판단된다. DO 농도범위는 5.0~20.3 mg/L이며 평균 농도는 11.0 mg/L로 나타났다. 영평천3 지점에서 평균 11.6 mg/L로 가장 높았으며, 신천3 지점에서 평균 10.3 mg/L으로 낮게 나타났다. 상류지점에서 하류지점으로 내려갈수록 DO의 값이 낮아지는 경향을 보였다. SS 농도범위는 0.3 mg/L~1,753.3 mg/L로 평균 36.4 mg/L 나타났다. 높은 SS 농도를 보인 지점은 평균 153.1 mg/L로 나타난 문산천3 지점이다. 문산천3 지점은 파주시 통과하는 도시형 하천으로 유입 오염원이 많고, 오랜 시간 동안 토사가 쌓여 썰물시간이 되어도 물이 제대로 빠져나가지 못하기 때문에 SS가 높은 것으로 판단된다. SS의 계절적인 수질변동은 여름시기인 7월에서 9월까지 홍수기에 유량증가 및 주변 환경 변화에 따라 변동 편차가 크게 나타났다.

BOD 농도범위는 0.2~39.5 mg/L이며 신천3 지점에서 BOD 평균 13.4 mg/L로 나타나 하천생활환경기준(VI)등급으로 조사되었다. BOD 농도는 2008년부터 2011년까지 평균 4.9 mg/L에서 3.5 mg/L으로 낮아지는 경향을 보였으나 2012년에는 평균 4.3 mg/L으로 증가하는 경향을 보였다. COD 농도범위는 1.1~62.4 mg/L이며 신천3 지점에서 COD 평균 19.9 mg/L로 나타나 하천생활환경기준(VI)등급으로 조사되었다. COD 농도는 2010년부터 2014년까지 평균 7.7 mg/L에서 9.3 mg/L으로 증가하는 경향을 보였으며 2014년에 신천3 지점에서 평균 19.6 mg/L 높은 농도를 나타내었다. TOC 농도범위는 0.7~55.9 mg/L이며 신천3 지점에서 TOC 평균 14.2 mg/L로 나타나 하천생활환경기준(VI)등급으로 조사되었다. 임진강유역의 임진강1A 지점은 유기물질 지표항목에서 낮은 농도를 나타냈으나, 신천3 지점은 점오염원에 따른 유기물질 및 영양염류 지표 항목에서 높은 농도를 나타내어 수질관리 방안이 필요하다고 판단된다.

TN 농도 범위는 0.231~25.985 mg/L이며 신천3 지점은 평균 11.145 mg/L로 조사되었다. 반면 낮은 TN 농도를 보인 임진강1A 지점은 평균 0.958 mg/L로 조사되었다. TP 농도 범위는 0.004~2.565 mg/L이며 문산천3 지점에서 평균 0.213 mg/L로 나타나 하천생활환경기준(IV)등급으로 조사되었다. 반면 낮은 TP 농도를 보인 임진강1A은 평균 0.022 mg/L로 나타나 하천생활환경기준(Ib)등급으로 조사되었다. Kim and Lee [11]는 신천3 지점이 위치한 신천은 섬유 및 피혁 등 소규모 산업시설과 공장단지에서 배출하는 폐수의 유기물 및 질소가 임진강 본류 수질에 상당한 영향을 끼친다고 보고하였다.

3.2. 상관분석 결과

수질인자간의 상관관계를 평가하기 위해 10개 수질항목에 대하여 전체 수질측정지점의 자료와 계절별 자료를 대상으로 상관분석을 각각 실시하여 Table 3에 나타내었다. 전체 수질측정지점의 자료 상관분석 결과 DO와 수온의 상관계수는 순천만수계의 관한 선행연구에서와 같이 -0.696(p<0.01)로서 높은 음의 상관성을 보여, 온도가 높을수록 산소의 용해도가 낮아지는 계절에 의한 원인으로 해석할 수 있다[19]. 그리고 pH와 수온의 상관계수는 -0.274 (p<0.01)로 낮은 상관성을 나타내었다. 유기물질 지표인 BOD와 COD, TN, TP, TOC에 대한 상관계수는 각각 0.977 (p<0.01), 0.930(p<0.01), 0.813 (p<0.01), 0.976 (p<0.01)로서 높은 상관성을 나타내었다. 특히 COD와 TOC, BOD, TN에 대한 상관계수는 각각 0.987 (p<0.01), 0.977 (p<0.01), 0.944 (p<0.01)로서 매우 높은 상관성을 나타내어, 유기물질과 영양염류지표 인자간의 상관성이 높은 것으로 나타났다. 반면 SS와 BOD, COD, TN의 상관계수는 0.125, 0.185, 0.084로 다른 수질항목과 다르게 매우 낮은 상관성을 나타냈다.

Pearson correlation matrix for total (A) and seasonal (B) averaged concentration by indices of monitoring sites

계절별 자료 상관분석 결과 BOD와 COD, TOC, TP의 상관계수는 각각 0.988 (p<0.01), 0.989 (p<0.01), 0.911 (p<0.01)로서 매우 높은 상관성을 나타내어 유기물질 및 영양염류 유입이 수질에 영향을 미치는 것으로 나타났다. 특히 TN과 EC의 상관계수가 r=0.939 (p<0.01)로 매우 높은 상관성을 나타내어 질소계열 오염물질인 비료와 축산오수, 생활오수를 통해 영양염류에 유입에 대한 영향이 크게 나타나는 것으로 판단된다[8]. 이러한 결과는 남강댐 하류유역의 시·공간적 특성분석 선행연구에서도 비슷한 결과를 나타내었다[20]. 그리고 TP와 EC, TN의 상관계수가 각각 0.890 (p<0.01), 0.827 (p<0.01)로 높은 상관관계를 나타내어 TN과 TP는 영양염류의 유입으로 수질이 영향을 받고 있는 것으로 해석할 수 있다. 반면 수온과 SS의 상관계수가 0.094 (p<0.01)로 낮은 상관관계를 나타났으나, pH와 SS의 상관계수가 -0.755(p<0.01)로 높은 음의 상관성을 보여 여름철 홍수기 강우에 유입으로 SS가 증가하는 것으로 나타났다.

3.3. 주성분 및 요인분석 결과

임진강유역의 전체 수질 측정지점(7개)의 연간 수질항목별 평균자료와 계절별 평균자료를 나누어 원 자료를 표준화 후 분석을 실시하였으며, 전체 수질측정지점의 자료 행렬은 56(수질측정지점×기간수) × 10(수질항목수)의 형태이며, 계절별 자료 행렬은 28(수질측정지점×계절수) × 10(수질항목수)의 차원으로 구분하여 분석하였다. 주성분분석을 이용하여 주성분 추출과 전체 수질측정 자료 및 계절별 고유치와 수질에 미치는 기여율을 산출하였다. 고유치가 1.0이상을 만족하는 요인 중에서 인자를 추출한 결과 전체 수질측정 지점의 자료는 2개의 주성분, 계절별 자료는 3개의 주성분이 추출되었다. 그리고 10개 수질항목의 요인에 대한 고유값과 비율, 수질에 미치는 기여율을 Table 4에 나타내었다. 누적기여율(Cumulative)은 각 요인의 고유치에 대한 수질에 미치는 기여율을 설명하는 것으로 주성분 전체 수질 변동에 대하여 임진강유역의 수질측정 자료는 2개의 주성분으로 81.221%, 계절별 자료는 3개의 주성분으로 96.241%를 설명할 수 있는 것으로 나타났다.

Initial eigenvalues explain of factor

임진강 유역의 전체 수질측정 자료와 및 계절별 자료의 각각 다른 수질특성이 나타나 수질요인을 조사하기 위하여 요인분석을 실시하였다. 본 연구에서는 전체측정소 및 계절별 자료의 KMO test 결과각각 0.741, 0.750로 분석되었고, Bartlett test 결과 전체 수질측정 자료 및 계절별 자료 모두 유의확률 0.000로 분석되어 유의수준(p<0.05)을 만족하여 상관행렬이 단위행렬로 나타나 요인분석이 가능하다는 것을 설명할 수 있다.

본 연구에서는 수질에 영향을 미치는 요인을 상관분석과 요인분석 결과를 바탕으로 크게 3가지로 구분하여 명명화하였다. 요인 1에서는 BOD, COD, TOC, DO, EC는 유기물질 요인, TN, TP는 영양염류 요인으로 명명화 하였으며 요인 2에서는 수온, SS는 계절적 수질변동 요인, 요인 3에서는 pH는 하천물질대사 요인으로 구분하여 3가지로 설명하였다. 단 전체 측정소의 산출된 요인이 2개를 나타내므로 요인 3에서의 pH는 하천물질대사 요인보다는 계절적인 수질 변동 요인과 관계가 있기 때문에 요인 2에 포함하여 설명하였다.

추출된 주성분에 대하여 정확한 해석을 위하여 차원 수를 결정하기 위해 추출된 10개의 최소 요인 중 직교회전 방법인 베리멕스(Varimax) 회전을 이용하여 요인수를 결정하여 Table 5에 나타내었다. 임진강 전체 수질측정 자료의 요인 1은 BOD, COD, DO, TN, TOC, TP가 높은 양(+)의 요인부 하량을 나타내어 임진강에 유입되는 유기물질 및 영양염류와 관련된 영향을 나타내는 주성분으로 설명할 수 있다. 이러한 결과는 임진강이 도시지역인 파주시, 양주시, 동주천시등에서 유입되는 도시하수의 영향이 나타난 것으로 해석할 수 있다. 요인 2는 pH, SS, EC, 수온이 주요 요인항목으로 나타내어 계절적 영향을 나타내는 주성분으로 설명할 수 있다. 특히 SS은 높은 양(+)의 요인부하량, 수온은 높은 음(-)의 요인부하량을 나타내어 계절적인 영향으로 해석할 수 있다.

Rotated factor matrix extracted from principal component analysis

Kim 등[21]은 북한강 지천의 요인분석 결과 요인 2에서 수온, DO의 요인부하량이 높게 나타나 계절적인 원인에 의한 수질변화와 관련이 있는 것으로 분석하였는데 이는 본 연구결과와 유사하였다.

계절별 자료 요인분석 결과 요인 1은 COD, TOC, BOD, EC, TN, TP가 높은 양(+)의 요인부하량을 나타내어 임진강에 유입되는 유기물질 및 영양염류의 지표항목과 관련된 항목으로 설명할 수 있으며, 이는 임진강 전체 수질측정 자료요인분석 결과와 같이 해석할 수 있다. 이러한 이유는 인구밀도가 높은 도심지역에 위치하여 다양한 오염원으로부터 노출되어 있는 환경적인 특성에 환경기초처리시설 방류수가 하천 수질에 영향을 주는 것으로 해석할 수 있다. 요인 2는 수온, DO로 나타났으며, 특히 수온은 높은 양(+)의 요인부하량을 나타냈으며, DO는 높은 음(-)의 요인부하량을 나타내어 계절적인 변동 요인으로 설명할 수 있다. 요인 3은 pH, SS로 나타났으며, pH는 높은 음(-)의 요인부하량, SS는 높은 양(+)의 요인부하량을 나타내어 하천물질 요인에 따른 부유물질이 여름에 강우에 의해 SS 증가로 해석할 수 있다.

임진강유역의 계절별 봄, 여름, 가을, 겨울 평균값에 대한 요인분석을 각각 실시하여 Table 6에 나타내었다. 임진강 공통적으로 요인 1에서 EC, BOD, COD, TN, TP, TOC의 요인부하량이 높게 나타났으며, 요인 2에서는 pH, SS가 요인부하량이 높게 나타났다. 봄에는 요인 2에서 pH, SS의 요인부하량이 높게 나타나 겨울의 강설 등의 영향으로 부유물질이 하천으로 유입되어 수질에 영향을 주는 것으로 판단된다. 여름에는 요인 1에서 EC, BOD의 요인부하량이 높게 나타나 여름철 홍수기에 강우에 의해 유입되는 유기물질이 수질에 영향을 주는 것으로 판단된다. 가을에는 요인 1에서 TOC, EC, COD, BOD, TN, TP가 높게 나타났으며 요인 2에서 SS, pH의 요인부하량이 높게 나타나 부유물질을 통한 유기물질 및 영양염류가 하천으로 유입되면서 수질에 영향을 주는 것으로 나타났다. 겨울에는 요인 1에서 TOC, COD, BOD, TN, EC, TP의 요인부하량이 높게 나타나 유기물질 및 영양염류 요인에 의한 수질변동으로 해석되었다. 임진강유역은 계절에 관계없이 일정한 수질변동 특성을 보였으며 봄, 여름, 가을, 겨울 모두 공통적으로 요인 1에서 EC, BOD, COD, TN, TP, TOC의 유기물질 및 영양염류 요인을 설명하고 있어 최근 임진강 주변 산업단지의 발달과 다양한 오염원으로부터 노출되어 수질에 영향을 주는 것으로 해석할 수 있다.

Rotated component matrix by seasonal factor analysis

직교회전 전·후의 고유값과 누적기여율을 비교하여 Table 7에 나타내었다. 전체 수질측정 자료 및 계절별 자료 분석결과 가장 큰 순서대로 각각 2축, 3축까지 고려하는 것이 타당함을 알 수 있었다. 분석 결과 회전 전·후 모두 동일한 개수의 축이 산출되었으며, 전체 수질측정 자료의 요인 1은 58.161%, 요인 2은 23.060%, 계절별 자료의 요인 1은 56.811%, 요인 2은 20.654, 요인 3은 18.776% 순으로 임진강유역은 유기물질 및 영양염류에 의한 오염이 가장 크며, 계절적인 요인과 하천물질 요인에 따른 부유물질에 의한 요인 순으로 영향을 받는 것으로 설명할 수 있다. 요인분석에 사용된 10개의 변수들에 대한 임진강유역 전체수질측정자료 및 개별별 자료에 대한 변화를 Fig. 2에 제시하였다.

Comparison between varimax rotation before and after matrix of factor loading

Fig. 2.

Component plot of total monitoring sites and season.

전체 수질측정 자료의 요인 1축에 유기물질과 영양염류에 해당하는 지표가 대부분 가까운 거리에 그룹화 되었으며, 계절적인 영향을 받는 수온과 SS는 2축의 분산되어 나타나고 있다. 그리고 계절별 자료에서 유기물질과 영양염류에 의한 것이 요인 1축에 나타났으며, 계절적 영향을 받는 수온, SS는 2축, pH는 3축에 분산되어 나타나고 있다.

3.4. 군집분석 결과

임진강유역 7개 지점의 공간적 요인에 의한 군집분석 결과와 계절적 요인에 의한 군집분석 결과를 수지도(Dendrogram)로 Fig. 3에 나타내었다. 공간적 요인에 의한 군집분석 결과 I그룹은 임진강1A 지점, 한탄강1A 지점으로, II그룹은 영평천3 지점, 한탄강3-1A 지점, 문산천3 지점, 임진강3A 지점으로 III그룹은 신천3 지점으로 총 3개 그룹으로 분류하여 나타났다. 이러한 결과는 임진강1A 지점과 한탄강1A 지점은 수질특성이 가장 비슷한 것으로 보이며, 임진강1A 지점과 신천3 지점은 수질특성이 가장 다른 것으로 나타났다. 임진강1A 지점과 한탄강1A 지점은 각각 임진강의 상류, 한탄강의 상류 지점으로 전형적인 자연형 하천이고, 신천3 지점은 생활하수 및 공장에서 배출하는 오폐수의 영향이 큰 지점이다. 따라서 임진강1A 지점과 신천3 지점은 수질오염도가 뚜렷하게 양극화 현상을 보여 임진강 수질에 미치는 영향이 큰 것으로 분석되었다. 결과적으로 임진강의 수질 오염도를 평가한 결과 신천3 지점인 신천이 수질이 가장 악화되었고, 다음으로는 영평천3 지점, 한탄강3-1A 지점 순으로 나타났으며, 임진강1A 지점과 한탄강1A 지점은 매우 깨끗한 수질을 유지하고 있어 도시와 공장단지에 있는 신천3 지점의 수질과 대비를 이루었다. 이것은 임진강을 중심으로 유입되는 하천의 토지이용 특성 및 하천에 분포하는 오염원의 영향을 받는 것으로 해석할 수 있다.

Fig. 3.

Dendrogram of spatial and temporal from cluster analysis.

계절적 요인에 의한 군집분석 결과는 Euclidean distance가 5 이하인 집단을 하나의 그룹으로 보았을 때, I그룹은 추계인 4월, 5월, 10월, 11월, 12월, II그룹은 춘계인 2월, 3월, 6월, III그룹은 하계인 7월, 8월, 9월, IV그룹은 동계인 1월 등으로 계절별 변동 특성에 따라 총 4개 그룹으로 분류되어 나타났다. 특히 동계인 1월이 다른 계절에 비하여 뚜렷한 수질특성을 나타났다. 이러한 이유는 강우와 기온, 유량요인 등이 수질변화 군집에 기여하는 것으로 판단된다.

4. 결 론

본 연구는 임진강유역을 대상으로 수질변화 특성을 분석하였고, 그리고 다변량 통계분석을 이용하여 시·공간적으로 나누어 상관분석, 주성분 및 요인분석, 군집분석을 통해 수질변동에 영향을 주는 주요한 요인을 검토하였으며 다음과 같은 결과를 도출하였다.

1) 임진강유역의 수온은 전형적인 계절적 특성이 반영되어 나타났으며, pH와 DO는 상류유역에서 하류유역으로 갈수록 낮아지는 경향을 나타냈다. 한탄강3-1A 지점은 상류에서 유입하는 신천3 지점의 영향을 받으며, 특히 신천3 지점은 유기물질과 영양염류의 지표항목에서 높은 농도가 나타났다.

2) 상관분석 결과 BOD는 COD와 TOC의 상관계수가 각각 0.912, 0.893 (p<0.01)으로 유기물질 지표항목 간의 통계적으로 유의한 양의 상관관계를 보였다. 부유물질과 유기물 지표항목 간의 상관성은 통계적으로 낮게 나타났다. 계절별 자료 상관분석 결과에서도 BOD는 TOC, TP의 상관계수가 각각 0.989, 0.911 (p<0.01)으로 유기물질 및 영양염류 지표 항목간의 유의한 양의 상관관계를 보였다.

3) 주성분 및 요인분석 결과 임진강유역은 2개의 주성분으로 수질변동을 82.221%를 설명할 수 있다. 요인 1은 BOD, COD, DO, TN, TOC, TP가 높은 양(+)의 요인부하량이 나타나 유기물질 및 영양염류와 관련된 것으로 나타났다. 요인 2는 pH, SS, EC, 수온으로 분류되어 계절적 영향을 받는 요인으로 나타났다. 임진강유역은 유기물질 및 영양염류와 계절적인 영향을 동시에 받는 것으로 나타났다.

4) 계절변화에 영향을 미치는 주성분 및 요인분석 결과 3개의 주성분으로 요인 1은 유기물 및 영양염류의 요인, 요인 2는 계절적 변동요인, 요인 3은 하천물질대사 요인이 영향을 미치는 것으로 나타났다. 임진강유역은 계절에 관계없이 일정한 수질변동 특성을 보였으며 봄, 여름, 가을, 겨울에서 공통적으로 요인 1에서 EC, BOD, COD, TN, TP, TOC의 유기물질 및 영양염류 요인을 설명하고 있어 최근 임진강 주변 산업단지의 발달과 다양한 오염원으로부터 수질에 영향을 주는 것으로 나타났다.

5) 수질특성에 따른 군집화 경향을 알아보기 위하여 군집분석 결과 공간변화에 따른 토지이용 특성 및 오염도에 따라 3개 그룹으로 분류되었다. I그룹은 전형적인 자연형 하천, II그룹은 도시·농촌 복합 하천, III그룹은 점오염원의 영향이 큰 지점이다. 계절변화에 따른 군집결과 기온, 강우 및 유량요인 등이 수질변화 군집에 기여하여 I그룹은 4월, 5월, 10월, 11월, 12월(춘·추계), II그룹은 2월, 3월, 6월(춘·하계), III그룹은 7월, 8월, 9월(하계), IV그룹은 1월(동계) 등으로 4개 그룹으로 분류되었다.

6) 임진강유역의 수질은 외부 오염물질의 영향이 적은 산간지역 하천과 도시하천의 경우 수질특성이 명확히 구분되었다. 임진강유역의 효율적인 관리 및 보전을 위해서는 본류에 유입하는 수질농도가 높은 지류에 대해서 정기적인 모니터링 및 수질관리가 필요하다고 판단된다.

References

1. Gyeonggi Research Institute. "Survey on the Major Streams of Northern Part in Gyeonggi-do," 2005.
2. Han River Basin Environmental Office Ministry of Environment. "Water Environment Management Progrem a Upstream and Downstream Mid-Watershed in Imjin River," 2014.
3. Kim M. A., Lee J. K., Zoh K. D.. Evaluation of the Geum River by Multivariate Analysis: Principal Component Analysis and Factor Analysis. J. Korean Soc. Water Qual 23(1):161–168. 2007;
4. Jung S. J., Lee D. J., Hwang K. S., Lee K. H., Choi K. C., Im S. S., Lee Y. H., Lee J. Y., Lim B. J.. Evaluation of Pollutant Characteristics in Yeongsan River Using Multivariate Analysis. Korean J. Limnol 45(4):368–377. 2012;
5. Bengraine K., Marhaba T. F.. Using principal component analysis to monitor spatial and temporal changes in water quality. J. Hazard. Mater 100:179–195. 2003;
6. Singh K. P., Malik A., Mohan D., Sinha S.. Multivariate statistical techniques for the evaluation of spatial and temporal variations in water quality of Gomti River (India). Water Res 38:3980–3992. 2004;
7. Lee H. J., Kong D. S., Kim S. H., Shin K. S., Park J. H., Kim B. I., Kim S. M., Jang S. H., Cheon S. U.. Investigation on Water Quality Variation Characteristics During Dry Season in Namhan River Drainage Basin. J. Korean Soc. Water Environ 23(6):889–896. 2007;
8. Gwak B. R., Kim I. K.. Characterization of Water Quality in Changnyeong-Haman Weir Section Using Statistical Analyses. J. Korean Soc. Environ. Eng 38(2):71–78. 2016;
9. Park J. W., Jung J. W., Kim D. Y., Kim K. S., Han S. W., Kim H. O., Lim B. J.. Water Quality Characteristics of the Major Tributaries in Yeongsan and Sumjin River Basin using Statistical Analysis. J. Environ. Impact Assess 22(2):171–181. 2013;
10. Kim G. A., Kim, Y J., Song, M J., Ji, K W., Yu P. J., Kim, C W.. Evaluation of Water Quality Characteristics in the Nakdong River using Multivariate Analysis. J. Korean Soc. Water Qual 23(6):814–821. 2007;
11. Kim Y. Y., Lee S. J.. Evaluation of Water Quality for the Han River Tributaries Using Multivariate Analysis. J. Korean Soc. Environ. Eng 33(7):501–510. 2011;
12. Choi O. Y., Kim K. H., Han I. S.. A Study on the Spatial Strenght and Cluster Analysis at the Unit Waterahed for the Manahement of Total Maximum Daily Loads. J. Korean Soc. Water Environ 31(6):700–714. 2015;
13. Xu H. S., Z. X. Xu W. Wu and F. F. Tang.. Assessmnet and spatiotemporal variation analysis of water quality in the Zhangweinan River basin, China. Proc. Environ. Sci 13:1641–1652. 2012;
14. Ministry of Environment. Water Information System. http://water.nier.go.kr.
15. Oh Y. C., Lee N. D., Kim, J G.. The Evaluation of Water Quality in the Mankyung River using Multivariate Analysis. J. Environ. Sci 13(3):233–244. 2004;
16. Noh H. J.. Multivariate analysis theory and practice using SPSS & Excel hyungseul Publishing networks; Seoul: 187–469. 2005.
17. Park J. H., Moon M. J., Lee H. J., Kim K. S.. A Study on Characteristics of Water Quality using Multivariate Analysis in Sumjin River Basin. J. Korean Soc. Water Environ 30(2):119–127. 2014;
18. Bernard P., Antoine L., Bernard L.. Principal Component Analysis: an Appropriate Tool for Water Quality Evaluation and Management-application to a Tropical Lake System. Ecol. Modeling 178:295–311. 2004;
19. Kong B. W., Lee W. J., Ra D. G., Cheong C. J.. Evaluation of water quality using statistic analysis for the streams flowing into the Suncheon Bay. J. Korean Soc. Environ. Technol 18(2):149–158. 2017;
20. Kim G. H., Jung K. Y., Yoon J. S., Cheon S. U.. Temporal and Spatial Analysis of Water Quality Data Observed in Lower Watershed of Nam River Dam. J. Korean Soc. Hazard. Mitig 13(6):429–437. 2013;
21. Kim S. H., Ryu I. G., Park M. J., Shin K. Y., Hwang S. H., Cho H. S., Lee J. K., Lee Y. J.. Characteristics of Water Quality Trend using Multivariated Analysis for the Han River. J. Environ. and Sanitary Eng 31(1):13–25. 2016;

Article information Continued

Fig. 1.

Box plot of water quality values of each monitoring site from 2008 to 2015.

Fig. 2.

Component plot of total monitoring sites and season.

Fig. 3.

Dendrogram of spatial and temporal from cluster analysis.

Table 1.

Monitoring sites on Rivers and streams on Imjin River watershed

No. Code Monitoring site name River (Stream) name Locations
Address sampling site points Latitude Longitude
1 M1 Imjin River 1A Imjin River Samwha Bridge, Yoncheon-gun, Gyeonggi-do 38-01-16 126-59-02
2 M2 Imjin River 3A Imjin River Junjin Bridge, Paju-si, Gyeonggi-do 37-54-10 126-49-26
3 T1 Hantan River 1A Hantan River None name Bridge, Cheorwon-gun, Gangwon-do 38-08-12 127-16-50
4 T2 Yeongpyeong Stream 3 Yeongpyeong Stream Baegui Bridge, Yeoncheon-gun, Gyeonggi-do 38-01-13 127-08-24
5 T3 Shin Stream 3 Shin Stream Singi Bridge, Yeoncheon-gun, Gyeonggi-do 38-00-19 127-04-43
6 T4 Hantan River 3-1A Hantan River Hantan Bridge, Yeoncheon-gun, Gyeonggi-do 37-59-59 127-01-27
7 T5 Moonsan Stream 3 Moonsan Stream Okseok Bridge, Paju-si, Gyeonggi-do 37-51-20 126-46-41

Table 2.

Basic Statistics for observed water quality of monitoring sites in Imjin River from 2008 to 2015

Monitoring site BOD (mg/L)
COD (mg/L)
SS (mg/L)
N Max Min Mean SD Max Min Mean SD Max Min Mean SD
M1 346 3.8 0.2 0.8 0.41 8.6 1.1 2.9 0.96 103 0.3 6.9 11.52
M2 340 7.7 0.3 1.8 1.12 32.8 1.6 5.3 2.39 896.7 1 21 58.33
T1 352 11.3 0.2 1.5 1.4 14.8 1.4 3.7 1.71 200 0.3 10.7 23.35
T2 352 28.5 0.7 4.1 3.08 27.2 2.7 8.3 3.77 572.5 1.2 14.6 48.6
T3 351 39.5 2 13.4 7.35 62.4 5.8 19.9 7.61 1753.3 4.7 34.7 121.6
T4 352 14.3 0.4 4.1 2.62 25.3 2.7 8.3 3.97 231.6 1.8 14 22.81
T5 352 13.1 0.6 4 2.26 36.2 2.9 8.4 4.3 1485 4.6 153.1 218.89

Monitoring site TN (mg/L)
TP (mg/L)
TOC (mg/L)
N Max Min Mean SD Max Min Mean SD Max Min Mean SD

M1 346 2.758 0.231 0.958 0.36 0.341 0.004 0.004 0.03 7.2 0.7 1.7 0.69
M2 340 8.961 0.918 2.828 1.12 0.426 0.017 0.017 0.06 21.4 1.3 3.4 1.77
T1 352 4.33 0.619 1.962 0.62 0.483 0.011 0.011 0.06 9.7 0.7 2.1 1.08
T2 352 11.925 2.549 6.302 1.86 1.37 0.024 0.024 0.11 16.9 1.4 5.4 2.58
T3 351 25.985 2.64 11.145 4.31 2.565 0.06 0.06 0.31 55.9 2.9 14.2 6.53
T4 352 12.615 1.814 5.806 2.39 1.39 0.024 0.024 0.12 14.4 1.5 5.4 2.78
T5 352 18.725 1.715 4.416 1.82 1.294 0.031 0.031 0.17 18.8 1.8 5.3 2.57

*N : the number of observed value by monitoring site, Max: maximum value, Min : minimum value, SD : standard deviation value

Table 3.

Pearson correlation matrix for total (A) and seasonal (B) averaged concentration by indices of monitoring sites

Variable WT pH EC DO BOD COD SS TN TP TOC
(A) WT 1
pH -.274** 1
EC -.696** .483** 1
DO .622** -.074** -.573** 1
BOD .470 .056 -.483** .945** 1
COD .471 -.003 -.479** .946** .977** 1
SS .246 -.586** -.429** .154 .125 .185 1
TN .442** -.046 -.417** .941** .930** .944** .084 1
TP .383** -.043 -.499** .757** .813** .781** .395** .763** 1
TOC .490 -.001** -.479** .950** .976** .987** .130 .941** .725** 1

(B) WT 1
pH .058 1
EC -.071 -.048 1
DO -.978** .029 -.017 1
BOD .008 .056 .967** -.097 1
COD .017 -.031 .976** -.111 .988** 1
SS .094 -.755** .129 -.208 .113 .165 1
TN -.237 -.054 .939** .163 .899** .926** .048 1
TP .057 -.288 .890** -.179 .911** .933** .465* .827** 1
TOC .047 -.007 .976** -.136 .989** .997** .140 .916** .923** 1
*

Correlation is significant at the 0.05 level (2-tailed).

**

Correlation is significant at the 0.01 level (2-tailed).

Table 4.

Initial eigenvalues explain of factor

Component Eigenvalue
% of Variance
% Cumulative
(A) (B) (A) (B) (A) (B)
1 6.193 5.746 61.932 57.456 61.932 57.456
2 1.929 2.141 19.288 21.407 81.221 78.863
3 0.816 1.738 8.164 17.378 89.385 96.241
4 0.485 0.255 4.854 2.550 94.239 98.792
5 0.288 0.052 2.883 0.517 97.121 99.309
6 0.186 0.040 1.863 0.404 98.984 99.713
7 0.055 0.012 0.548 0.119 99.533 99.832
8 0.028 0.009 0.281 0.092 99.813 99.925
9 0.013 0.006 0.126 0.059 99.939 99.984
10 0.006 0.002 0.061 0.016 100.000 100.000

*(A) Total monitoring sites, (B) Season.

Table 5.

Rotated factor matrix extracted from principal component analysis

Variable Total monitoring sites
Season
Factor 1 Factor 2 Factor 1 Factor 2 Factor 3
WT 0.496 0.527 -0.037 0.993 -0.071
pH 0.110 -0.861 0.004 0.066 -0.938
EC -0.456 -0.724 0.984 -0.039 0.033
DO 0.961 0.184 -0.052 -0.991 -0.086
BOD 0.986 0.055 0.990 0.052 -0.031
COD 0.973 0.112 0.996 0.056 0.042
SS 0.053 0.803 0.118 0.135 0.930
TN 0.956 0.059 0.946 -0.221 0.002
TP 0.802 0.246 0.917 0.106 0.348
TOC 0.973 0.080 0.994 0.084 0.015

*Rotation Method: Varimax with Kaiser Normalization

Table 6.

Rotated component matrix by seasonal factor analysis

Season Component 1 Component 2
Spring EC, BOD, COD, TOC, TN, TP, WT, DO pH, SS
Summer EC, BOD, TN, COD, TOC, TP, WT SS, pH, DO
Fall TOC, EC, COD, BOD, TN, TP, WT SS, pH, DO
Winter TOC, COD, BOD, WT, TN, EC, TP SS, pH

Table 7.

Comparison between varimax rotation before and after matrix of factor loading

Sample Component Extraction sums of squared loadings
Rotation sums of squared loadings
Total % of Variance % Cumulative Total % of Variance % Cumulative
(A) 1 6.193 61.932 61.932 5.816 58.161 58.161
2 1.929 19.288 81.221 2.306 23.060 81.221
(B) 1 5.746 57.456 57.456 5.681 56.811 56.811
2 2.141 21.407 78.863 2.065 20.654 77.466
3 1.738 17.378 96.241 1.878 18.776 96.241

*(A) Total monitoring sites, (B) Season.