Download as pdf or txt
Download as pdf or txt
You are on page 1of 19

http://dx.doi.org/10.18853/jjell.2022.64.4.

009

영어영문학 연구 제64권 4호
(2022. 12): 193-211

영어 접두사 dis-와 un-의 결합분포 차이에 대한


확률음운론적 분석

박 창 범
(서원대학교)

I. 서론

영어의 부정 접두사는 in-, un-, dis-, de-, non-, mis-, anti-, a-,
mal- 등 매우 다양한 형태로 나타나지만, 이형태 선택(allomorph
selection)의 관점에서 어기에 따른 접두사의 형태를 음운적으로 예측하기
는 거의 불가능하다. 물론, 접두사 in-의 경우 결합하는 어기의 첫 자음에
동화되어 음운변화를 겪는 사실(예: i[m]+possible, i[ŋ]+ credible,
i[l]+logical, i[r]+relevant)은 잘 알려져 있지만, 이 현상이 다른 부정 접두
사의 형태로부터 in-을 선택하게 만드는 것과는 다른 차원의 문제이다. 즉,
영어에서 in+possible은 가능하지만 *un+possible이나 *dis+possible 등은
허용되지 않는 결합인 이유를 음운적으로 설명하는 것은 거의 불가능하다.
따라서 이러한 접두사 선택에 관한 연구는 형태․음운론 보다는 주로 의
미론적, 혹은 어원학적 관점에서 다루어져 온 주제였다.
하지만 최근 비범주적(gradient) 관점에서 계량적 방법론을 이용하여 형
태적 생산성을 밝히는 연구들(Baayen 1989, Hay 2001, Plag 1999, 2006)
이 활발하게 나타남에 따라, 형태소 선택에 대한 언어화자의 직관을 음운
론적으로 예측하고자 하는 시도가 가능하게 되었다. 특히, Park(2021)에서
는 영어 접미사 –ment와 –ness의 결합양상 차이가 조음위치와 관련이
있음을 확률음운론적 분석을 통해 밝힌 바 있다. 영어의 접미사뿐만 아니
라 접두사도 음운적 동기가 결합분포에 차이가 있을 것이라는 가정이 본
194 박 창 범

연구의 시발점이라 볼 수 있겠다.


본고에서는 영어의 부정 접두사 중 음운변화에 민감한 Class I 접사
(Siegel 1974)인 in-을 제외하고 가장 빈번하게 나타나는 dis-와 un-의 결
합분포에 대한 음운적 차이를 파악해 보고자 한다.1) 즉, 본 연구의 목적은
영어 접두사 dis-와 un-이 결합하는 어기의 첫 자음에 따라 서로 다른 분
표를 나타내는지를 조사하고, 만약 통계적으로 유의미한 차이를 보인다면
그 음운론적 동기를 밝히고 확률음운론 이론에 의해 형식화하는데 있다.
나아가 영어화자를 대상으로 한 실험을 통해 자음별 접두사 선택의 차이를
조사하고 확률음운론 문법에서 예측하는 경향을 반영하고 있는지도 살펴보
고자 한다.

II. 자료수집 및 통계분석

2.1. 자료수집

본 연구에서는 어기 첫 자음에 따른 접두사 dis-와 un-의 결합분포를


조사하기 위해 다음과 같은 과정으로 자료를 수집하였다. 먼저, 코퍼스 분
석 프로그램인 AntConc(Anthony 2020)을 이용하여 CMU 발음사전
(Carnegie Mellon University Pronouncing Dictionary)2)에 수록되어 있는
모든 단어 중 접두사 dis-와 un-이 결합되어 있는 단어들을 추출한 후, 각
접두사 다음의 자음, 즉 어기의 첫 자음별로 나타나는 단어들의 개수를 산
출하였다.3) 그 결과는 아래 표와 같다.

1) CMU 발음사전에서 확인해 본 결과, un-이 결합된 단어는 총 1,004개, dis-는


722개, mis-는 385개, non-은 170개 등으로 발견되었다. 한편 Chung(2021)에서
는 dis-를 Class I과 II의 속성을 모두 갖고 있다고 주장하고 있다.
2) CMU 발음사전은 북미영어 134,000개 이상의 단어와 해당 발음들이 수록된 공
개 사전으로, 본고에서는 0.7b 버전을 사용하였다.
(http://www.speech.cs.cmu.edu/cgi-bin/cmudict/)
3) 영어의 음소배열규칙 상 자음 [ŋ]과 [ʒ]으로 시작하는 단어가 존재할 수 없으므
로 접두사가 두 자음 앞에 결합할 가능성 또한 없다. 실제로 CMU 발음사전에
도 그러한 사례는 없는 것으로 파악되었다. 따라서 두 자음은 본고의 논의에서
제외하기로 한다.

(c) 2022 한국중앙영어영문학회 (Http://www.jella.or.kr)


영어 접두사 dis-와 un-의 결합분포 차이에 대한 확률음운론적 분석 195

(1) 어기 첫 자음별 영어 접두사 dis-와 un-의 분포


#__
p t k b d g f v θ ð s z ʃ ʧ ʤ h m n r l w j total
prefix
dis 89 98 128 16 5 20 6 0 0 0 614) 0 0 9 2 4 28 4 19 13 2 3 507
un 46 40 95 43 58 9 56 7 3 0 102 2 8 6 10 22 20 14 72 26 26 7 672

위 표에 의하면, CMU 발음사전의 단어들 중 dis-와 un-이 결합되어 있는


단어는 각각 총 507개와 672개로 나타났다. 두 접두사 모두 어기 첫 자음
에 따라 다양한 분포를 보이고 있는데, 예를 들어 자음 [p] 앞에 결합하는
dis-와 un-은 각각 89개와 46개의 단어들이 발견되었고, [b]에 결합한 경
우는 각각 16개와 43개로 나타났다. dis-가 더 많이 결합한 자음들은 [p, t,
k, g, ʧ, n]이고, 나머지 자음들은 un-이 결합한 사례가 더 많은 것으로 파
악되었다. 단, [ð]에 결합하는 경우는 두 접두사 모두에서 발견되지 않았다.

2.2. 통계분석

만약 어기의 첫 자음별로 dis-와 un-의 결합분포가 유사하게 나타난다


면 두 접두사의 음운적 차이는 없다고 볼 수 있겠고, 반대로 그 유사성이
포착되지 않고 자음에 따라 상이한 결합분포를 보인다면 음운적 차이를 발
견할 수 있을 것이다. 하지만 CMU 발음사전에서 수집된 두 접사의 표본
수는 서로 동일하지 않고, 겉으로 보기에 두 접두사 간의 분포 차이가 쉽
게 포착되지 않으므로, 두 접두사의 분포에 대한 상관관계를 통계적으로
입증해 보기 위해 단순회귀분석(Simple linear regression test)을 적용해
보기로 한다. 즉, 두 분포 간에 통계적으로 상관관계가 있다면 서로 유사성
이 있는 것이 확인될 것이다. R 프로그램(R Development Core Team
1993-2011) 에서 접두사 dis-와 un-의 값을 각각 독립변수와 종속변수로
대입하여 회귀분석을 실행(명령어: lm(un~dis))한 결과는 아래 표와 같다.

4) 여기에서는 dissimilar, dissolve 등과 같이 dis와 결합하는 어기의 첫 자음이 /s/


인 경우를 모두 포함한 수치를 나타낸 것이고, 실제로는 di[s]imilar, di[z]olve
등처럼 [s]나 [z]로 음운변화해서 발음된다. CMU 발음사전에 의하면 dis 다음에
[s]로 시작하는 어기가 결합하여 [ss] 연쇄로 발음되는 경우는 없는 것으로 나타
났다. 본고에서는 결합분포를 파악하는 것이 주목적이므로 61개의 사례로 간주
하기로 한다.
196 박 창 범

(2) 어기 첫 자음별 dis-와 un-의 결합분포에 대한 단순회귀분석 결과


변수 B St.Err. t P
(상수) 18.279 5.953 3.071 0.006
dis- 0.532 0.14 3.803 0.001
adj.R2 = 0.391, F = 14.46 (p<0.01)

결과적으로 기울기 dis의 P값이 매우 작으므로(P=0.00112 (P<0.01)) 회귀


식은 유의하다고 볼 수 있다. 즉, 단순회귀분석을 통해 두 접두사의 상관관
계를 증명해 본 결과, 접두사 dis-와 un-는 통계적으로 상관관계가 있는
것으로 나타났다. 다시 말하면, 두 접두사 모두 대체로 많이 결합하는 어기
의 첫 자음과 적게 결합하는 어기의 첫 자음이 비슷하게 분포하고 있는 것
이라고 볼 수 있겠다.
이 사실은 결국 영어단어에서 첫 자음으로 많이 발생하는 자음일수록
접두사 dis-와 un-도 마찬가지로 많이 결합할 것이라는 예측이 가능하다.
실제로 이러한 접두사의 결합분포가 영어단어(어기)의 첫 자음의 빈도수와
상관관계가 있는지를 알아보기 위해 아래 표와 같이 CMU 발음사전에서
첫 자음의 빈도수를 조사하여 내림차순으로 정렬하였다.

(3) 영어단어 첫 자음 빈도와 어기 첫 자음별 접두사 dis-와 un-의 분포


#__ #C dis+ rate un+ rate total
k- 12996 128 25.45% 95 14.14% 223
s- 12520 61 12.13% 102 15.18% 163
b- 9749 16 3.18% 43 6.40% 59
m- 9522 28 5.57% 20 2.98% 48
p- 7782 89 17.69% 46 6.85% 135
d- 7748 5 0.99% 58 8.63% 63
r 7441 19 3.78% 72 10.71% 91
h- 6717 4 0.80% 22 3.27% 26
f- 5610 6 1.19% 56 8.33% 62
l 5502 13 2.58% 26 3.87% 39
g- 4975 20 3.98% 9 1.34% 29
t- 4907 98 19.48% 40 5.95% 138
w- 3814 2 0.40% 26 3.87% 28
n- 3428 4 0.80% 14 2.08% 18
ʃ- 2493 0 0.00% 8 1.19% 8
v- 2421 0 0.00% 7 1.04% 7
ʤ- 2177 2 0.40% 10 1.49% 12

(c) 2022 한국중앙영어영문학회 (Http://www.jella.or.kr)


영어 접두사 dis-와 un-의 결합분포 차이에 대한 확률음운론적 분석 197

ʧ- 1267 9 1.79% 6 0.89% 15


j- 1225 3 0.60% 7 1.04% 10
z- 953 0 0.00% 2 0.30% 2
θ- 642 0 0.00% 3 0.45% 3
ð- 72 0 0.00% 0 0.00% 0
113961 507 100% 672 100% 1,179

위 표에서 보이듯이, 단어의 첫 자음이 빈도가 높을수록 접두사 dis-와


un-도 많이 결합한다는 사실을 대략적으로 판단할 수 있다. 좀 더 통계적
으로 객관성 있는 판단을 위해 단순회귀분석으로 각각 검증해 보았다. 그
결과의 P값들만 나타내면 아래 표와 같다.

(4) 영어단어 첫 자음 빈도와 dis-와 un-의 분포에 대한 단순회귀분석 결


과 (P값만 제시)
독립변수(IV) #C
종속변수(DV) dis- un- Total
P-value 0.0014 2.69E-07 3.26E-06

위 표에서 보이듯이, 영어단어의 첫 자음별 빈도수를 독립변수로 보고, 접


두사 dis-와 un-의 자음별 빈도수를 각각 종속변수로 지정하여 분석을 실
행한 결과, 두 접두사 각각 통계적으로 유의미한 것으로 나타났고 두 접두
사의 합도 역시 상관관계가 있는 것으로 드러났다.
지금까지의 통계분석 결과 dis-와 un-의 결합분포는 차이가 없고 빈도
가 높은 어기의 첫 자음일수록 두 접두사도 높은 비율로 결합한다는 것을
알 수 있었다. 결국 두 접두사의 선택은 음운적으로 예측이 불가능하고 더
이상의 분석은 무의미한 것으로 볼 수도 있겠다.
그러나 이러한 통계 결과만 보고 접두사 dis-와 un-의 결합분포는 음운
적 차이가 없다고 단정 지을 수는 없다. 그 이유는 [ʃ, v, ʤ, ʧ, j, z, θ, ð]
등처럼 빈도가 매우 낮은 자음들이 결과에 영향을 주었을 가능성이 크기
때문이다. 무엇보다 표 (1)과 (3)의 수치들을 자세히 관찰해 보면, 높은 비
율로 차지하고 있는 파열음들이 유무성에 따라 dis-와 un-의 결합이 서로
상반된 수치를 보이고 있음을 알 수 있다. 예를 들어, 무성음 [p]로 시작하
는 어기의 경우 dis-와 결합하는 단어는 89개, un-과 결합하는 단어는 46
개인 반면, 유성음 [b]의 경우는 각각 16개와 43개로 서로 반대되는 결과
를 보이고 있다. [t]와 [d]도 비슷하게 무성음 [t]는 dis-를 유성음 [d]는
198 박 창 범

un-을 선호하는 수치를 보이고 있다. 따라서 파열음들만 분리해서 통계분


석을 해 보는 것이 의미가 클 것으로 보인다. 파열음들에 대한 값들과 이
에 대한 단순회귀분석 결과는 아래와 같다.

(5) 어기의 첫 자음이 파열음일 경우 dis-와 un-의 분포에 대한 단순회귀


분석 결과 (P값만 제시)
C #C dis- un-
k 12996 128 95
b 9749 16 43
p 7782 89 46
d 7748 5 58
g 4975 20 9
t 4907 98 40
IV DV DV
P-value 0.503 0.029

위 표의 P값에서 보이듯이, 단어 첫 자음(파열음)의 빈도수와 dis-와 un-


의 결합분포는 각각 통계적으로 상관관계가 없는 것으로 나타났다. 추가적
인 통계분석 결과 두 접두사 dis-와 un- 간의 상관관계도 없는 것으로 드
러났다 (un~dis: p-value 0.248 (Pearson’s product-moment correlation의
p값도 동일)).
따라서 본고에서는 위 여섯 개의 파열음과 비교적 편차를 많이 보이는
비음([m]과 [n]), 그리고 유음([r]과 [l])을 추가하여 총 10개의 자음을 중심
으로 분석해 보기로 한다.5)

III. 최대 엔트로피 문법에 의한 분석

3.1. 최대 엔트로피 문법

언어의 비범주적 음운현상은 주로 최적성이론(Optimality Theory,


McCathy and Prince 1995; Prince and Smolensky 2004)의 틀에서 다루

5) 표 (3)에 의하면 [s], [f], [h]를 제외한 마찰음들은 그 빈도수가 너무 적어 그 분


포를 파악하기 힘들기 때문에, 본고에서는 파열음과 유음만 분석의 대상으로 삼
기로 한다.

(c) 2022 한국중앙영어영문학회 (Http://www.jella.or.kr)


영어 접두사 dis-와 un-의 결합분포 차이에 대한 확률음운론적 분석 199

어져 왔는데, 확률론적 최적성이론(Stochastic Optimality Theory;


Boersma 1997, Hayes and Londe 2006), 노이즈첨가 조화문법(Noisy
Harmonic Grammar; Goldrick and Daland 2009, Oh and Hong 2013,
Pater 2009, 2016), 최대 엔트로피 문법(Maximum Entropy Grammar,
Hayes and Wilson 2008) 등이 대표적이다. 본 연구에서는 최근 가장 널리
사용되고 있는 최대 엔트로피 문법에 의해 dis-와 un-의 음운적 결합분포
를 형식화하여 분석하고자 한다.
최대 엔트로피 문법은 정보이론(Information Theory)의 엔트로피
(entropy) 개념을 최적성 이론에서 파생된 조화문법(Smolensky and
Legendre 2006; Pater 2009, 2016)에 적용한 문법모델이라 할 수 있다. 엔
트로피는 일종의 불확실성에 대한 지표로서 어떤 요소의 예측가능성이 낮
을수록, 즉 불확실성이 높을수록 정보의 양은 많아지고, 반대로 예측가능성
이 높을수록, 즉 불확실성이 낮을수록 정보의 양은 적어질 것이다. 이때 전
자의 경우 엔트로피는 높아지고 후자의 경우 엔트로피는 낮아진다고 할 수
있다. 예를 들어 어떤 후보들의 분포가 서로 균등하다면 후보들에 대한 예
측은 매우 불확실하고 많은 정보량을 요구하므로 높은 엔트로피 값을 보일
것이다. 반면 특정 후보가 절대적으로 높은 확률로 출현한다면 낮은 불확
실성과 적은 정보량을 요구함에 따라 엔트로피도 낮아질 것이다. 따라서
최대 엔트로피 문법은 최대의 엔트로피, 즉 최대의 정보를 필요로 하는 가
장 불확실한 상태를 전제로 하여 비범주적 언어 현상들의 확률을 구하는
문법모델이라 볼 수 있다.
최대 엔트로피 문법은 일련의 제약들에 의해 후보형들이 평가되어 출력
형이 결정되는 최적성이론의 기본 원리를 따르고 있지만, 후보들이 제약순
위(constraint ranking)에 의해 평가되는 것이 아니라 조화문법과 마찬가지
로 제약들의 가중치(weight)에 의해 평가된다. 하지만 차이점은 하나의 후
보만 최종 출력형으로 선택되는 것이 아니라 각 후보들마다 확률
(probability)값이 부여됨으로써 비범주적 현상을 설명하기 적합하다.
간단한 예를 들어 최대 엔트로피 문법의 기본 구조를 살펴보기로 한다.
먼저 가상의 입력형 /AA/에 대한 네 후보들은 [AA], [AB], [BA], [BB]로
가정하고, 관련된 *#A, *#B, *A#, *B#와 같은 제약들의 각 가중치는 5, 3, 1,
2라고 가정해 보겠다. 조화문법의 산출방식과 마찬가지로 조화값(H)는 각
후보들이 위반하고 있는 제약들의 가중치와 위반값을 곱한 후 모두 더한
값으로 얻어진다.6) 아래 표의 예를 들면, 후보 (6a)는 가중치 5의 *#A와
200 박 창 범

가중치 1의 *A#를 한번 씩 위반(-1)하고 있으므로, 조화값(H)은


“(5×-1)+(1×-1) = -6”인 것이다. 마찬가지로 다른 후보들의 조화값도 아래
표와 같이 산출된다.

(6) 최대 엔트로피 문법 비교표(Input: /AA/)


*#A *#B *A# *B# H-
/AA/ eH P
5 3 1 2 Score
a. AA -1 0 -1 0 -6 0.002 0.071
b. AB -1 0 0 -1 -7 0.001 0.036
c. BA 0 -1 -1 0 -4 0.018 0.643
d. BB 0 -1 0 -1 -5 0.007 0.250

결과적으로 조화값이 가장 높은 후보, 즉 가장 조화로운 형태인 (6c)가 최


적 출력형으로 선택된다는 것을 알 수 있다. 하지만 이러한 조화값만으로
는 후보들 간의 출현 빈도나 분포를 예측할 수가 없다.
지금까지 살펴본 바로는 전형적인 최적성 이론의 조화문법과 동일하지
만 위 비교표 (6)에서 보이듯이 확률값을 나타내기 위해 추가된 오른쪽 두
개의 열(column)이 기존의 문법들과 차별화 되는 점이다. 최대 엔트로피
문법에서는 각 후보들의 확률값을 구하기 위해 다항로지스틱 회귀
(multinominal logistic regression)식을 이용한다. Hayes(2017)에서는 이
공식을 최적성 이론의 관점에서 아래와 같이 소개하고 있다.

(7) 확률값(probability) 산출 공식 (Hayes, 2017: 4)


a. eHarmony: e−Harmony(x) (후보 x의 음수 조화값(H)을 지수로 한 e값)
b.      (모든 후보들의 eH 값을 더한 합)

c.   

위 공식에 의해 후보 (6a)의 eH값과 확률값(P)은 아래와 같은 과정으로 계


산된다.7)

6) 조화값(H) 산출공식은 아래와 같다(Pater 2006: 1005)

   각 제약의 가중치
  

      각 후보의 위반점수 
7) 본고에서는 설명의 편의를 위해 소수점 세 자리까지만 표기했기 때문에 실제 계

(c) 2022 한국중앙영어영문학회 (Http://www.jella.or.kr)


영어 접두사 dis-와 un-의 결합분포 차이에 대한 확률음운론적 분석 201

 
(8) a.      
   


b. Z = 0.002+0.001+0.018+0.007 = 0.028
 
c.       
 

이와 같은 과정으로 모든 후보들의 확률값을 구할 수 있고 표 (5)의 마지


막 열(P)에 잘 나타나있다. 결국 후보 (6c)가 0.643(64.3%)의 확률로 가장
높고 (6b)가 0.036의 확률로 가장 낮게 출현할 것이 예측된다. 이렇게 최대
엔트로피 문법은 기존 조화문법의 조화값을 이용하여 각 후보들의 출현 확
률까지 산출함으로써 다양한 비범주적 언어현상을 형식화 할 수 있다.

3.2. dis-와 un-의 결합양상 형식화

앞 절에서 소개한 최대 엔트로피 분석방식을 통해 영어 접미사 dis-와


un-의 음운적 결합양상을 확률적으로 예측해 보기로 한다. 먼저, 분석에
필요한 제약들을 다음과 같이 가정한다.

(9) Constraints
a. Agree(voice): 유무성이 일치하지 않은 인접한 소리들은 금지된다.
b. OCP(nasal): 인접한 비음들은 금지된다.
c. OCP(stop): 인접한 폐쇄음들은 금지된다.
d. OCP(obstruent): 인접한 저해음들은 금지된다.
e. OCP(voice): 인접한 동일 유무성음들은 금지된다.
f. *s[son]: [s]와 공명음의 연쇄는 금지된다.
g. *sn: [s]와 [n]의 연쇄는 금지된다.

먼저, Agree(voice)는 유무성 동화를 설명하기 위해 Lombardi(1999)에서


제안된 제약으로 유무성 뿐만 아니라 다양한 종류의 동화현상에 적용되고
있다. (8b-e) 제약들은 인접한 동일한 자질들을 금지하는 McCarthy(1986)
의 의무굴곡원리(OCP, Obligatory Contour Principle)를 채용하여, 각각 비
음, 폐쇄음, 저해음, 유무성의 연속을 금지하도록 제안한다. *s[son]은 일종

산 값과는 약간 다를 수 있음을 감안하기 바란다. 즉, 상수 e는 자연 로그값의


밑인 2.71828182845904...이므로 그대로 계산하면 (6)의 후보들의 확률값(P)은 각
각 0.087, 0.032, 0.644, 0.237이 된다.
202 박 창 범

의 음절접촉법칙(Syllable contact law; Vennemann 1988)으로 [s]와 공명


음의 접촉을 금지하는데 초점을 맞춰 세분화 하였다. *sn 제약은 영어의
음소배열제약(Phonotactics)과 관련하여 [sn]과 [s{r,l}] 연쇄의 차이를 구분
하기 위해 제안되었다.
이러한 제약들의 가중치는 MaxEnt Grammar Tool(Hayes, Wilson and
George 2009)에 앞 장에서 조사한 어기 첫 폐쇄음 및 유음 별 두 접두사
의 결합 단어개수와 제약별 위반 값을 적용한 결과 아래와 같이 최적의 가
중치 값들을 얻었다.

(10) 최적화된 가중치(weights)8)


AGR(voc): 0.519261
OCP(nas): 2.176769
OCP(stop): 0.001
OCP(obs): 0.015601
OCP(voc): 0.001
*s[son]: 1.503288
*sn: 2.014891

위 가중치를 이용하여, 어기의 첫 자음에 따라 결합하는 각 접두사의 확률


을 최대 엔트로피 문법으로 형식화할 수 있다.

(11) Input: {dis/un} + C9)

8) 실제로 OCP(nasal)과 OCP(voice)는 거의 0에 수렴하는 매우 작은 수치로 나타


나 계산과 설명의 편의를 위해 0.001로 보정하였다.
9) 여기서의 계산방식은 3.1에서 설명한 가상의 예보다는 조금 더 복잡하다. 그 이
유는 가중치와 조화값(H)이 모두 소수점 이하의 수가 포함되어 가령 e-0.52 와
같은 값을 구해야하기 때문이다. 즉, 이 값은 아래와 같은 계산을 통해 0.594로
산출된다.
   
       
  
   
   
  ×      
   

(c) 2022 한국중앙영어영문학회 (Http://www.jella.or.kr)


영어 접두사 dis-와 un-의 결합분포 차이에 대한 확률음운론적 분석 203

。 。 。 。 。
。 。 H-
pref. #__ eH P
Score

a. dis 0 0 0 -1 -1 0 0 -0.016 0.984 0.624


{p,t,k}
b. un -1 0 -1 0 0 0 0 -0.520 0.594 0.376
c. dis -1 0 0 -1 0 0 0 -0.535 0.586 0.370
{b,d,g}
d. un 0 0 -1 0 -1 0 0 -0.001 0.999 0.630
e. dis -1 0 0 0 0 -1 0 -2.023 0.132 0.539
m
f. un 0 -1 -1 0 -1 0 0 -2.178 0.113 0.461
g. dis -1 0 0 0 0 -1 -1 -4.037 0.018 0.135
n
h. un 0 -1 -1 0 -1 0 0 -2.178 0.113 0.865
i. dis -1 0 -1 0 0 -1 0 -2.024 0.132 0.117
{r,l}
j. un 0 0 0 0 -1 0 0 -0.001 0.999 0.883

위 비교표에서 보이듯이, 최대 엔트로피 문법에 의해 생성된 각 후보들의


P값(확률)은 어기의 첫 자음에 따라 dis-와 un-이 서로 다르게 나타나고
있음을 알 수 있다. 예를 들어, 어기의 첫 자음이 무성파열음인 {p,t,k}일
경우 접두사 dis-와 un-이 결합될 확률은 각각 0.624와 0.376이다. 즉 dis
가 un 보다 두 배 가량 높은 확률로 무성파열음과 결합할 것으로 나타났
다. 반대로 유성파열음 {b,d,g}인 경우는 un-이 dis- 보다 두 배 정도 결합
할 확률이 높을 것으로 나타났다. 비음 [m]이 어기 첫 자음인 경우 두 접
두사가 비슷한 확률로 결합하는 것으로 예측되었지만, [n]은 un-이 압도적
으로 높은 확률로 결합할 가능성이 있는 것으로 나타났다. 유음인 경우도
un-이 매우 높은 확률로 결합하는 것으로 예측되었다.
결국 각 제약들과 그 가중치들이 내포하고 있는 다양한 음운현상들의
상호작용에 따라 이러한 결과가 나타났다고 볼 수 있다. 즉, 어기의 첫 자
음이 구강 폐쇄음의 경우 유무성동화가 중요하게 작용하여, 무성음 앞에는
dis-, 유성음 앞에는 un-이 높은 확률로 선택된 것이고, 비강 폐쇄음은 동
일한 조음위치의 비음이 연속되는 것이 선호되어 [n] 앞에 un-이 결합할
확률이 높지만 [m] 앞에는 오히려 dis-가 좀 더 확률이 높은 것으로 나타
났다고 분석할 수 있다. 유음의 경우는 유무성동화, 음절접촉법칙 등이 작
용하여 dis- 보다는 un-이 높은 확률로 선택되는 것으로 볼 수 있다.
204 박 창 범

IV. 실험

4.1. 설문조사

최대 엔트로피 문법에 의해 예측된 영어 접두사 dis-와 un-의 불균형적


결합분포 양상이 실제 영어화자의 언어문법에서도 그러한 경향을 보이는
지 확인하기 위해 생산성 실험을 진행해 보았다. 실험방법은 온라인 설문
조사 방식을 이용하였고, 24명의 영어 원어민(영국인 20명, 미국인 4명, 연
령: 21-40세)을 대상으로 실시하였다. 아래 20개의 가상의 단어들을 무작
위로 제시하여 각 단어에 어울리는 접두사를 dis-와 un- 중에서 선택하는
방식으로 진행하였다. 가상의 단어들은 실제 dis-나 un-이 결합하는 특정
단어가 연상되는 것을 피하기 위해 최대한 중립적인 단어들로 고안했다.
Katamba(1993)에 따르면, dis-는 동사, 명사, 형용사에 결합하고, un-은
동사와 형용사에 결합하여 반대의 의미를 생성하므로, 가급적 명사로 인식
될 여지가 있는 단어는 피하려 했다. 즉, type1 단어들은 영어에 존재하지
않는 어미인 –fave 를 사용했고, type2 단어들은 형용사나 동사화 접미사
인 –al 을 사용하여 품사에 따른 선택의 편향성을 방지하고자 했다.

(12) 실험용 가상의 단어


#__ [p] [t] [k] [b] [d]
type1 proufave troufave croufave broufave droufave
type2 poostal toostal coostal boostal doostal
#__ [g] [m] [n] [l] [r]
type1 groufave moufave noufave loufave roufave
type2 goostal moostal noostal loostal roostal

4.2. 실험결과

실험결과는 아래 표와 같다.

(c) 2022 한국중앙영어영문학회 (Http://www.jella.or.kr)


영어 접두사 dis-와 un-의 결합분포 차이에 대한 확률음운론적 분석 205

(13) 실험결과: 각 단어의 첫 자음별 접두사 선호도


#__ [p] [t] [k] [b] [d] [g] [m] [n] [l] [r]
type
proufave troufave croufave broufave droufavegroufave moufave noufave loufave roufave
1
dis- 11 13 15 14 5 8 11 0 11 7
un- 13 11 9 10 19 16 13 24 13 17
type
poostal toostal coostal boostal doostal goostal moostal noostal loostal roostal
2
dis- 17 17 9 10 8 11 15 12 13 16
un- 7 7 15 14 16 13 9 12 11 8

위 표에서 보이듯이 첫 번째 종류의 단어들에 대해서는, 첫 자음이 {t, k,


b}일 경우에 접두사 dis-를 결합하는 것이 선호되었다. 그 외의 자음들은
모두 un-을 선호하였다. 특히, [d], [n], [r] 등에 대해서는 압도적인 선호도
를 보이고 있다. 두 번째 종류의 단어들에 대해서는, 첫 자음이 {p, t, m, l,
r}일 경우에 dis-를 선택하는 입장이 많았다. 가상의 단어 종류별로 차이
를 보인다는 점은 접미사와도 관련이 있어 보인다. 즉, -fave로 끝나는 단
어들과 –al로 끝나는 단어들이 [k]와 [b]로 시작하는 단어에 대해 반대의
결과를 보이고 있다는 것을 발견할 수 있다. 이렇게 개별 자음들과 단어
종류별로 약간의 차이를 보이고 있으므로 일반화의 편의를 위해 각 자음들
을 앞 장의 분석에서처럼 {p,t,k}, {b,d,g}, [m], [n], {r,l}로 묶어서 각 선호
도를 구해보면 다음과 같다.

(14) 실험결과: 자음 종류별 접두사 선호도


#__
{p,t,k} {b,d,g} m n {r,l}
prefix
dis- 82 56 26 12 47
un- 62 88 22 36 49

위 결과를 앞 장의 최대 엔트로피 문법의 확률과 비교해보면 아래 표와


같다.
206 박 창 범

(15) 최대 엔트로피 문법 확률과 실험결과 비교표


MaxEnt Survey
prefix #__
Prob. Result
dis- 0.624 0.569
{p,t,k}
un- 0.376 0.431
dis- 0.370 0.389
{b,d,g}
un- 0.630 0.611
dis- 0.539 0.542
m
un- 0.461 0.458
dis- 0.135 0.250
n
un- 0.865 0.750
dis- 0.117 0.490
{r,l}
un- 0.883 0.510

표에서 확인할 수 있듯이 최대 엔트로피 문법의 예상과 실험결과가 상당한


유사점이 있는 것으로 나타났다. 단, 유음 {r,l}의 경우 문법은 un-이 결합
할 확률을 88% 이상으로 예측하고 있는 반면, 실험결과는 51%에 불과하
였다. 이러한 차이가 발생한 것은 가상의 단어 종류별로 큰 차이로 상반된
선호도를 보인 점에서 미루어 보았을 때, 유음의 경우 별도의 추가적인 연
구가 필요한 것으로 보인다.

V. 결론

지금까지 영어 접두사 dis-와 un-의 어기 첫 자음별 결합분포에 대해


살펴본 결과, 결합하는 자음 전체를 보았을 때 두 접두사의 분포는 통계적
으로 서로 유사한 것으로 나타났으나, 폐쇄음(비음 포함)과 유음으로 한정
하였을 때 서로 다른 분포를 보이는 것으로 드러났다. 이러한 분포차이를
음운론적으로 예측하기 위한 모형을 최대 엔트로피 문법으로 형식화 하였
고, 실제로 모형이 정확한 예측을 하는지 알아보기 위해 설문조사를 이용
한 실험을 실시하였다. 결과적으로 영어의 dis-와 un-은 결합하는 어기의
첫 자음에 따라 다른 분포를 보인다는 것을 영어화자의 직관에서도 알 수
있었다. 특히, 폐쇄음의 경우 최대 엔트로피 문법으로 예측한 확률값과 매
우 유사한 비율로 나타남을 확인할 수 있었다. 즉, dis-는 무성폐쇄음으로
시작하는 어기에 결합하는 확률이 높고, 그에 반해 un-은 유성폐쇄음, 비
음 [n], 유음들과 결합하는 확률이 높은 것으로 나타났다.

(c) 2022 한국중앙영어영문학회 (Http://www.jella.or.kr)


영어 접두사 dis-와 un-의 결합분포 차이에 대한 확률음운론적 분석 207

하지만 본 연구는 몇 가지 한계를 내포하고 있다. 첫째, 어기의 첫 자음


만 고려했기 때문에 자음군이나 모음이 영향을 미칠 가능성은 예측할 수
없다. 또한 강세와의 연관성도 배제할 수 없다. 둘째, 영어단어에 존재하는
dis-와 un-의 관찰 표본수가 많지 않아 양적연구를 시행함에 있어 통계적
오류의 가능성을 간과할 수 없다.10) 또한, 유음으로 시작하는 어기의 경우
문법이 예측하는 확률과 실제 실험결과 값이 큰 차이를 보여 이에 대한 추
가 연구가 필요할 것으로 보인다.
그럼에도 불구하고, 본 연구의 방법론과 분석방식을 통해 그동안 범주적
접근방법에 의해서는 설명이 불가능했거나 관심대상이 아니었던 현상들을
계량적 연구를 통해 발견하고 형식화할 수 있는 계기를 마련할 수 있다는
데 그 의의가 있겠다.

Works Cited

Anthony, Laurence. 2020. AntConc (Version 3.5.9) [Computer


Software]. Tokyo, Japan: Waseda University. Available from
http://www.laurenceanthony.net/software.
Baayen, Harold. 1989. A Corpus-based approach to morphological
productivity. Amsterdam: Vrije University dissertation.
Boersma, Paul. 1997. How we learn variation, optionality, and
probability. Proceedings of the institute of phonetic sciences
of the University of Amsterdam 21, 43-58.
Chung, Chin-Wan. 2021. A study on the different realizations of dis-
in English. The Jungang Journal of English Language and
Literature 63(4), 353-375.
Goldrick, Matthew, and Robert Daland. 2009. Linking speech errors and
phonological grammars: Insights from harmonic grammar

10) COCA(The Corpus of Contemporary American English)와 같은 방대한 코퍼


스를 이용한 자료분석이 추가적으로 보완된다면 이러한 양적 문제를 극복할 수
있을 것으로 기대된다. 이는 추후 연구과제로 남기기로 한다.
208 박 창 범

networks. Phonology 26, 147–85.


Hay, Jennifer. 2001. Lexical frequency in morphology: Is everything
relative? Linguistics 39, 1041-1070.
Hayes, Bruce. 2017. Varieties of noisy harmonic grammar. Proceedings
of the 2016 annual meeting of phonology. Online Publication.
The Linguistic Society of America. Washington, DC.
Hayes, Bruce, and Colin Wilson. 2008. A maximum entropy model of
phonotactics and phonotactic learning. Linguistic Inquiry 39,
379-440.
Hayes, Bruce, and Zsuzsa Cziráky Londe. 2006. Stochastic phonological
knowledge: The case of Hungarian vowel harmony.
Phonology 23, 59-104.
Hayes, Bruce, Colin Wilson, and Benjamin George. 2009. Maxent
grammar tool. https://linguistics.ucla.edu/people/hayes/
MaxentGrammarTool.
Katamba, Francis. 1993. Morphology. New York, NY: St. Martin’s
press, Inc.
Lombardi, Linda. 1999. Positional faithfulness and voicing assimilation
in Optimality Theory. Natural Language and Linguistic
Theory 17(2), 267-302.
McCarthy, John J. 1986. OCP effects: Gemination and antigemination.
Linguistic Inquiry 17, 207-263.
McCarthy, John J., and Alan Prince. 1995. Faithfulness and
reduplicative identity. UMOP 18, 249-384.
Oh, Yeong-Lim, and Sung-Hoon Hong. 2013. A noisy harmonic
grammar analysis of gradient OCP effects in English
syllables. Studies in Phonetics, Phonology and Morphology
19(3), 433-455.
Park, Chang-beom. 2021. Stochastic analysis of the phonological
motivation in English suffixes -ment and -ness. The Journal
of Modern British & American Language & Literature
39(4), 129-46.
Pater, Joe. 2009. Weighted constraints in generative linguistics.

(c) 2022 한국중앙영어영문학회 (Http://www.jella.or.kr)


영어 접두사 dis-와 un-의 결합분포 차이에 대한 확률음운론적 분석 209

cognitive science 33, 999-1035.


Pater, Joe. 2016. Universal grammar with weighted constraints. In
John J. McCarthy and Joe Pater (eds.), Harmonic grammar
and harmonic serialism, 1-46. Sheffield: Equinox.
Plag, Ingo. 1999. Morphological productivity: Structural constraints in
English derivation (Topics in English linguistics 28). Berlin:
Mouton de Gruyter.
Plag, Ingo. 2006. Productivity. In Bas Aarts and April McMahon (eds.),
Handbook of English linguistics, 537-556. Oxford: Blackwell.
Prince, Alan. and Paul Smolensky. 2004. Optimality Theory: Constraint
interaction in generative grammar. Oxford: Blackwell.
R Development Core Team. 1993-2011. R: A language and
environment for statistical computing. Vienna, Austria. R
Foundation for Statistical Computing. Software, available at
http://www.R-project.org.
Siegel, Dorothy C. 1974. Topics in English morphology. Cambridge,
MA: MIT dissertation.
Smolensky, Paul. and Legendre, Geraldine. 2006. The harmonic mind:
From neural computation to Optimality-Theoretic grammar.
Cambridge, MA: MIT Press.
Venneman, Theo. 1988. Preference laws for syllable structure and the
explanation of sound change. Berlin: Mouton de Gruyter.
210 박 창 범

Abstract

A Stochastic Phonological Analysis of the Distributional


Differences between English Prefixes dis- and un-

Park, Chang-beom
(Seowon University)

The purpose of this study is to investigate whether two English


prefixes dis- and un- exhibit different phonological distributions, and
to formalize the tendency and motivation by stochastic phonological
theory. For this purpose, this study collects the data from Carnegie
Mellon University Pronouncing Dictionary and analyses them by
conducting a series of simple linear regression tests. As a result, our
finding is that the distribution of dis- and un- is different with each
other depending on the initial stops(both oral and nasal) and liquids of
the bases they attach. By formalizing the distribution within the
framework of Maximum Entropy Grammar(Maxent; Hayes and Wilson
2008), we can identify that the interaction of the phonological
motivations like voice assimilation, obligatory contour principle, syllable
contact law and other English phonotactics affects the distribution.
Thus, dis- is more likely to attach to base-initial voiceless stops,
while un- tends toward voiced stops, nasal [n], and liquids.
Furthermore, we conduct a survey experiment of English native
speakers to confirm the prediction of the Maxent grammar. The result
is that the tendency predicted by the grammar largely reflects the
intuition of English native speakers.

Key Words: allomorph selection, English negative prefixes, harmonic


grammar, maximum entropy grammar, Optimality theory/
이형태 선택, 영어 부정 접두사, 조화문법, 최대 엔트로피 문
법. 최적성 이론

(c) 2022 한국중앙영어영문학회 (Http://www.jella.or.kr)


영어 접두사 dis-와 un-의 결합분포 차이에 대한 확률음운론적 분석 211

Notes on Author:
Chang-beom Park is a professor of English education department at Seowon
University. He teaches linguistics. His research interests are in phonology, phonetics
and morphology.

[원고접수; 2022.11.13, 심사완료; 12.1, 게재확정; 12.14, E-mail; cbpark@seowon.ac.kr]

You might also like