Download as pdf or txt
Download as pdf or txt
You are on page 1of 97

생활용어 기반의 법령정보 시맨틱

검색 방법론에 관한 연구

연세대학교 공학대학원
산업정보경영 전공
정 승 택
차 례
표차례 ................................................................................................... iii

그림차례 ............................................................................................... iv

국문요약 ............................................................................................... vi

제1장 서론 ··················································································· 1
1.1 연구배경 및 목적 ············································································· 1

1.2 연구범위 및 방법 ············································································· 3

1.3 논문의 구성 ······················································································· 4

제 2 장 법령정보 서비스 현황 및 한계 ··································· 5


2.1 법령정보의 서비스 현황 ······························································· 5

2.2 법령정보의 특징 ··········································································· 10

2.3 법령정보시스템 및 서비스의 한계 ··········································· 15

2.4 법령정보 서비스에 시맨틱 기술 도입의 필요성 ··················· 20

제 3 장 시맨틱 서비스 개요 ···················································· 22


3.1 시맨틱 서비스의 의미 ································································· 22

3.2 온톨로지와 시맨틱 서비스의 개요 ··········································· 24

- i -
3.3 온톨로지 구축 기술 ····································································· 29

3.4 법령정보의 시맨틱 기술 적용 가능성 ····································· 35

3.5 법령정보 시맨틱 서비스 구현 가능 분야 ······························· 42

3.6 국내 시맨틱 기술 적용 사례 ····················································· 54

제 4 장 법령정보 시맨틱 검색 방법론 ································· 58


4.1 법령정보 검색 서비스 개선 방안 ············································· 58

4.2 법령정보 시맨틱 검색 서비스 모델 ········································· 60

4.3 검색 서비스 개선을 위한 기술 적용 방안 ····························· 62

4.4 법령분야 시맨틱 서비스 구현 사례 ········································· 68

제 5 장 시스템 구현 및 평가 ·················································· 75
5.1 법령정보 시맨틱 검색 시스템 구현 ········································· 75

5.2 평가 ································································································· 82

제 6 장 결론 ················································································· 84
6.1. 연구결과 요약 ·············································································· 84

6.2. 연구의 한계점 및 향후 연구방향 ·········································· 85

참고문헌 .............................................................................................. 86

ABSTRACT ......................................................................................... 88

- ii -
표차례

[ 3-1] OWL 의 어플리케이션 응용 가능 분야 31


[ 3-2] OWL 2 분류표 32


[ 3-3] 법령내용을 구성하고 있는 주요내용 40


[ 3-4] 연구정보 온톨로지 주요 클래스 56


[ 5-1] 법령정보 시맨틱 검색대상 목록 75

- iii -
그림차례
그림
[ 2-1] 국가법령정보센터 홈페이지 화면 6

그림
[ 2-2] 생활법령정보 서비스 화면 7

그림
[ 2-3] 소방안전관리 서비스 사례 8

그림
[ 2-4] 법령정보 키워드 검색시스템 구성도 15

그림
[ 3-1] 시맨틱 기술의 계층 구조 23

그림
[ 3-2] 온톨로지 구축 방법론
Ontology 101 34

그림
[ 3-3] 법령정보의 계층적 구조 35

그림
[ 3-4] 법령내용의 계층적 구조 37

그림
[ 3-5] 판례내용의 계층적 구조 37

그림
[ 3-6] 법령정보 질의 응답 서비스의 예
․ 44

그림
[ 3-7] 생활분야별 법령정보 통합 서비스의 예 47

그림
[ 3-8] 법령에 기술된 산식 계산의 예 50

그림
[ 3-9] 법령계산 개발 환경 구성도 51

그림
[ 3-10] 법령문장 번역 데이터베이스 구성도 53

그림
[ 3-11] IT 온톨로지 인프라 개념도 55

그림
[ 3-12] 조달청 지능형상품정보시스템 화면 57

- iv -
그림
[ 4-1] 법령정보 시맨틱 검색 서비스 화면 예시 59

그림
[ 4-2] 법령정보 시맨틱 검색 서비스 모델 61

그림
[ 4-3] 법령정보 시맨틱 검색 시스템 구성도 62

그림
[ 4-4] 생활 법령용어 추출 프로세스
/ 64

그림
[ 4-5] 법령 생활용어간의 관계 구축 예시
/ 66

그림
[ 4-6] 온톨로지를 활용한 법령정보 검색 프로세스 67

그림
[ 4-7] 법무부 시스템 검색결과 화면
iLAW 69

그림
[ 4-8] 시스템 다차원정보 서비스 화면
iLAW 70

그림
[ 4-9] 이탈리아 홈페이지 화면
JurWordNet 71

그림
[ 4-10] 애플 특허 제소 사례 검색 화면 73

그림
[ 4-11] 특허 제소 사례 내용 조회 화면 74

그림
[ 5-1] SKOS기반 법령용어 구성 결과 77

그림
[ 5-2] 용어 의미 연관성 해석 결과 78

그림
[ 5-3] 사용자 질의 확장 및 검색 절차 79

그림
[ 5-4] 법령정보 시맨틱 검색 결과 81

- v -
국문요약
생활용어 기반의 법령정보 시맨틱
검색 방법론에 관한 연구
연세대학교 공학대학원
산업정보경영 전공
정 승 택
사회환경의 변화와 기술발달의 속도가 빨라져 법령정보의 건수 및 법령
정보의 복잡도가 점점 증가하고 있음에도 불구하고 법령정보에 대한 키워드
검색 방식은 사용자의 검색 의도와는 관계없이 질의어와 매칭되는 정보를
무조건 제공하기 때문에 질의어와 관련된 검색 결과가 너무 많거나 전혀 ,

발견할 수 없는 경우가 발생하기도 하고 사용자가 원하지 않는 정보를 제


,

공하는 등 법령정보 검색에 많은 단점을 가지고 있다 .

또한 법령용어나 문장이 어려워 법령정보를 접근하거나 검색하기도 어렵


,

고 특정 생활분야와 관련된 법령내용이 다양한 법령에 산재되어 기술되어


,

있음에 따라 실생활에서 법령을 이해하고 적용하는 것이 곤란하여 법령정


,

보는 항상 전문가의 전유물로 인식되어 왔다 .

이에 따라 이 논문에서는 법령정보 검색 및 활용에 시맨틱 기술을 도입


,

하여 서비스의 품질을 개선하기 위해 법령정보의 서비스 현황과 문제점을

- vi -
조사하고 법령정보의 특징을 분석하여 법령정보가 전체적으로 시맨틱 기술
을 적용하기에 적합한 분야인지 여부를 알아 보고 법령정보 서비스에 시맨
,

틱 기술을 활용하여 구현 가능한 사례를 발굴해 보고자 한다.

또한 법령용어 온톨로지를 이용하여 사용자가 입력한 생활용어로도 법령


,

정보를 쉽고 정확하게 찾을 수 있는 법령정보 시맨틱 검색 방법을 연구하고


자 한다 .

- vii -
제1장 서론

1.1 연구배경 및 목적
정보통신기술 이 발달하고 사회 전반에 대한 정보화 수준이 제고됨에
(ICT)

따라 정보의 양이 급격하게 증가하고 있어 인터넷에서 원하는 정보를 신 ,

속 정확하게 검색하는 것이 무엇보다도 중요하게 되었다


․ .

이에 따라 공공기관 및 민간기업 등에서는 키워드 중심의 다양한 검색엔


진을 개발하거나 도입하고 있으며 정보 분류의 확대 메타데이터의 활용
, , ,

태그정보의 제공 개인 맞춤형 서비스 등 고객의 만족도를 제고하기 위한


,

다양한 방법을 시도되고 있다 .

그럼에도 불구하고 사회환경의 변화와 기술발달의 속도가 더욱 빨라져


인터넷에 유통되는 정보의 양이 급격하게 증가하고 있고 키워드 검색은 사 ,

용자의 검색 의도와는 관계없이 질의어와 매칭되는 정보를 무조건 제공하기


때문에 질의어와 관련된 검색 결과가 너무 많거나 전혀 발견할 수 없는 경 ,

우가 발생하기도 하고 사용자가 원하지 않는 정보를 제공하는 등 인터넷


,

정보에 대한 검색의 효율성 측면에서 많은 단점을 가지고 있다 .

최근 이러한 문제점을 해결하기 위해 공공기관과 민간 포털 사이트를 중


심으로 컴퓨터가 사용자의 의도를 정확하게 파악하여 검색 결과를 서비스하
는 기술을 적용하고 있다 또한 사용자의 검색 패턴을 분석하고 통계적 기
. ,

법 등을 활용하여 정보에 우선 순위를 부여하는 제공하는 서비스가 늘어나


고 있으며 사용자 질의어와 관련된 연관어를 제공하는 사례가 증가하는 등
,

시맨틱 기술을 활용한 검색 서비스가 증가하고 있다 .

- 1 -
법령정보의 경우에도 국민생활과 공공기관의 행정업무 등에 밀접한 영향
을 미치고 있음에도 불구하고 법령용어나 문장이 어려워 법령정보를 검색
,

하기가 어렵고 특정 생활분야와 관련된 법령내용이 다양한 법령에 산재되


,

어 기술되어 있어 실생활에서 법령을 이해하고 적용하는 것이 곤란함에 따


라 법령정보는 항상 전문가의 전유물로 인식되어 왔다 .

이에 따라 이 논문에서는 법령정보 검색 및 활용에 시맨틱 기술을 도입


,

하여 서비스의 품질을 개선하기 위해 법령정보의 서비스 현황과 문제점을


,

조사하고 법령정보의 특징을 분석하여 법령정보가 전체적으로 시맨틱 기술


을 적용하기에 적합한 분야인지 여부를 알아 보고자 하며 법령정보 서비스 ,

에 시맨틱 기술을 활용하여 구현 가능한 사례를 발굴해 보고자 한다 .

또한 법령정보는 일상생활에서 사용하는 생활용어와 법령이나 판례 등에


,

기술된 법령용어가 서로 달라 법령에 대한 사전 지식이 없으면 법령정보를


,

정확하게 검색하는 것이 쉽지 않았다 .

이에 따라 법령정보 검색의 문제점을 해결하기 위해 법령용어와 생활용


, ,

어를 각각 추출하여 법령용어 중심으로 생활용어를 연결하고 이를 법령용 ,

어 온톨로지로 구축하여 법령정보 검색에 활용함으로써 사용자가 입력한 ,

생활용어로도 법령정보를 쉽고 정확하게 찾을 수 있는 법령정보 시맨틱 검


색 방법을 연구하는 것을 목적으로 한다 .

이를 통해 일반국민이 법령정보를 쉽고 정확하게 검색할 수 있는 서비스


가 개발되기를 바라며 향후 법령정보의 서비스 분야에 시맨틱 기술이 도입
,

되여 법령을 잘 모르더라도 전문가의 도움없이 법령정보를 이해하고 적용할


수 있는 서비스가 다양하게 개발되었으면 한다 .

- 2 -
1.2 연구범위 및 방법
이 논문에서는 법령용어 온톨로지가 구축되었다는 전제 하에 생활용어를
법령용어로 전환하는 연구 시맨틱 기술을 이용하여 법령정보를 검색하는
,

연구 등 법령용어 온톨로지를 기반으로 생활용어로 법령정보를 검색할 수


있는 법령정보 시맨틱 검색 시스템 개발 방법을 제안하고 그 주요 기능을
구현해 보는 것을 연구의 범위로 한다 .

법령용어와 생활용어의 추출에 관한 연구 법령용어와 생활용어의 연결에 ,

관한 연구 인터넷에서 웹 문서의 수집에 관한 연구 등 법령용어 온톨로지


,

구축에 필요한 실제 구현 기술은 연구 범위에 포함되지 않는다 .

또한 문장에 대한 구문 분석 및 자연어 처리 등에 관한 연구 온톨로지


, ,

구축 및 관리에 관한 연구 온톨로지 데이터베이스 설계에 관한 연구 등은


,

이 연구의 목적과 분야가 달라 연구 범위에서 제외한다 .

이 논문에서는 법령정보 서비스에 대한 현황 및 문제점 등에 대한 조사


및 분석은 우리 나라의 모든 법령정보를 통합 서비스하고 있는 국가법령정
보센터 을 대상으로 설명한다
(http://www.law.go.kr) .

또한 법령용어 온톨로지 구축 방법 법령정보 시맨틱 검색 시스템 개발


, ,

방법 등을 제시하며 법령용어 온톨로지를 참고로 하여 법령정보를 검색하


,

는데 필요한 주요 기능을 실제 구현하고 사용자가 입력한 생활용어로 찾고 ,

자 하는 법령정보를 정확하게 검색할 수 있는지 여부를 실험한다 .

- 3 -
1.3 논문의 구성
이 논문은 전체 개의 장으로 구성되어 있다
6 .

제 장에서는 법령정보의 서비스 및 이용 현황을 조사하고 법령정보의 서


2

비스의 한계점 및 문제점을 파악하여 법령정보 서비스에서 시맨틱 기술 도


입의 필요성을 분석한다 .

제 장에서는 시맨틱 서비스가 무엇인지를 설명하고 시맨틱 서비스 구현에


3

필요한 주요 기술을 설명한다 또한 법령정보의 특징을 분석하여 시맨틱 기


.

술의 적용 가능성 여부를 파악해 보고 국내 공공기관 정보시스템에 시맨틱


,

기술을 적용한 사례를 살펴 본다 .

제 장에서는 법령정보 서비스 개선 방안 법령정보 시맨틱 기술 적용 방


4 ,

안 등 법령정보 시맨틱 검색 방법론을 설명하고 외국의 법령정보 시맨틱 서


비스 구현 사례를 살펴 본다 .

제 장에서는 법령용어 온톨로지를 기반으로 사용자가 입력한 질의어로


5

법령정보를 검색하는 주요 기능을 구현해 보고 실제 데이터를 입력하여 검 ,

색결과가 정확한지 여부를 확인한다 .

제 장에서는 연구결과를 정리하여 결론을 제시하고 향후 연구계획에 대


6

해서 살펴 본다 .

- 4 -
제 2 장 법령정보 서비스 현황 및 한계

2.1 법령정보의 서비스 현황


2.1.1 개요
법령정보 서비스의 종류는 목적에 따라 크게 접근 및 검색의 편의성을 제
고하기 위한 서비스와 법령정보에 대한 이해 및 적용의 용이성을 향상시키
기 위한 서비스로 나누어 볼 수 있다 .

법령정보의 접근 및 검색의 편의성을 제고하기 위한 방식으로는 법령을


편찬하여 책자로 형태로 발간 및 배포하는 대한민국 현행법령집과 법령정보
를 디지털 데이터로 제작하여 인터넷에서 제공하는 국가법령정보센터
가 있으며 법령정보에 대한 이해 및 적용의 용이성
(http://www.law.go.kr) ,

을 향상시키기 위한 방법으로는 년부터 인터넷으로 서비스하고 있는 수


2008

요자 중심의 생활법령정보 서비스 와 국가법령정보


(http://oneclick.law.go.kr)

센터의 부가정보 서비스 등이 있다 .

2.1.2 법령정보 접근 및 검색의 편의성 제고를 위한 서비스


정부가 수립된 년 이후에 제 개정된 모든 법령의 연혁을 공포 당시의
1948 ·

현행법령으로 제작하여 데이터베이스로 구축하고 년부터 인터넷으로 서 2000

비스하고 있어 일반국민이 쉽게 공포당시의 현행법령을 확인할 수 있도록


서비스하고 있다 .

- 5 -
또한 년부터는 종전의 현행법령과 법령연혁 중심의 법령정보 서비스
, 2009

를 행정규칙 자치법규 판례 헌재결정례 법령해석례 행정심판례 조약 등


, , , , , ,

으로 확대 발전시켜 우리나라의 모든 법령정보를 통합 구축하고 언제 어디


서나 한번에 검색할 수 있는 국가법령정보센터를 개설하여 운영하고 있다 .

[ 그림 2-1] 국가법령정보센터 홈페이지 화면

- 6 -
2.1.3 법령정보에 대한 이해 및 적용의 용이성 제고를 위한 서비스
법치주의가 정착되면서 국민들이 일상생활에서 법률 문제에 부딪히는 일
들이 점차 늘어나고 그에 따라 법을 쉽게 찾아내고 이해할 수 있도록 기본
적인 법령정보 제공 인프라가 마련되어야 한다는 바램도 커지고 있다 .

이러한 요청에 부응하여 정부의 법제업무를 총괄하고 있는 법제처에서


수요자 중심의 생활법령정보를 제공함으로써 법령정보 서비스를 획기적으
로 개선하려는 시도가 진행되고 있다 .

[ 그림 2-2 ] 생활법령정보 홈페이지 화면

- 7 -
수요자 중심의 생활법령정보 서비스는 법령 수요자인 국민의 입장에서
일상생활에 필요한 법령을 쉽게 찾아보고 이해할 수 있도록 정부 각 기관
의 업무 중심으로 복잡하게 얽힌 법령간의 관계를 국민의 생활 중심으로
통합적 체계적으로 재분류하고 전문가의 시각에서 쓰인 어려운 법령의
ㆍ ,

내용을 국민의 눈높이에 맞추어 알기 쉽게 해설하여 제공하는 새로운 법령


정보 서비스를 말한다 .

그림
[ 소방안전관리 서비스 사례
2-3]

예를 들어 소방안전관리와 직접 관련된 법률로는 소방기본법 소방


, 「 」, 「

시설공사업법 위험물안전관리법 소방시설설치유지 및 안전관리에


」, 「 」, 「

관한 법률 다중이용업소의 안전관리에 관한 특별법 등이 있고 그 밖


」, 「 」 ,

- 8 -
에 전기 분야의 전기사업법 전기공사업법 등 가스 분야의 고압
「 」, 「 」 , 「

가스 안전관리법 액화석유가스의 안전관리 및 사업법 도시가스사


」, 「 」, 「

업법 등 건축 분야의 건축법 건축물의 피난 방화구조 등의 기준에


」 , 「 」(「 ·

관한 규칙 건축물의 설비기준 등에 관한 규칙 포함 주택법 등


」, 「 」 ), 「 」

에서 화재나 재해를 예방하기 위한 각종 시설기준 준수 및 안전관리 의무를


규정하고 있다 .

이와 같이 생활법령정보 서비스는 소방안전관리에 대해서 기술하고 있는


법령내용을 종합적으로 수집하여 정리하고 국민의 눈높이에 맞춰 주제별로
체계적으로 분류하여 제공하는 것이 특징이다 생활법령정보 서비스에서 제 .

공하는 법령정보만으로도 축사 다중이용업소 유흥주점 작은 숙박시설 등 , , ,

법령을 자주 접하지 않는 수요자들이 전문가의 도움이 없이도 소방안전관리


에 필요한 법령내용이나 법령지식을 종합적이고 체계적으로 얻을 수 있도록
서비스하고 있다 .

법령정보 부가정보 서비스


2.1.4
법령정보의 이해 및 적용의 용이성을 향상시키기 위한 또다른 서비스의
하나는 국가법령정보센터의 부가정보 서비스이다 부가정보 서비스는 법령 .

을 보다 쉽게 이해하고 활용할 수 있도록 지원하는 것이 목적이며 여기에 ,

는 단 비교 신구조문대비표 법령내용과 상하위법의 조문 연결 조문연혁


3 , , , ,

법령용어 관계 법령 및 판례 책자 수준의 인쇄 및 저장 등이 있다
, , .

또한 공공기관이나 민간기업 등에서 법령정보를 쉽고 간편하게 접근하여


공동 활용할 수 있도록 다양한 접근 방법을 제공하고 있는데 여기에는
와 법령정보 도메인 식별주소 체계 등이 있다
Open API .

- 9 -
2.1.5 법령정보의 이용 현황
우리나라 법령정보에 대한 전체 고객은 변호사 세무사 등 전문가 공무원 , ,

및 준공무원 수험생 학계 및 연구소 민간기업 자영업자 등을 중심으로 전


, , , ,

체 국민의 약 인 만명으로 추정하고 있다10% 500 .

현재 국가법령정보센터를 방문하는 이용자수는 일일평균 약 만명에 이 16

르고 있고 연간 의 증가율을 보이고 있으며 년 이후 법령정보에


, 23.5% , 2008

대한 수요가 크게 확대되여 이용자는 점점 증가하고 있다 .

또한 행정기관이나 민간기업 등의 시스템이나 홈페이지에서 법령 판례


, ,

등을 공동 활용할 수 있도록 국가법령정보를 보급하고 있으며 법령정보를 ,

공동활용하고 있는 기관은 국회 대법원 행정안전부 국세청 민간기업 등의 , , , ,

약 개 시스템 개 서버에 이르고 있다


420 , 1,200 .

년부터 아이폰 안드로이드폰 등의 애플리케이션을 개발 및 보급하여


2010 ,

스마트폰으로 법령정보를 서비스하고 있으며 이를 통해 약 만명이 스마 , 50

트폰 애플리케이션을 다운받아 활용하고 있다 .

2.2 법령정보의 특징
2.2.1 검색하고 이해하기 어려운 법령용어
년부터 현행법령을 디지털로 변환하여 통신망 등을 통해 제공하
1985 PC

고 년부터는 인터넷 서비스를 시작하여 현재까지 법령정보에 대한 접


1998

근 및 검색의 편의성과 이해 및 적용의 용이성 제고 측면에서 상당한 노력

- 10 -
을 기울여 왔다 이는 사회 인프라 구축 차원에서 한 나라의 모든 법령정
.

보를 한곳에 통합 구축하고 행정기관과 민간기업 등에 무료 보급하여 활용


하도록 한 점과 법령정보에 대한 다양한 부가정보 서비스를 발굴하여 언제
어디서나 법령정보를 보다 쉽게 검색하고 이해할 수 있도록 지원한 점 등
은 그동안의 거둔 작은 성과라 할 수 있다 .

이와 같이 법령정보의 서비스 수준이 괄목할만한 수준에 도달하였음에도


불구하고 일반국민들은 여전히 법령은 찾기도 힘들고 이해하기 어려우며
전문가의 영역으로만 인식하고 있는 문제점을 안고 있다 .

법령내용을 어렵게 인식하는 이유로는 다양한 원인이 있지만 대표적인


것은 법령내용에서 사용하는 용어의 의미가 너무 어렵다 법령에서는 한자 . ,

일본어 영어 등에서 영향을 받은 용어를 사용하거나 분야별 전문가만이


,

이해할 수 있는 전문 용어를 너무 많이 사용하고 있다 .

이로 인하여 일반국민이 실생활에서 사용하는 생활용어와 법령용어가 서


로 다르기 때문에 법령에서 사용하는 용어를 정확하게 알고 있어야 찾고자
하는 법령을 정확하게 검색할 수 있는 한계가 있다 이는 행정주체를 중심 .

으로 한 법제화 과정에서 전문적 기술적 법령용어가 양산됨에 따라 발생


하는 문제로 법률 전문가가 아니면 그 의미파악이 쉽지 않다 .

2.2.2 포괄적이고 함축적이고 집합어를 사용하는 법령 문장


법령에 기술된 문장이 너무 간결하고 함축적이며 법령 문장을 포괄적으 ,

로 기술하다 보니 집합어를 주로 사용하고 있어서 법령내용에 내포된 의도


를 정확하게 파악하기 곤란하다 .

이는 법령정보가 수천 건에 이르고 있음에도 불구하고 국민생활과 공공

- 11 -
기관의 행정업무 등에 밀접한 영향을 미치고 있기 때문에 법령내용은 전체
적으로 항상 일관성을 유지하기 위해서는 집합어 등을 사용하거나 법령문
장을 포괄적으로 기술할 수밖에 없는 불가피한 측면이 있다 .

이에 따라 법령용어나 문장에 내포된 정확한 의미를 알고 특정 분야와


관련된 법령정보를 찾기 위해서는 법령정보에 대한 사전 지식이 필요한다 .

예를 들어 시골 땅이나 논 밭 산 등으로 법령을 검색한 경우 해당되는


, ,

법령을 찾을 수가 없는데 법령에서는 대부분 농지 임야 라는 집합어 “ ”, “ ”

를 많이 사용하고 있기 때문이다 .

2.2.3 계층적 구조를 가진 복잡한 법령 체계


생활 분야별로 규정하고 있는 특정 법령을 전부 이해하고 적용하기 위해
서는 법률부터 시행령이나 시행규칙 중앙행정기관의 훈령 예규 고시 지 , ․ ․ ,

방자치단체의 조례 규칙까지의 법령을 검색하고 이해할 수 있어야 한다


․ .

법령정보는 법률에서 대략적인 내용을 기술하고 상세한 내용은 대통령


령 총리령 부령 등 하위법령에서 기술하도록 되어 있는 법령의 특징을 가
, /

지고 있기 때문이다 .

법률 등 상위법에서는 법령의 근간을 이루는 목적 용어 추진조직의 구 , ,

성 실행 주체 대략적인 절차 벌칙 시행일에 관한 사항 등을 기술하고 있


, , , ,

으며 하위법령에서는 상위법에서 위임한 내용 즉 법령을 집행하기 위한


, ,

세부적인 조건이나 절차 등을 기술하고 있는 경우가 많다 .

- 12 -
2.2.4 다수의 법령에 산재되어 기술된 생활분야별 법령내용
특정한 생활분야와 관련된 법령내용이 여러 법령에서 분산 기술되어 있
는 점을 들 수 있다 현재 우리나라의 법체계는 법령 공급자인 행정주체
. ,

즉 소관부처의 업무 프로세스 중심으로 이루어져 있는데 다양한 입법목적


을 달성하기 위하여 동일한 대상을 여러 측면에서 동시에 규율하는 복잡한
법령체계가 만들어지기 때문이다 .

이와 같은 문제점을 해결하기 위해 수요자 중심의 생활법령정보 서비스


를 제공하고 있다 하지만 생활법령 콘텐츠는 수작업으로 제작되고 있어
.

전체 법령분야로 확대하기 위해서는 많은 인력과 예산과 수년간의 작업이


필요하다 .

더욱이 중요한 문제는 대한민국 법령만 하더라도 전체 법령의 이상


, 50%

이 제 개정되고 있기 때문에 기존에 제작한 콘텐츠를 지속적으로 업데이


트해 주어야 하는데 생활법령 콘텐츠 양이 증가할수록 업데이트가 점점 어


려워 콘텐츠 확장이 용이하지 않다는 것이다 .

2.2.5 생활법령정보 및 부가정보의 한계


국가법령정보센터나 생활법령정보 서비스 등에서 지속적으로 부가 정보
서비스 등을 신규 개발하여 제공한다하더라도 일반국민이 실생활에서 바로
적용할 수 있는 서비스 수준에 도달하기에는 못하고 있다는 점이다 .

이는 일정 수준 이상의 전문지식을 가지고 많은 시간과 노력을 투입하여


법령을 검색하였다하더라도 법령의 조문이나 생활법령정보 서비스 내용을
하나하나 읽어가면서 이해하여야 하기 때문이다 .

- 13 -
따라서 생계 유지에 전념하고 있는 일반인이 일상생활에서 겪는 법적인
문제를 해결하기 위해 법령을 검색하고 이해하는 것은 쉽지가 않다 결론 .

적으로 법령정보는 아직까지 실생활 중심의 결과 중심적인 서비스가 이루


어지지 못하고 있다는 점이다 .

2.2.6 법령정보의 구축 현황

국가법령정보센터에서 검색할 수 있는 법령정보는 현행법령과 그 연혁 등


약 만건 훈령 예규 고시 등 중앙행정기관과 그 산하기관의 행정규칙
9.7 , ․ ,

약 만건 지방자치단체의 조례 규칙 만건 판례등 약 만건 법령
2.8 , ․ 30.2 , 12.4 ,

용어 약 만건 생활법령정보 등 기타 만건 등 전체 약 만건에 달하
6.7 , 1.6 63.4

고 있고 법령에서 추출한 별표 서식 약 만건을 포함할 경우 만건


, ․ 58.4 121.8

에 이른다 .

법령정보는 별표 서식 법령용어 등을 제외하고 매년 약 만 천건씩 증


․ , 2 5

가하고 있어 평균 의 증가율을 보이고 있으며 지방자치가 점점 확대되


6.2% ,

고 있어 전체 법령정보의 양은 점점 크게 증가하고 있다 .

이와 같이 법령정보의 건수가 많고 자주 제 개정되기 때문에 법령정보를 ․

활용하는 사용자는 법령정보에 대한 지식을 가지고 있어야 할뿐만이 아니


라 지속적으로 업데이트를 해주어야 하는 문제가 있어 법령을 보다 효율적
으로 이해하고 활용하는데 장애 요인으로 작용하고 있다 .

- 14 -
2.3 법령정보시스템 및 서비스의 한계
2.3.1 키워드 중심의 검색엔진의 문제점
키워드 검색은 사용자의 검색 의도와는 관계없이 질의어와 매칭되는 정
보를 무조건 제공하기 때문에 질의어와 관련된 검색 결과가 너무 많거나 ,

검색결과가 전혀 나타나지 않는 경우도 발생하기도 하고 사용자가 원하지 ,

않는 정보를 제공하는 등 인터넷 정보에 대한 검색의 효율성 측면에서 많은


단점을 가지고 있다 이는 사용자가 입력한 질의어의 의미를 무시하고 단순
.

하게 웹문서에서 일치하는 텍스트 단어 어구 혹은 문장 를 포함되어 있는지


( , )

여부를 기준으로 검색결과를 제공하기 때문이다 .

그림
[ 2-4] 법령정보 키워드 검색시스템 구성도

- 15 -
또한 키워드 검색에 활용하는 용어는 법령정보에서 추출하여 법령용어를
,

추출하여 색인사전을 만들어 놓고 사용하기 때문에 법령정보에 포함되지 않


은 용어는 검색할 수 없다 이에 따라 사용자는 자신의 의도를 표현하기 위 .

한 또 다른 시도 새로운 키워드 입력 를 하거나 이미 제시된 과도한 결과물


( ) ,

에서 다시 원하는 정보를 골라내는 수고가 필요하다 .

이와 같이 전통적인 검색 기술 즉 의미를 파악하지 못하고 형태적인 패 , ,

턴에만 의존하는 검색 방식으로는 법령정보 검색 서비스의 문제점을 해결하


는 데에 한계가 있기 때문에 디지털 정보의 메타정보와 내용에 대한 의미적
인 처리를 하기 위한 접근이 지속적으로 시도되었다 .

또한 시소러스의 구축을 포함한 각종 언어자원의 적용 등 다양한 방법이


시도되었다 이러한 언어자원에는 불용어 동의어 유의어 동음이의어 타는
. , , , (

배 먹는 배 사람 배 이음동의어 국가 나라 전체어 부분어 애완동물 강


, , ), ( , ), / ( /

아지 개 고양이 등 등 목적에 따라 다양하게 적용되고 있으나 특정 도메


, , ) ,

인 주제영역 이 아닌 일반적인 분야에 대한 적용에 있어서는 역시 한계성을


( )

띄고 있다 .

이로 인해 사용자의 의도와 검색패턴 등을 정확하게 파악하여 검색결과를


제공하지 못하고 있으며 정보의 위치 정보와 정보 사이의 관계인식 등 정 ,

보의 취합 및 분류 등은 여전히 수작업에 의존하는 경우가 많다 .

국가법령정보센터에서는 사용자가 용어를 입력하여 검색 결과가 아무 것


도 나타나지 않는 비율 이 에 달하고 있다는 것은 키워드 (No hit rate) 19.6%

검색 방식의 문제점을 보여주고 있는 예라고 할 수 있다 또한 특정 단어를 .

입력하여 불필요한 검색 결과까지 제공하는 것을 포함할 경우 법령정보에


대한 검색의 정확성은 매우 낮다고 할 수 있다 .

- 16 -
2.3.2 KMS, 마이닝 기술 등의 한계
일부 기업이나 포털 사이트를 중심으로 지식을 체계적으로 구축하고 활용
하여 사용자의 의도를 파악하고 찾고자 하는 정보를 정확하게 제공하고자
하는 노력이 시도되고 있다 .

이를 위해 지식관리시스템 구축
(KMS, Knowledge Management System) ,

특화된 검색엔진의 개발 검색어에 대한 다양한 통계의 추출 및 활용 다양


, ,

한 마이닝 기술 등 을 도입한
(Data Mining, Text Mining, Network Mining )

사례가 많다 이들 시스템은 기존의 서비스에 비하여 서비스 수준을 제고하


.

였다는 평가를 받고 있을 정도로 상당한 성과와 가능성을 보여주고 있다 .

그러나 최근에는 이들 시스템을 도입하여 활용하는 기관이 점점 줄어드


,

고 있는 실정이다 데이터 양이 증가하면서 데이터 처리 등에 한계가 있으


.

며 이들 시스템이 대상으로 하는 정보가 적절한 시기에 정확하게 업데이트


되지 않는 문제점이 있기 때문이다 .

또한 정보 속에 포함되어 있는 동음이의어 이음동의어 집합어나 부분어


, , ,

등을 명확하게 구분하지 못하는 단점을 가지고 있다 아울러 검색과 관련한 .

기준을 지나치게 검색 통계에 의존하다보니 데이터 양이 많을 경우에 검색


되는 정보나 연관어 등이 너무 많이 제공하고 있어 기존에 인터넷에서 한계
점으로 드러난 문제점을 그대로 반복하고 있다는 평가를 받고 있다 .

2.3.3 시스템 개발 및 데이터 가공의 한계


최근 새로운 시스템을 구축하기 보다는 콘텐츠와 콘텐츠를 연결하여 새로
운 서비스를 발굴하는 방향으로 정보화가 전개되고 있으며 디지털 정보의 ,

- 17 -
구축 동향은 과거에 구축한 데이터에 비하여 수요는 많지 않으나 보관의 필
요성이 있는 데이터로 구축 범위가 확대되고 있다 .

이와 같이 지금까지는 디지털 정보를 구축하여 서비스하거나 단순 반복적


인 작업이나 업무처리 절차를 전자화한 시스템은 적은 예산으로도 가시적인
성과를 거둘 수 있었으며 시스템을 개발하고 를 구축하기 위해서는 예
, DB

산만 있으면 모든 것을 충족시킬 수 있었고 전문가가 없어도 예산을 확 IT

보하여 사업을 발주하고 시스템 개발업체에 의뢰하면 원하는 시스템을 개발


할 수 있었다.

또한 시스템은 사용자 요구사항을 분석하고 시스템을 설계하는 과정에


,

일부 문제점이나 미흡한 점이 있더라도 시스템 구현이나 운영하는 과정에서


이를 쉽게 보완하여 해결할 수 있었다 .

하지만 최근 데이터베이스의 규모가 대형화되고 있고 데이터와 데이터 ,

시스템과 시스템를 연결하는 일이 빈번하게 일어나고 있으며 정보시스템의 ,

규모가 커지고 시스템이 점점 복잡해져서 정보화 사업이 대형화되고 있기


때문에 많은 예산을 투입하더라도 높은 성과를 거두기 힘든 경우가 많다 .

민간기업이나 행정기관에서 새로운 시스템을 개발하기 보다 기존 시스템


을 보완하거나 유지 보수하는데 더 많은 예산을 투입하는 것을 보면 우리

나라의 정보화 수준이 이미 성장의 한계점에 서 있다는 것을 알 수 있다 .

법령정보시스템의 경우에도 과거에는 단순한 시스템을 구축하여 일정한


성과를 달성할 수 있었으나 최근 법령정보 콘텐츠 및 서비스에 대한 사용
,

자의 요구 수준이 높아지고 있음에 따라 법령정보 콘텐츠의 제작 및 분류


, ,

서비스의 개발 등이 점점 어려워지고 있고 많은 예산이 소요되고 있으며


, ,

정보시스템의 규모가 대형화되고 복잡해져서 시스템 개발을 통한 성과 도출


에는 많은 한계점이 나타나고 있다 .

- 18 -
2.3.4 법령정보에 대한 부가정보 서비스의 한계
현재의 시스템들은 디지털 정보를 단순히 송 수신하여 사용자에게 제공 ․

하는 기능을 수행할 뿐이다 다시 말하면 전달된 디지털 정보는 수신한 사


.

용자 측에서 해석하고 가공해서 활용하여야 한다 즉 이러한 정보들을 유통 .

하는 시스템은 법령정보의 내용을 이해하거나 분류 가공하고 처리하지 못 ․

하는 한계점을 가지고 있다 .

법령정보 서비스에서는 이러한 문제점을 해결하기 위해 검색엔진의 활용


을 강화한다든지 검색엔진의 성능을 지속적으로 개선해 왔다 또한 공유 개 . ,

방 참여 등 웹 의 개념을 도입하여 집단지성을 통해 새로운 지식을 지식


, 2.0

창출하거나 기존의 정보를 업데이트해 왔으며 태깅 등을 통해 지식에 대한 ,

다양한 접근경로를 제공해 왔다 .

2.3.5 모바일 등 이동환경에서 서비스 곤란


스마트폰이나 전자북 등 이동통신기기가 우리 사회에 보급이 확산되면서
법령정보를 스마트폰으로 제공해 달라는 서비스 요구가 크게 증가하고 있
다 이에 따라 국가법령정보센터나 민간기업 등에서 법령정보 제공을 위한
.

애플리케이션을 개발 보급하고 스마트폰으로 다양한 법령정보를 제공하고


있다 또한 스마트폰에서 법령정보 서비스를 인터넷 서비스 수준까지 제고
.

해 달라는 사용자의 요구가 증가하고 있고 이동성에 맞춰 다양한 서비스를


개발해 달라는 필요성이 증가하고 있다 .

하지만 법령정보는 텍스트 기반의 정보로써 정보의 크기 평균 ( 3.6M byte)

인터넷에서 조회하는 일반 웹 문서 이하 보다 훨씬 크기가 크다


(1M byte ) .

- 19 -
또한 표 이미지 한글 파일 등 다양한 형태로 구성되어 있어 스마트폰에서
, ,

인터넷과 동일한 형태로 법령정보를 서비스하는데 한계가 있다 아울러 스 .

마트폰으로 법령정보를 서비스하는데 가장 어려운 점은 스마트폰의 화면크


기가 매우 작고 한정되어 있어 법령정보를 인터넷과 같이 한꺼번에 볼 수
있도록 하는 등의 사용자의 다양한 요구사항을 수용하는데 한계점을 가지고
있다 .

2.4 법령정보 서비스에 시맨틱 기술 도입의 필요성


법령정보는 국민생활 및 공공기관의 행정업무 등에 밀접한 영향을 미치고
있기 때문에 법령정보에 대한 접근 및 검색의 편의성을 제고하고 일상생활
에서 쉽게 이해 및 적용할 수 있도록 하는데 서비스의 초점을 맞춰 왔다 .

하지만 앞에서 기술한 바를 정리해 보면 법령정보는 건수가 많고 복잡도


가 점점 증가하고 있으며 법령정보 구성체계 및 법령용어가 어렵고 법령문
,

장을 함축적이고 포괄적으로 기술하고 있어 법령정보를 이해하고 적용하는


것은 어렵다 이에 따라 다양한 기관에서 생활법령정보나 법령질의응답사례
.

등을 제작하여 서비스하고 있으나 이와 관련되어 소요되는 비용이 너무 크


고 법령이 개정될 때마다 지속적으로 업데이트해 주어야 하는 문제점을 가
지고 있으며 생활법령정보라 하더라도 일반인은 여전히 법령정보를 이해하
기가 어렵다는 점이다 .

또한 법령정보의 서비스 수준을 제고하기 위해 키워드 중심의 법령정보


,

검색엔진의 개선 및 마이닝 기술의 도입 시스템 개선 및 데이터 가


, KMS ,

공 부가정보의 제작 및 서비스 등을 추진하는 것은 한계가 있다는 것이다


, .

아울러 법령정보 스마트폰 서비스에 대한 사용자 요구사항이 증가하고


,

- 20 -
있으며 이동하면서 사용자의 특정 상황에 부합하는 법령정보를 선별적으로
제공하는 지능형 서비스가 필요하다.

이에 따라 향후 법령령정보 서비스를 개선하기 위해서는 데이터베이스


,

구축 및 서비스 범위를 확대하고 데이터의 연결 및 가공 등을 추진한다고


해서 고품질의 콘텐츠를 지속적으로 창출할 수 있는 것은 아니며 단순히
,

기존 시스템을 보완하거나 신규 시스템을 개발한다고 해서 법령정보 서비스


의 품질을 근본적으로 개선시킬 수 있는 것은 아니고 근본적으로 법령정보
서비스의 품질을 근본적으로 개선할 시점에 와 있는 것을 알 수 있다 .

이에 따라 검색 전문가들은 사용자의 의도를 정확하게 분석하여 이해하


,

고 의미 기반으로 검색결과를 제공해 줄 수 있고 사용자에게 결과 중심적


,

으로 콘텐츠를 서비스할 수 있는 방안의 하나로 온톨로지를 활용한 시맨틱


서비스의 가능성에 주목하고 있으며 법령정보 서비스에도 시맨틱 기술을 적
용하여야 한다는 점을 강조하고 있다 .

- 21 -
제 3 장 시맨틱 서비스 개요

3.1 시맨틱 서비스의 의미


시맨틱 기술은 인공지능 의 한 분야이며 컴퓨터가 다양한 정보의 의미
(AI) ,

를 정확하게 인식하고 이를 추론하여 서비스를 창출하는 기술이다 또한 이 .

기술을 이용하여 정보를 분류 및 가공하고 정보의 의미를 분석하여 검색에 ,

활용하거나 지식을 추론하는 것을 시맨틱 서비스라 한다 .

이러한 시맨틱 기술을 웹 환경에 적용하여 웹 자체를 하나의 의미있는 지


식베이스로 보는 시맨틱 웹은 인터넷 정보들을 의미적으로 정의함으로써 기
계가 정보의 의미를 처리하도록 하는 발전된 웹에 대한 비전으로써 월 W3C(

드 와이드 웹 컨소시엄 의 팀 버너스리에 의해 주창되었다


) .

그는 시맨틱 웹은 바로 데이터의 웹이다 이것은 어떤 의미에서 글로벌


“ .

데이터베이스와 같은 것으로 기계가 읽고 처리할 수 있는 것을 의미한다, .”

고 정의하였으며 이러한 꿈은 세계의 수많은 지원자들과 함께 지난 년간 10

다양한 관점에서 연구되고 현실화되어 왔다 .

시맨틱 기술은 데이터 웹 지식 표현 상호 운용 정보 검색 지능화 등의


, , , ,

관점에서 응용 방법을 살펴볼 수 있는데 데이터 웹의 관점은 데이터 중심으


로 기존 웹을 확장하고 컴퓨터가 읽고 쓸 수 있는 웹 데이터가 부착되고 ,

유통되는 웹을 활용할 수 있다는 것이다 지식 표현의 관점은 정보의 표현


.

을 넘어 인간 지식을 명시적으로 표현 공유 재활용할 수 있는 웹으로 온톨


, ,

로지를 주요 관심대상으로 보는 관점이다 상호 운용의 관점은 의미 메타데


.

이터 및 그래프 구조의 메타데이터 체계를 가지며 웹이 서로 정보를 교환하

- 22 -
고 활용한다는 관점이다 정보검색 관점은 시맨틱 메타데이터 및 시맨틱 네
.

트워크를 자동 추출하고 웹 온톨로지의 활용을 중심으로 한 검색에 활용할


수 있다는 의미한다 데이터 지능화의 관점은 컴퓨터가 정보를 지능화하고
.

방대한 지식을 스스로 처리해 인간과 상호 작용한다는 것으로 웹 기반 추


론 의사 결정 지원 상황 인지 등에 응용할 수 있다는 관점이다
, , .

이러한 시맨틱 웹 기술을 현실에 적용하기 위해서는 시스템 상호간의 지


식표현 및 처리를 위한 표준체계가 필요하며 이를 위해 에서는 시맨틱 , W3C

웹을 현실화시키기 위한 시맨틱 웹 기술 계층 구조를 준거모델로 제시하고


각각의 기술요소들에 대한 지속적인 표준화와 연구를 수행하고 있다 특히 .

최근까지 세계 각국에서 지식표현의 정확성과 표현력을 높이기 위해 온톨로


지와 시맨틱 기술 등을 지속적으로 변화 및 발전시키고 있으며 온톨로지 ,

등 시맨틱 서비스와 관련된 기술의 계층 구조는 다음과 같다 .

신뢰 (Trust)

증명 (Proof)

전 암
논리 (Logic)
자 호
온톨로지 (Ontology) 서
명 화
RDF + RDF Schema

XML + XML Schema + XML 네임스페이스 어휘집 ( )

Unicode URI / IRI

[ 그림 3-1] 시맨틱 기술의 계층 구조

- 23 -
3.2 온톨로지와 시맨틱 서비스의 개요
3.2.1 데이터에 대한 지식을 보관하는 온톨로지
온톨로지는 철학에서의 존재론으로 실재 에 대한 정확한 이해를 추 (reality)

구하는 학문으로 이 세상의 기본이 되는 구성요소에 대한 명확한 이해와


, ‘

정의 라고 할 수 있다 전산학적 측면에서 온톨로지의 정의는 특정 도메인


’ . ‘

의 개념 공유를 위해 정형화 되고 명시적 인 명세 이다 (formal) (explicit) ’ .

즉 온톨로지에는 애매모호함이 없어야 하며 개념을 추상화하여 설명할 수


있어야 한다 다시 말해서 온톨로지란 일상생활에서 사용하는 사물이나 개
.

념 등을 컴퓨터가 이해하고 처리할 수 있는 형태로 표현된 지식들의 집합을


말한다 .

온톨로지는 개념 속성 관계 제약조건
(Concept/Class), (Property), (Relation),

공리
(Constraint), 인스턴스 등으로 구성되어 있다 이 때
(Axiom), (Instance) . ,

개념은 클래스 에 해당하는 것으로 해당 분야의 개체에 대한 일반적이


(Class)

고 본질적인 인식이나 지식을 말하고 속성은 개념에 근본적으로 속해 있는 ,

성질을 말한다 .

관계란 개념들 사이의 상관관계를 말하는 것으로 개념은 주로 관계를 통


해 다른 개념들과 연결되어 있고 관계는 유형별로 구분할 수 있다 상속관 .

계로 관계 IsA가 있으며 그 외 다양한 관계 유형을 가진다 제약


, IsaKindof .

조건이란 개념들 간의 관계나 속성의 값에 관한 제약 규정이고 공리는 추 ,

론의 기본이 되는 명제로서 증명할 수 없거나 증명을 요하지 않는 참 (true)

로 인정되는 문장을 말한다 인스턴스는 개념의 실례를 말한다 . .

온톨로지 종류에는 일상생활에서 사용하는 개념 사물 등의 지식을 기술 ,

- 24 -
한 일반상식 온톨로지 일상생활 어휘 명사 동사 형용사 등 의 지식을 기술
, ( , , )

한 자연어 온톨로지 등의 상위 온톨로지가 있고 분야별로 여러 종류의 하 ,

위 온톨로지가 존재할 수가 있으며 법령분야 하위온톨로지에는 법률에서 ,

사용하는 용어 증 개념 사물 등의 지식 법령용어 온톨로지 상 하위법 판


, , ․ ,

례 상호 연계정보 주석정보 등의 지식법률구조 온톨로지 법률이나 판례


, , ,

등에서 사용하는 문장 형식이나 표현 패턴 문장 속에 포함되어 있는 등의 , ,

지식 법률문장 온톨로지 등으로 구성할 수 있다 .

데이터로부터 추론을 통해 결과를 도출해 주는 시맨틱 서비스


3.2.2
시맨틱 서비스란 컴퓨터가 온톨로지의 전체 개념과 논리를 이해하고 사 ,

용자 질의의 의미를 분석 및 파악하여 사용자의 의도에 부합하는 결과를 ,

반환하는 것이다 시맨틱 서비스에 대한 관심에 비례하여 다양한 응용 시스


.

템들이 개발되어 왔다 시맨틱 커뮤니티 포털


. (semantic community portal),

시맨틱 블로그 등은 시맨틱 서비스의 대표적인 예이다


(semantic blog) .

시맨틱 서비스는 여러 분야에서 다양하게 개발 및 연구되고 있다 편의상 .

기능 특성과 대상 분야에 따라 시맨틱 마이닝 서비스 의미통합 시맨틱 서 ,

비스 문장인식 시맨틱 서비스에 따른 가지 범주로 분류하여 소개한다


, 3 .

시맨틱 마이닝 서비스에는 세부적으로 데이터 마이닝 텍스트 마이닝 네 , ,

트워크 마이닝 등이 있으며 데이터베이스나 인터넷 웹 문서 등으로부터 통


,

계적 방법 등을 이용하여 일정한 패턴을 찾아내고 주제어간의 관계를 규명


하거나 지식을 추출하는 기법이다 인터넷에서 유통되는 웹 문서 등을 수집
.

하여 일정한 형식에 따라 분류하고 용어의 관계를 규명하여 지식을 추론할


수 있기 때문에 대용량 데이터베이스에서 정보를 검색하고 정보의 패턴을
찾아내는데 많이 활용되고 있다 .

- 25 -
3.2.3 시맨틱 마이닝 서비스
시맨틱 마이닝 서비스에는 데이터 통합 지식관리 개인정보관리 저장소 , , , ,

지식베이스 등의 개발 사례를 포함하고 있다 .

데이터 통합 서비스는 시맨틱 서비스 기법을 응용하여 다수의 정보 자원


을 통합하고 통합 질의어 처리를 지원하는 서비스로 시맨틱 서비스의 의미
적 상호운용성을 응용한 서비스로 사용자에게 정보 자원을 통합 검색할 수
있게 한다 이 때 온톨로지는 핵심적인 역할을 담당한다
. .

지식관리 서비스는 시맨틱 서비스가 가장 많이 적용되는 분야로 비즈니스


측면에서도 매우 중요한 분야이다 지식을 저장하고 관리하는데 있어서 의.

미적인 연관 관계를 함께 고려하는 것으로 지식 모델을 통한 문제 해결 능


력을 요구한다 .

개인정보관리 서비스는 시맨틱 기술을 적용하여 주소록 메일 파일 등 개 , ,

인 정보 자원을 관리하는 것으로 주소록을 연계하여 의미 기반의 파일 분류


와 검색 등을 할 수 있다 최근 개인 정보 관리의 필요성이 증대되면서 시
.

맨틱 데스크톱 과 같은 분야가 각광받고 있다


(semantic desktop) .

저장소는 메타데이터를 활용하여 정보 자원 제품 서비스 등의 위치를 지 , , ,

정하는 서비스로 검색 도구가 정보 자원의 발견 비교 선택에 편리하도록 , ,

정보를 주석화하는 서비스이다 정보의 식별과 위치를 지정하는 것으로


.

UDDI웹서비스 저장소 서적 등록 등 저장소 구축 분야에 활용되고 있다


, .

지식베이스는 일반적인 지식관리시스템이 향상된 검색기능과 문제해결에


주안점을 두고 있는 반면에 지식베이스는 지식을 분류하고 그들의 관계를
,

설정하는 지식 형성에 주목적이 있다 시맨틱 포털 서비스 등에서 디렉터리 .

형식으로 정보간의 의미 관계를 형성하기 위해 사용한다 .

- 26 -
3.2.4 의미통합 시맨틱 서비스
의미통합 시맨틱 서비스는 사용자가 입력하는 질의어의 의미를 정확하게
인식하여 동음이의어 등을 구분할 수 있고 동의어나 유의어 연관어 등을 , ,

제공하여 정보를 보다 정확하게 검색할 수 있도록 지원하거나 정보를 의미


적으로 분류하는데 활용되고 있다 의미통합 시맨틱은 지능형 에이전트 .

시맨틱 포털
(intelligent agent), 등의 개발 사례를 포함하 (semantic portal)

고 있다 .

지능형 에이전트 는 이질적인 정보 자원을 통합하여 사


(intelligent agent)

용자에게 유용하고 편리한 서비스 제공을 위한 대행 작업을 수행하는 시스


템이다 만약 사용자가 여행을 가고자하는 경우 여행사 호텔 항공사 렌트
. , , , ,

카 서비스에 필요한 정보를 요청 및 추론하고 최적의 예약 서비스를 대행한


다 에이전트는 기관이나 기업에서 사용하는 서로 다른 온톨로지를 온톨로
.

지 매핑이나 중재 등으로 의미적 호환성을 실현할 수 있어야 하


(mediation)

며 계획
, 평가 추론 등의 지능적 처리가 가능해야 한다
(planning), , .

시맨틱 포털 이란 시맨틱 기술을 활용하여 정보 공유와 교


(semantic portal)

환 등을 목적으로 만들어진 특정 커뮤니티 또는 도메인 역할을 하는 사이트


를 의미한다 시맨틱 포털은 한정된 영역의 전문 정보 자원을 대상으로 하기
.

때문에 온톨로지의 구축이 상대적으로 용이하고 웹 기반성과 사용자의 활용


도가 높아서 시맨틱 서비스의 초창기부터 주요 응용대상이 되어왔다 기존의 .

웹 활용이 포털을 지향하고 있기 때문에 지속적으로 주목이 되는 개발 분야 ,

이다 .

- 27 -
3.2.5 문장인식 시맨틱 서비스
문장인식 시맨틱에는 주석 및 정보 강화 카탈로그
(annotation) (enriching),

시소로스
(catalog)/ 관리 등의 개발 사례를 포함하고 있다
(thesaurus) .

메타데이터는 시맨틱 서비스의 기반 기술로 정보자원 표현에 중요한 역할


을 하고 있으며 주석 ,및 정보 강화 는 사용자에게 메
(annotation) (enriching)

타데이터를 제시하고 정보를 메타데이터를 이용하여 주석화하는 시스템으


,

로 협업적 정보의 가공이나 의견 평가 등을 수집하는데 활용된다 , .

구조화된 통제 어휘 는 전자 도서관 을
(controlled vocabulary) (digital library)

위한 시소러스 나 전자상거래를 위한 상품 목록
(thesaurus) 등을 구성 (catalog)

하는데 중요한 역할을 한다 이러한 분야에서는 새롭게 발생하는 통제어휘를


.

효율적으로 관리하는 것이 매우 중요하다 카탈로그 시소러스 관리는 자체 . /

온톨로지에 의존하고 있어 다른 시스템과의 연계 및 공동 활용 등의 가능성


이 미약하지만 활발하게 개발되고 있는 분야 중 하나이다 .

시맨틱 서비스를 위한 응용 시스템은 전자도서관 , e-Learning, e-Govern

등 다양한 분야에서 활용되고 있으며 개인 기업이나 기


ment, e-Healthcare , ,

관의 정보 자원 관리에 크게 공헌을 하고 있다 .

하지만 국내에서 아직 법령정보를 관리하기 위한 시맨틱 서비스가 존재하


지 않고 해외에서도 개발 정도가 미흡하다 국가법령 통합검색 서비스 사업
, .

을 통해 일반 국민이 일상생활 용어를 활용하여 법률을 검색하였을 경우 ,

용어의 의미를 논리적으로 비교 및 추론하여 의도에 부합하는 결과를 도출


하여 제공하고 더 나아가 국내 시맨틱 서비스를 선도하여 세계적으로 기술
,

경쟁이 본격화되고 있는 온톨로지 및 시맨틱 기술 경쟁에서 세계 시장을 선


점할 수 있는 기회가 될 수 있다 .

- 28 -
3.3 온톨로지 구축 기술
3.3.1 데이터의 의미를 메타데이터로 표현하기 위한 RDF
는 기반으로 만들어진 생성
RDF(Resource Description Framework) XML

언어로써 웹상의 분산된 다양한 자원들을 기술함과 동시에 그 의미를 표현


하기 위해 개발된 언어로 웹상의 자원을 메타 데이터로 표현하고 이를 위
,

한 표준화된 방법을 제공하며 웹 자원의 효율적인 관리와 상호운영성을 위


해 에서 제안한 것이다 는 웹 자원을 검색하고 참조하며 이를 위
W3C . RDF

한 정보를 효율적으로 교환하고 공유할 수 있고 동시에 기계가 그 자원을


이해함으로써 자원에 대한 연산 처리가 가능토록 하기 위한 의미기반의 생,

성 언어이다 .

는 용어 정의를 통하여 자원을 기술하는 단위로써 자원


RDF 속 (subject),

성 속성값
(predicate), 의 세 부분으로 이루어진
(object) 즉 선언 triple ( , RDF

을 사용한다 자원은 기술하고자 하는 정보 자체를 의미하고 속


(statement)) . ,

성은 자원의 특성을 표현하는데 속성을 통해서 자원과 속성값 사이의 관계,

를 나타낸다 예를 들어 . 을 기술하고자 할
, “The coffee has the color black"

때 에서는
, RDF 는 자원으로
”coffee" 는 속성으로 은 , "has the color" , "black"

속성값으로 표현된다 .

은 자원에 대한 보다 정교한 표현을 가능케 하고 속성을 통해


RDF triple ,

정보 자원에 대한 관계 설정을 자유롭게 할 수 있다 에서 자원들은 . RDF

로 식별될 수 있다
URI(Uniform Resource Identifier) .

어떤 자원들은 무명 자원으로 식별이 불가능하다 속성도 자원


(unnamed) .

으로 구분되어서 를 통하여 식별될 수 있다 속성값은 자원이거나 값을


URI .

- 29 -
가지는 문자열 로 정의된다 는 그 자체만으로는 속성에
(Unicode string) . RDF

대해 설명할 방법을 제공하지 않을 뿐 아니라 속성간의 관계나 다른 자원 ,

간의 관계를 표현할 방법 또한 제공하지 않는다 어휘 기술 언어 . RDF

인 스키마는 이러한 기능을 수행한


(Vocabulary Description Language) RDF

다즉. 스키마는 클래스 속성 자원을 기술하는데 사용할 수 있는 클


, RDF , ,

래스와 속성을 정의한다 관련 표준은 아래와 같고 모두 공식 표준으


. RDF ,

로 채택되었다 는 속성과 값을 이용하여 자원에 대한 문장을 표현하지


. RDF

만 속성과 다른 자원 사이의 관계는 서술하지 못한다 웹 문서의 완전한 의 .

미 생성을 위해 자원의 종류와 클래스를 표시하는 방법이 필요하다 . RDF

는 웹의 자원을 클래스와 인스턴스로 구분한 것으로써


Schema 로 property

클래스 간의 관계를 나타내고 각각의 클래스의 인스턴스가 다른 속성을 가


,

질 수 있도록 한다 .

RDF스키마 는 온톨로지의 기본적인 요소들을 제공하며


(RDF-S, RDF(S))

확장 가능한 지식 표현 언어이다 즉 리소스들을 구조화하기 위한 . RDF RDF

상의 약속된 어휘들이다 .

3.3.2 데이터에 대한 온톨로지를 기술하기 위한 OWL


현재 인터넷 커뮤니티에서 가장 주목하고 있는 온톨로지 언어는 이 OWL

며 의 출현은
, OWL 스키마가 제공하는 기본적인 기능을 넘어서 기계
RDF ,

가 자원에 대한 추론 을 가능하게 하도록 하는데 그 목적이 있다


(reasoning) .

OWL은 와 스키마를 기반으로 속성과 클래스의 기술에 있어 더


RDF RDF ,

욱 풍부한 어휘를 제공한다 .

- 30 -
[ 표 의 어플리케이션 응용 가능 분야
3-1] OWL

분야 설명
인터넷 포탈 분류 법칙을 이용한 검색 기능 확장
멀티미디어 멀티미디어 내용에 기반을 둔 검색
기업 웹 데이터와 문서의 자동 텍사노미 생성 기업부서 ,

사이트 관리 나 기업 간의 합병에 따른 데이터 매핑


지능형 사용자 선택사항 및 관심사항 표현 웹사이트 간 ,

에이전트 의 콘텐트 매핑
웹 서비스 및 웹서비스 발견 및 구성 저작권 및 접근 관리
유비쿼터스 컴퓨팅 ,

OWL은 스키마를 확장하여


RDF 스키마 클래스간의 복잡한 관계나
RDF ,

클래스 및 속성에 관한 정교한 제한 사항의 표현을 가능하게 한다 예를 들 .

어 클래스의 속성 수나 타입을 제한 할 수 있고 특정 속성을 포함하는 정


, ,

보가 특정 클래스에 속함을 추론할 수 있으며 특정 클래스의 모든 멤버가 ,

특정 속성을 지님을 결정할 수도 있고 웹에 존재하는 문서들에 정의된 클


,

래스간의 상호 관계 또한 표현할 수 있다 .


RDF 는 웹 자원의 메타데이터를 기술할 수 있는 표준이지
RDF Schema

만 속성의 제약과 클래스의 상속 관계를 표현하는데 제한이 있다


, 은 . OWL

웹에서 온톨로지를 기술하기 위해 와 보다 풍부한 표현력


RDF RDF Schema

을 지원하기 위한 많은 특성들을 포함한다 은 미국 주도로 개발된 . OWL

DAML과 유럽 공동체에 의해 개발된 을 기반으로 확장된 언어이며 두OIL ,

언어를 통합한 의 많은 특징을 계승하고 있다


DAML+OIL .

과 마찬가지로 도
DAML+OIL 스키마의 상위 수준에서 어휘의
OWL RDF

- 31 -
의미를 정의하고 있으며 의 클래스와 속성을 이용한다
, RDF 은 . OWL

서술 논리 에 기반한 표현력을 가지고 있고 사용 용도에


Description Logic( ) ,

따라서 등의 상이한 표현력의 수준을 지원


OWL-Lite, OWL-DL, OWL-Full

하고 있다 년에 개정된
. 2009 는 표현 수준에 따라 OWL 2 OWL 2 EL, OWL

로 나뉜다
2 QL, OWL 2 RL .

[ 표 3-2] OWL 2 분류표


구분 설명
- 클래스 혹은 속성(property)가 대단히 많이 필요한 응
OWL 2 용을 위해 적합한 프로파일
EL - 상당히 많은 수의 클래스와 속성으로 구성된 온톨로지
에 대해서도 빠른 시간(다항 시간)

- 인스턴스가 대단히 많은 응용에 적합한 프로파일


- A-Box 추론 성능이 중요한 응용에서 권고됨
OWL 2 - 대용량 데이터(facts)에 대한 질의 시스템에 적합하며
QL 기존의 RDB와 결합해 사용 가능
- 질의는 모두 SQL로 변환 가능하며, 표현력에 제약이
있음

- 상대적으로 적은 표현력 손실과 대용량 처리가 동시 필


요할 때 사용
- 가능한 표현력 손실을 줄이면서 시간 내에 답을 얻을
OWL 2
수 있도록 설계
RL
- 온톨로지의 일관성 점검(consistency check)과 포함관
계(subsumption) 추론이 가능하면서 동시에 규칙 기반
추론을 적용 가능

- 32 -
3.3.3 SPARQL

관계형 데이터베이스에서의 표준 질의 언어인 와 같이 기반의 SQL RDF

트리플 데이터 셋에 대한 표준 질의언어이자 프로토콜이다 은긴 . SPARQL

과정을 거쳐 년 에 의해 표준화 되었으며 웹이 하나의 거대한 데


2008 W3C ,

이터베이스가 되기 위한 핵심 도구가 되었다 .


SPARQL 와 같은 데이터 공개와 공유 서비스에서 표준화된
data.gov.uk

질의 방식으로 널리 활용되고 있다 는 팀 버너스 리의 노력뿐 . data.gov.uk -

아니라 국가적 필요성에 의해 추진되고 있는 영국 정부의 데이터공개 사이


트이다 .

이 사이트에서는 인구통계 경제 교육 환경 등 종의 방대한 데이터


, , , 3002

베이스가 공개되어 있다 더욱 놀라운 것은 상단 메뉴에서


. 을 통해 SPARQL

이들에 바로 접근 질의할 수 있다 , .

3.3.4 트리플 저장소(Triple Store)


이 에 대한 표준 질의 언어인 것처럼
SQL RDB , Oracle, MS SQL, MySQL

에 대응되는 을 지원하는 시맨틱 데이터베이스들이 존재한다 트리


, SPARQL .

플을 저장 및 관리한다 하여 일반적으로 트리플 저장소 혹은 (Triple Store)

등으로 불리고 있다
Semantic Repository .

트리플 저장소의 일반적인 구성은 트리플 형태의 데이터를 저장 및 관리


하는 기능과 기반의 질의 처리하는 기능 및 온톨로지 모델에 따라
SPARQL

추론하는 기능들로 구성된다 .

- 33 -
3.3.5 온톨로지 모델링 방법론
다양한 기술적인 요소들과 함께 지식베이스를 구축하기 위해서는 지식 베
이스의 체계인 온톨로지를 모델링하는 것이 매우 중요하다 .

대표적인 온톨로지 모델링 방법으로서는 프로테제 를 만든 (Protege)

대학 팀에서 제시하였고 가장 기본적으로 사용되는 온톨로지 구축


Stanford ,

방법론 소위 ( 방법론이라고도 부른다 이다 실제 구축 방법론은


ontology101 ) .

각 단위 프로세스를 반복적으로 모델링하여 온톨로지를 구축하는 방법이다 .

적용범위 기존 자원 용어 클래스
설정 ➡ 재활용 검토 ➡ 열거 ➡ 정의

속성 제약조건 인스턴트
➡ 정의 ➡ 정의 ➡ 생성

[그림 3-2] Ontology 101 온톨로지 구축 방법론


좀 더 구체적이고 실용적인 방법으로서 가 있다 OntoKnowledge(OTK) .

OTK에서는 온톨로지 구축의 첫 작업으로서 적용 범위와 응용 사례를 결정하


도록 하고 있다 이 단계에서 온톨로지가 지식을 표현할 도메인은 무엇인지
. ,

그 응용 소프트웨어는 무엇이 될지 온톨로지가 어떤 질문에 대해 답을 주어 ,

야 할지를 결정한다 이러한 결과물로서 온톨로지에 대한


. ORSD(Ontology


Requirements Specification Document) 를작 CQ(Com petency Questions)

성한다 는 지식베이스에 대한 전반적인 요구사항을 제시하며 는


. ORSD , CQ

지식베이스가 지녀야 할 지능에 대한 역량기준을 제시한다 .

- 34 -
3.4 법령정보의 시맨틱 기술 적용 가능성
3.4.1 법령정보 구성체계의 특징
법령정보는 헌법을 중심으로 법률 시행령 대통령령 국회규칙 대법원규
, ( , ,

칙 헌법재판소규칙 중앙선거관리위원회규칙 감사원규칙 시행규칙 총리령


, , , ), ( ,

부령 등으로 계층적 구조를 가지고 있다 따라서 모든 법령은 헌법에 기초


) .

하여 헌법에 위반되지 않는 범위 내에서 제 개정되고 있다 ․ .

그림
[ 3-3] 법령정보의 계층적 구조
법률은 국회에서만 제 개정할 수 있으며 대통령령 등 시행령은 법률에
․ ,

서 위임한 사항을 집행하거나 대통령 권한 범위 내에서 필요한 행정행위를


수행하기 위해서 제 개정되고 있어 각 법률에서 대략적인 내용을 기술하고

- 35 -
시행령이나 시행규칙 등에서 상세한 내용을 기술하고 있다 .

총리령이나 장관이 제 개정하는 시행규칙은 법률이나 시행령 등에서 위 ․

임한 내용을 집행하거나 장관의 권한 범위 내에서 필요한 행정행위를 수행


하기 위해 제 개정한다 또한 중앙행정기관에서는 법률이나 시행령 시행규
․ . ,

칙에서 위임한 훈령 예규 고시 등 행정규칙을 제 개정하고 있으며 지방


․ ․ ․ ,

자치단체 등에서는 법률 시행령 시행규칙 등에서 지방자치단체 등에 위임 , ,

한 행정규칙을 제 개정하고 있다 ․ .

이와 같이 법령정보는 헌법에서부터 각급 행정기관에서 발령하는 훈령 ․

예규 고시까지 하나의 커다란 계층적 구조를 가지고 있는 것이 특징이며


이러한 법령정보의 계층구조는 각 법령의 조문에 기술된 문장을 통해 서로


연결되어 있다 .

아울러 대법원 판례 헌법재판소의 위헌결정례 중앙행정기관 등의 법령


, , ,

해석례 행정심판위원회의 행정심판재결례 등도 헌법 법률 시행령 시행규


, , , ,

칙 등에 근거하여 법적인 판단이 이루어지고 있기 때문에 법령정보와 계층


적으로 연결되어 있다고 할 수 있다 .

3.4.2 법령 내용의 구조적 특징


법령정보는 법령내용이 일정한 패턴을 가지고 있다는 점이다 법령내용은 .

전문 본문 부칙 별표 및 별지 서식 등으로 구성되어 있으며 본문은 다시


, , , ,

여러 개의 조문을 편 장 절 관 등으로 나누어 구분하고 있 (編), (章), (節), (款)

다 또한 법령의 조문 은 항 호 목 등으로 세분화되어 기술


. (條文) (項), (號), (目)

하고 단서 나 후단 등은 항 에 기술한다
(但書) (後但) (項) .

- 36 -
그림
[ 3-4] 법령내용의 계층적 구조
판례내용의 경우에도 판시사항 판결요지 참조조문 참조판결 전문 등으
, , , ,

로 구성되어 있으며 전문은 다시 피고인 상고인 변호인 원심판결 주문


, , , , , ,

이유 범죄의 사실 증거의 요지 법령의 적용 등으로 구성되어 있다


, , , .

그림
[ 3-5] 판례내용의 계층적 구조

- 37 -
3.4.3 법령 내용의 특징
법령정보의 내용에 대한 특징은 법령 문장에 대한 법적인 표현이나 기술
(記述)방법 등을 분석하려고 하는 것이 아니며 법령문장을 기계가 인식하
고 분석하는데 필요한 특징을 살펴보고자 한다 .

법령정보 콘테츠를 구성하고 있는 구조는 물론 내용도 정형화된 데이터이


다 법령 문장은 공식적인 문서이고 여러 사람이 공유하는 자료이기 때문에
.

우리말의 어순 구조를 그대로 따르고 있는 경우가 대부분이다 .

먼저 법령내용을 기술하는데 사용하는 문장을 살펴보면 법령문장은 주어 ,

목적어 목적어 순으로 기술한다 일부 주어와 목적어 등을 구나 절과 같은


, .

형태로 기술하기도 하지만 큰 틀에서 문장의 구조를 모두 갖추고 있다 물 .

론 단서 등을 문장의 앞이나 뒤에 붙이는 경우가 있지만 이 경우에도 다 “

만 이 경우 등의 구절을 사용하여 문장의 형태를 갖추고 있다 이 중에서


”, “ ” .

도 법령의 목적을 기술하고 있는 조문은 문장이 복잡한 절의 형태로 기술하


고 있는 것이 특징이다 .

또한 법령의 내용을 세분하여 살펴보면 조문 내용을 구성하고 있는 (條文)

항 은 문장 형태로 조문의 제목에 나타난 객체나 행위를 설명하거나 구


(項)

성하고 실현하거나 달성하기 위한 절차 등을 기술하고 있다 호 는 항


, . (號)

에서 기술한 사항이나 종류 등을 상세하게 나열하거나 항의 내용을 실


(項)

현하기 위한 조치사항 및 조건 기준 등을 기술하고 단어나 구 등을 이용하


, ,

여 개괄식 형태의 기술하는 것이 대부분이며 법령에서 사용하는 용어를 정 ,

의하는 경우 등에 한하여 서술식으로 기술하는 경우가 있다 목 은 호 . (目)

에서 기술한 객체에 대한 종류 객체에 대한 상세 묘사 예외사항 등을


(號) , ,

기술하고 있다 .

- 38 -
3.4.4 법령 문장의 특징
법령 문장에서 사용하는 단어나 어미의 특징을 보면 법령내용을 기술하는
데 사용하는 단어는 법령용어나 일상생활에서 사용하는 표준 단어를 사용한
다는 점이다 사투리나 약어 자 성어 등 숙어 속담 의성어나 의태어 등을
. , 4 , ,

사용하지 않는다 또한 어미의 경우에도 한 하는 하고자 하여야


. “~ , ~ , ~ , ~

한다 할 수 있다 한다 하되 등 한정된 어미의 형태만을 사용하고


, ~ , ~ , ~ ”

있고 명사에 하다 있다 이다 등을 기본형으로 하는 어미를 붙여 사


, “ ”, “ ” “ ”

용한다 아울러 법령문장에는 시제나 존칭을 표현하지 않으며 명령문 의문


. , ,

문 감탄문 등의 문장을 사용하지 않는다는 점이 특징이다


, .

아울러 법령내용은 구성하고 있는 각각의 조문이 특정한 순서에 따라 기


,

술되고 있다는 점이다 물론 행정조직의 직제나 직제 시행규칙 등은 예외적


.

인 경우가 있지만 대부분의 법령은 장기간에 걸쳐서 축적된 경험이나 논리


적인 타당성 전체내용의 흐름 등을 고려하여 특정한 순서에 따라 조문을
,

배열하는 것으로 보인다 .

이와 같은 법령문장의 특징은 판례 헌재결정례 등에서도 동일하게 나타 ,

나고 있으며 판례 등의 경우 반복되는 부사
, 구 절 등을 상세 (副詞), (句), (節)

하게 분석하는 경우 전체 내용에 포함되어 있는 논리의 순서를 발견할 수


있을 것으로 보인다 .

- 39 -
[ 표 3-3] 법령내용을 구성하고 있는 주요내용
목적 정의 / 수수료 사용료 /

총칙 해석 적용범위 / 비용의 부담
다른 법령과의 관계 자료조사 자료보관 장부비치 / /

행위의 허가 신고 등록 보칙 보고의무 자료제출 통보 통지


/ / / / /

사업의 허가 등록 신고 특허 등 규정 청문 의견청취 공청회


/ / / / /

인허가의 의제 협의 권한의 위임 위탁 대행
/ / /

결격사유 권리 의무의 승계 / 유사명칭 사용금지


과징금 정보공개 정보제공 /

부담금 정보보호
실체적 연체금 가산금 행정강제 손실보상 손해배상
규정 지원금 보조 출자 출연 융자
/ / /

/ / / / 행위제한 원상회복 /

국유재산 공유재산 물품관리 구성요건


벌칙
/ /

재정 회계 국가계약 기금
/ / /
규정 법정형 양벌규정 /

자격부여 시험제도 교육훈련 / / 행정질서벌 과태료 ( )

검사 검정 인증 시험
/ / / 시행일
위원회 특수법인 영조물 유효기간 적용시한
부칙
/ / /

행정처분 행정쟁송 이의신청 / /


규정 다른 법령의 개정 폐지 /

겸직 및 영리업무 금지 적용례 특례 경과조치


/ /

유효기간 기간제한 기간계산 / / 종전 부칙의 개정


공무원제도 직제 조직 / / 기타 별표 별지 서식
/

3.4.5 법령정보의 시맨틱 서비스 가능성


법령정보는 비정형 정보임에도 불구하고 서로 밀접한 계층적 구조 관계를
가지고 있고 법령내용을 구성하고 있는 조 항 호 목 등도 일정한 정형적
, , , ,

구조를 가지고 있다 또한 법령 내용을 기술하는 조문 구조도 법령인덱스


.

- 40 -
종류에 따라 일정한 패턴의 문장 형식으로 기술되어 있으며 법령내용을 구 ,

성하는 조문 제목도 다른 법령에서 반복하여 사용하고 있는 등 법령정보의


구조는 일정한 논리 규칙에 따라 구성하고 기술되고 있는 특징을 전체적으
로 살펴 보았다 .

또한 법령 내용에서 사용하는 문장 구조는 단순하고 법령마다 동일하게


, ,

반복하고 있음을 알 수 있다 아울러 법령 문장에서는 사투리 약어 숙어


. , , , ,

약어 의성어와 의태어 등을 사용하지 않고 시제나 존칭 명령문 의문문 감


, , , ,

탄문 등이 없으며 한정된 어미를 반복해서 사용한고 있다는 점이 특징이다 .

이와 같이 법령정보는 국문법의 어순 구조를 가지고 있고 일정한 구조와 ,

규칙 패턴을 가지고 있으며 한정된 체언이나 용언 등을 사용하고 있기 때


, ,

문에 컴퓨터가 법령정보 구조를 이해하기가 용이하고 법령 문장에 대한 형


태소 및 구문 분석이 용이하다고 할 수 있다 .

이는 컴퓨터가 법령정보 구조 법령 문장 등을 분석하여 온톨로지를 구축


,

하고 실시간 관리하는데 많은 잇점이 될 수 있고 시매틱 서비스를 위해 법 ,

령 문장을 추론하는데 큰 장점으로 작용하기 때문에 법령정보는 시맨틱 서


비스를 구현하는데 적합한 분야라 할 수 있다 또한 향후 법령이나 판례 등 . ,

에 대한 시맨틱 서비스 영문 번역 서비스 등을 구현하는데 유리한 점으로


,

작용할 것으로 보인다 .

- 41 -
3.5 법령정보 시맨틱 서비스 구현 가능 분야
3.5.1 생활/법령용어에 대한 의미통합 검색 및 연관어 서비스
생활용어 법령용어 법령과 판례 등을 서로 밀접하게 연결하고 전체 용
, , ,

어의 의미를 포괄적으로 내포하고 있는 객체 집합어 를 중심으로 행위어 종 ( ) ,

류 조건 등을 세분화하여 각각 세분화된 분류 체계별로 연관어 동의어 부


, , ,

분어 연결하여 객체에 대한 종합적인 법령용어 체계도를 구성한다 사용자 .

가 생활용어를 입력하더라도 법령에서 기술되어 있는 집합어로 변환하여 제


공하기 때문에 법령이나 유사한 판례 등을 쉽게 찾을 수 있게 된다 .

또한 객체 집합어 와 관련된 다양한 종류나 행위어 등을 미리 제공함으로


( )

써 법령정보에 대한 검색 범위를 축소힐 수 있어 검색에 대한 정확성을 높


일 수 있다 아울러 사용자가 선택한 객체 및 행위어 등과 관련된 법령이나
. ,

유사한 판례 등을 조문단위까지 종합적으로 서비스할 수 있다 결론적으로 .

입력하는 단어가 법령에 기술되어 있는지 여부와 관계없이 사용자의 의도를


파악하여 찾고자 하는 법령이나 유사한 판례를 신속하고 정확하게 제공하기
위해 구현하려는 서비스이다 .

예를 들어 아파트를 구입하고 세금을 납부하기 위해 관련 법령이나 판례


를 찾고자 하는 경우 법령정보 검색창에 아파트 를 입력하고 검색하면 법 “ ”

령명에서는 관련된 관련 법령을 찾을 수가 없고 법령본문에서는 건을 찾 , 60

을 수 있으며 판례에서는 약 건이나 검색되는 것을 알 수 있다 법령본


2,800 .

문이나 판례에서 검색되는 법령은 건수가 너무 많고 대부분 아파트 거래나


세금과 직접적으로 관련된 법령정보가 아니다 이에 따라 일반국민은 특정 .

분야의 법령을 찾기 위해 법령용어를 정확하게 입력하기도 어렵고 검색된 ,

- 42 -
법령정보를 모두 읽어 보더라도 법령내용을 파악할 수가 없다 이러한 문제 .

점을 해결하기 위해 의미 기반의 시맨틱 서비스에서는 아파트라는 용어를


부동산으로 대치하여 연관된 정보를 가시적으로 보여주고 부동산과 관련된
연관어를 제공함으로써 부동산 매매에 따른 세금을 규정하고 있는 법령이나
유사한 판례 등을 쉽게 찾을 수 있다 .

3.5.2 법령내용에 대한 단순 질의 응답

일상생활에서 필요한 법적인 문제는 사용자가 법령이나 판례 등을 검색하


고 법령내용을 이해하여 적용하는 등의 복잡한 과정을 원하지 않는다 이에 .

따라 컴퓨터가 사용자의 상황을 분석하여 이해하고 사용자 의도를 정확하게


파악한 다음에 이에 적합한 법령이나 판례를 찾아서 답변을 추론하고 이를
사용자가 바로 이해하고 적용할 수 있도록 자연어 형태로 변환하여 제공하
는 것이 필요하다 .

현재 세계적으로 연구되거나 개발된 시맨틱 기술 현황을 고려할 때 사용


자가 전체 상황을 세밀하고 길게 기술한 경우까지 사용자의 의도를 분석하
여 답변을 추론하여 답변을 제공하는 것이 필요하겠지만 인터넷과 마찬가지
로 사용자가 기술한 내용을 컴퓨터가 분석 및 이해하기 곤란한 경우가 많아
전문가가 상담해 주는 것과 같은 서비스를 기대하는 것은 곤란하다 .

물론 특정 분야에 대한 시맨틱 서비스 및 인공 지능 등을 도입할 경(AI)

우 일부 가능할 수도 있으나 이는 시맨틱이나 인공 지능 등을 전문적으로


,

연구 및 개발하는 대학이나 기업 연구소 등에 맡기고 법령내용 등에서 기


,

술되지 않아 전문가의 법적인 판단이나 해석 등이 필요한 문제는 변호사나 ,

세무사 등의 영역으로 남기는 것이 옳다고 본다 .

- 43 -
법령정보에 대한 답변은 다른 행정기관에 많은 영향을 미치고 있을 뿐만
이 아니라 컴퓨터에서 제공하는 답변과 행정기관 등에서 제공하는 답변이
서로 다를 경우 국민이나 행정기관에 혼란을 줄 수 있고 행정기관을 대상
,

으로 하는 민원이 급증할 우려가 있으며 행정기관에서 제공하는 법령정보


서비스 전반에 대한 신뢰성이 떨어질 수 있기 때문이다 .

일반국민 ) 외국에 나가서 학업을 계속할려고 하는데 가능한가요 ?

국법센터 ) 나이와 성별 남자 여자 은 ( , ) ?

일반국민 ) 저는 세의 남자입니다
24 .

국법센터 ) 병역의무가 있는 사람은 국외여행 허가를 받아야 합니다 .

국법센터 ) 귀하는 현역복무 공익근무요원복무 등 병역의무를 마쳤습니까


, ?

일반국민 ) 아니오 허가를 받으려면 어떻게 해야 하나요


. ?

국법센터 국외여행 허가를 받으려는 사람은 출국예정일 일 전까지 국외여 2


)
행허가신청서에 다음 서류를 첨부해서 서울지방병무청에 제출해야
합니다 .

일반국민 ) 출국을 할려면 어떤 절차가 필요합니까 ?

국법센터 ) 출국 전 일 이내에 공항 또는 항만의 병무신고사무소에 국외여


2
행허가증명서 출국신고서와 여권을 제출하면 인적사항 등의 상호
,
대조를 거쳐 여권에 출국확인인을 날인 받아 출국하시면 됩니다 .

일반국민 ) 아 참 허가를 받지 않고 출국하게 되면 어떻게 됩니까


! ?

국법센터 ) 출국허가를 받지 않고 출국하면 만원 이하의 벌금 또는 구류 200


에 처해집니다 병역법 제 조제 항제 호 . (「 」 84 3 2 ).

▶ 병역법 제 조제 항 및 병역법 시행령 제 조제 항


「 」 70 1 「 」 146 2
법령정보 ▶ 대법원 선고 도 판결 병역법 위반
2001. 6. 15. 2000 3853 「 」
※ 병무처 민원과 병역 (02-2110-0114) : www. .go.kr

[ 그림 3-6] 법령정보 질의 응답 서비스의 예 ․

법령정보 시맨틱 서비스는 법령이나 판례 등에서 기술하고 있는 내용을


토대로 결과를 추출하여 단답형 형식으로 서비스하는 것을 말하는 것이다 .

- 44 -
사용자와 컴퓨터가 특정 행위에 대한 질문과 답변을 지속적으로 주고 받으
면서 사용자가 원하는 최종적인 답변을 찾을 수 있도록 도와주는 방식이다 .

컴퓨터가 법령이나 판례 질의 응답사례 등을 분석하여 사용자가 특정 행


, ․ ,

위를 이행하는데 필요한 조건이 충족되었는지 등을 확인하고 조치하여야 하


는 사항이나 방법 절차 등을 알려주는 서비스를 구현하여야 한다 물론 컴
, .

퓨터가 사용자의 상황과 의도를 파악하고 답변을 추론하는데 참고로 한 법


령의 조문이나 유사한 판례 등을 함께 제공하는 것도 중요할 것이다 .

예를 들어 외국에 출장을 가려고 하는 사용자가 법적인 문제를 질의하는


경우 컴퓨터는 질문자가 남자인지 여자인지 군대를 갈 시기의 연령대인지 , ,

군대를 제대했는지 외국을 방문하는 목적이 장기간 소요되는지 여부를 알


,

지 못한다 물론 이러한 사항을 모두 입력하고 알고자 하는 법적인 내용이


.

무엇인지를 명확하게 입력한다면 컴퓨터가 사용자의 의도를 분석하고 답변


을 추론하기가 쉽지만 대부분은 모든 사항을 전부 다 입력하는 것은 곤란하
기 때문에 단계별로 질의를 통해 사용자의 상황을 파악하여야 한다 .

그리고 군대 문제 뿐만이 아니라 범죄 사실 등 다양한 접근이 필요하기 때


문에 이와 같은 단답형 질의답변 형식이 사용자의 상황이나 의도를 분석하
고 답변을 추론하는데 더 적합할 것으로 보인다 .

3.5.3 법령정보의 구조화 및 법령민원에 대한 일관성 유지


법령정보 시맨틱 서비스가 가능한 분야는 텍스트로 기술된 법령이나 판례
등의 전체 내용을 도식화하거나 구조화하여 가시적으로 표현하여 제공하고 ,

각급 행정기관이나 시민단체 등에서 제공하고 있는 다양한 법령 질의에 대


한 답변을 일관성을 유지하여 효율적으로 처리하는데 활용할 수 있다 .

- 45 -
법령내용은 법률 시행령 시행규칙 등으로 분산된 기술되어 있어 법률을
, ,

기준으로 하위법령을 종합적으로 정리하여 제공하는 것이 필요하다 법령의 .

상하위법이나 연관된 조문을 조문 제목이나 주제별로 하나로 정리하고 이를


트리 형태로 구조화하여 제공할 수가 있다 또한 전체 법령내용
(Top-Down) .

으로부터 주제별 업무 절차 추진조직 허가조건 벌칙 등을 추출하고 도식


, , ,

화하여 제공하는 것이 가능하다 또한 복잡하고 일정한 규칙이 없어 보이는 . ,

유사한 판례 등을 종합적으로 제공하는데 가시적으로 보여주는데 활용할 수


있다 판례의 주제 상세 사유 판단 요지 및 요건 결과 등으로 상세하게 분
. , , ,

류하여 제공함으로써 사용자의 상황에 적합한 판례 등을 보다 효율적으로


찾고 이해하도록 하는데 도움이 될 것이다 .

또한 법령민원을 처리하는데 시맨틱 기술을 활용할 수 있는 여지는 많다 .

민원인이 질의한 질문 내용을 체계적으로 분석하여 관련 법령이나 유사한


판례 법령답변사례 등을 제공할 수 있고 컴퓨터가 미리 법령 질의에 대한
, ,

답변을 작성하고 담당자가 확인하도록 한다든지 담당자가 작성한 내용이 ,

정확한 것인지 여부를 검토하는데 유용하게 활용할 수 있다 .

3.5.4 생활분야별 법령정보 통합 서비스


생활분야와 관련된 법령내용이 다수의 법령에 산재되어 기술하고 있기 때
문에 법령을 이해하기도 어렵고 많은 시간이 소요된다 따라서 법률 시행 . , ,

령 시행규칙 등 다양한 법령이나 판례 등을 서로 연결하고 법령내용에 포


,

함되어 있는 편 장 절 관 조문
(編), 등의 제목
(章), 등을 (節), (款), (條文) (題目)

이용하여 각각의 조문을 주제별로 정리하여 제공할 수 있다 .

예를 들어 애완동물을 기를 때 직접 관련되는 법률로는 동물보호에 관한

- 46 -
일반법인 동물보호법 외에도 사료관리법
「 가축전염병예방법」 「 」, 「 」,

「수의사법 등이 있고 그 밖에도 민법 악취방지법 도시공원


」 , 「 」, 「 」, 「

및 녹지 등에 관한 법률 경범죄처벌법 도로교통법 검역법 」, 「 」, 「 」, 「 」,

「폐기물관리법 수질 및 수생태계 보전에 관한 법률 공유수면관리


」, 「 」, 「

법 항만법 등에서 애완동물의 사육 관리에 관한 소유자 등의 의무


」, 「 」 ㆍ

를 규정하고 있다 .

목 차 애완동물 건강관리 담당부서 연락처 ( )

애완동물 개요 애완동물의 전염병 예방과 건강관리 및 ▶농림수산식품부


애완동물의 의미 적정한 치료를 위해 소유자 등은 정기적 동물방역팀
애완동물의 종류 으로 애완동물의 특성에 따른 예방접종 ▶국립수의과학검역원 (2110-3452)

애완동물 데려오기 과 구충을 실시해야 합니다 동물보호과 .

애완동물 구입 , 한편 애완동물이 동물용의약품 의약외 , ㆍ


(2110-6329)

애완동물 피해보상 품 또는 동물용 의료기기와 관련한 피해 관련용어


애완동물 등록 를 입었다면 소비자분쟁해결기준 에 「 」

애완동물 기르기 따라 보상받을 수 있습니다 ▶ 애완동물 .

애완동물의 사육 법령 훈령예규 판례 헌재결정례 법령 ▶ 검역


[ ][ ][ ][ ][

애완동물과의 외출 해석례 [질의응답례] ]

애완동물 건강관리 ▶ 사료를 살 때 어떤 점을 알아두면 좋을 관련사이트


애완동물 분실 습득 까요
ㆍ ?

애완동물 유기 ▶ 예방접종 진료 등 애완동물에게도 농림수산식품부


국립수의과학검역 ㆍ

애완동물 학대금지 예방접종이 필요한가요 원 ?

애완동물 장례 치르기 ▶ 동물병원에 갈 때 알아두면 도움될 시민단체


애완동물 사체 처리 만한 사항이 있을까요 애완동물협회 ?

법 동물보호법 사료관리법 가축전염병예방법 수의사법


「 」, 「 」, 「 」, 「 」
령 민법 악취방지법 도시공원 및 녹지 등에 관한 법률 경범
「 」, 「 」, 「 」, 「
정 죄처벌법 도로교통법
」, 검역법
「 폐기물관리법 수질 및 」, 「 」, 「 」, 「
보 수생태계 보전에 관한 법률 공유수면관리법 항만법 」, 「 」, 「 」

[ 그림 3-7] 생활분야별 법령정보 통합 서비스의 예

- 47 -
또한 동물보호법 의 시행령 시행규칙까지 전부 포함할 경우 해당되는
「 」 ,

법령은 약 여건에 이르고 있다 또한 법령에서 기술하지 않은 사항은 유


40 .

사한 판례 등을 참고하여 판단하여야 하는 경우가 많다 따라서 애완동물과 .

관련된 일반법과 그 시행령 시행규칙 등의 조문 등의 제목을 활용하여 전


,

체 법령내용을 주제별로 체계적으로 분류하여 제공할 수 있다 .

3.5.5 법령에서 정한 기준 및 절차 등에 대한 사전 점검
일상생활에서 필요할 것으로 생각되는 서비스로 법령에서 정한 기준이나
절차 등을 준수 또는 구비했는지 여부를 기준이나 절차별로 질의 응답을 ․

주고 받으면서 스스로 사전에 점검해 볼 수 있도록 법령 기준 및 절차 점검


서비스를 고려해 볼 수 있다 .

예를 들어 개인 사업자가 당구장을 차리기 위해 건물을 임대하고 공사를


, ,

하고 시설을 구비한 이후 행정기관에 당구장 개업 허가를 요청하지만 행정


,

관청에서는 초등학교와 미터가 떨어지지 않았거나 소방시설 등이 미비


200

하다는 예상하지 못한 이유를 들어 당구장개업을 불허하는 경우가 있다 하 .

지만 이미 많은 돈을 투자한 사업자는 어떤 수단과 방법을 동원해서라도 허


가를 받고 싶어하기 때문에 그 과정에서 금품거래 등 부정부패가 발생하고
행정기관에 대한 불만이 생기고 행정기관 업무의 효율성을 저하시키는 떨어
뜨리는 부작용이 발생하게 된다 .

따라서 이와 같은 문제를 해결하기 위해 사업자는 공사를 하기 전에 허


가에 필요한 기준이나 절차를 사전에 점검해 보고 결과를 토대로 공사를 ,

한 이후에 행정간청에 허가를 요청하도록 지원하고 행정기관은 사업자가 ,

- 48 -
제출한 점검표와 결과가 일치하는지 여부를 확인하고 허가 여부를 통보하도
록 지원하면 된다 이를 통해 사업자 등 민원인은 경제적인 손해를 줄일 수
.

있고 행정기관은 행정처분이 빨라져 행정에 대한 민족도와 행정의 효율성


,

을 제고할 수 있는 효과를 기대할 수 있다 .

3.5.6 법령에서 정한 산식 계산
법령에 복잡하게 기술된 각종 계산을 간편하게 처리하여 제공하는 산식
계산 서비스가 필요하다 .

예를 들어 할아버지가 손자에게 약 억원을 증여하고 싶은 경우 증여세를


1

얼마나 납부해야 하는지 알 수가 없다 세금으로 납부해야 하는 금액을 제


.

외하고 증여할 금액을 정하기 위해서는 변호사나 세무사 등에게 의뢰하여야


하는데 일반서민이 전문가의 도움을 받기는 쉽지 않다 .

법령에서 기술된 산식을 계산해 보는 방법은 법령내용을 자세히 읽어보거


나 인터넷을 조금만 뒤지면 알 수 있지만 일반국민은 복잡하고 어려운 용어
로 가득찬 상속세 계산법이나 절차 등을 법령이나 인터넷을 보고 공부하고
싶지도 않고 단지 납부해야 할 상속세가 얼마인가를 알고 싶어 한다
, .

이러한 문제를 해결하기 위해서는 인터넷이나 스마트폰 등에서 증여할 금


액 증여대상 등 몇가지 필요한 사항을 입력하는 것으로 증여세를 자동으로
,

계산해 주는 서비스가 필요하다 .

법령에 기술된 각종 산식을 기계적으로 계산할 수 있도록 법령용어별로


산식 계산 프로그램을 개발하고 이를 온톨로지와 연결하여 사용할 수 있다 .

법령산식 계산은 온톨로지와 직접적인 관계는 없지만 하나의 객체에 대한


행위를 직접 처리하는 기능을 하고 있으므로 온톨로지의 속성 등으로 간주

- 49 -
할 수 있다 .

법령산식 계산 프로그램을 개발하기 위해서는 특정 분야에 대한 실무 경


험이 많은 전문가가 프로그램에 대한 개발 경험이 없더라도 쉽게 프로그램
을 개발하고 업그레이드할 수 있는 환경을 마련하여 제공하는 것이 무엇보
다도 가장 중요하다 .

증여세 계산 서비스
□ 증여하고자 하는 사람은 ?

○배우자 ○부모 자녀 ●손자 손녀 ○손자 손녀 미성년 ○친척 ○기타


/ / / ( )

□ 증여받는 손자 손녀의 부모의 생존 유무 ●생존 ○사망 /

□ 증여하고자 하는 금액은 ? [ 24,000 ] 만원


※ 부동산 등 증여하는 날의 시가 공시 시가 감정가 등을 입력한다 , , .

□ 증여 금액에 포함되어 있는 증여받는 사람의 교육비 등은 ? [ 2,000


만원 ]

□ 증여 금액에서 증여받는 자가 나중에 지불해야 하는 채무 성격의 금


액은 만원 ※증여받은 건물의 임대보증금 등을 입력한다
? [ 5,000 ] .

□ 귀하가 년 전부터 지금까지 증여받는 사람에게 제공한 금액의 합


10
은 만원 ? [ 12,000 ]

□ 증여세를 납부하기 위한 부동산 감정평가 비용은 만원 ? [ 300 ]

증여세 : 5,382만원
▶ 관계 법령 상속세 및 증여세법 제 조 같은 법 시행령 제 조
: 333 , 444

▶ 계산 결과
만원 증여금액
- 24,000 만원 불산입재산
( 만원 채무부담액 ) - 2,000 ( ) - 5,000 ( )
만원 증여재산 가산액
+ 12,000 만원 공제액 만원 감정
( ) - 3,000 ( ) - 300 (
평가 수수료 억 천 백만원 ) = 2 5 7

- 만원 과세대상
[25,700 세율 만원 누진공제액
( ) X 20%( ) - 1,000 ( ) ] X
만원
130% = 5,382

[그림 3-8] 법령에 기술된 산식 계산의 예

- 50 -
법령산식은 사용자로부터 텍스트나 데이터 값을 입력받거나 다수의 항목
에서 사용자가 선택한 항목에 따라 산식을 계산하는 것이 대부분이기 때문
에 많은 도구나 복잡한 함수없이 구현이 가능할 것으로 예상하고 있다 .

일반 문서를 작성할 때 사용하는 엑셀 등과 같이 웹 상에서 텍스트


VBA

상자 명령 단추 선택 버튼 라디오 버튼 레이블
, , ( 리스트 박스 등의
), (Label),

도구 상자와 산식을 간단하게 처리할 수 있는 논리 텍스트 날짜 및 시간 , , ,

수학 함수를 구현하고 사용자가 입력한 변수와 데이터 테이블을 구성할 수


,

있도록 환경을 구현하여 제공할 것으로 보인다 .

[ 그림 3-9] 법령계산 개발 환경 구성도


이러한 개발 환경에서 법령산식 계산 제작자가 도구와 함수 데이터 테이 ,

블을 이용하여 프로그램을 개발하고 이를 출력한 결과물 사용자 화면 을 법


, ( )

령용어 온톨로지와 연결함으로써 간단한 법령산식 프로그램을 제작할 수 있

- 51 -
으며 일반 사용자는 법령용어와 그 연관어 등을 검색하거나 법령 질의응답
,

서비스를 활용하는 과정에서 법령산식 계산 프로그램을 활용될 수 있다 .

3.5.7 국내 외의 법령, 판례 등에 대한 번역

시맨틱 기술을 직접적으로 이용하는 것은 아니지만 법령정보 온톨로지를


이용하여 기존의 업무처리 절차나 기간 등을 획기적으로 개선하거나 단축할
수 있는 서비스가 있다 우리 나라의 법령 판례를 외국어로 제공하고 다른
. ,

나라의 법령정보를 우리 나라 언어로 번역하여 제공하는 것이다 우리 나라 .

에 대한 외국인의 국내 교육 관광 의료 투자 등이 빈번하여 국내 외 기
, , , ․

업 및 공공기관으로부터 법령이나 판례 등에 대한 외국어 서비스 수요가 지


속적으로 증가하고 있다 또한 국내 기업의 해외 투자를 촉진하고 내국인의
.

해외 여행 관광 및 교육 등을 지원하며 정부정책의 수립 및 입법 등을 지
, ,

원하기 위해 다른 나라의 법령 판례 등을 제공하는 것이 필요하다


, .

그러나 외국의 법령이나 판례 등이 다양한 언어로 기술되어 있어 어렵게


수집해서 행정기관이나 민간기업 등에 제공한다고하더라도 검색하고 이해하
기가 어렵다 유럽이나 중국의 경우 구글에서 제공하는 번역기를 이용하여
.

언어 장벽을 극복하고 다른 언어로 작성된 인터넷 문서를 활용할 수 있으나


우리나라와 일본 등은 아직까지 유럽이나 중국 등의 인터넷 문서를 활용할
수가 없어 인터넷의 섬으로 고립된 상태이다 .

이러한 문제를 해결하기 위해서 그 동안 민간기업이나 대학 연구소 등에 ,

서 단어나 형태소 분석 중심의 번역을 시도해 왔지만 성과는 그다지 크지


않다 최근에는 구문 분석을 통해 추출된 구나 절의 패턴을 데이터베이스에
.

저장하고 통계기법 등을 이용하여 번역하는 기법이 시도되고 있다 .

- 52 -
그림
[ 3-10] 법령문장 번역 데이터베이스 구성도
법령이나 판례 등도 문장의 구와 절의 패턴을 분석하여 문장 온톨로지를
구축하는 것이 불가피하기 때문에 이 과정에서 문장의 구와 절에 해당하는
영문을 데이터베이스로 구축하고 한글 법령 문장 온톨로지에 연결하게 되면
패턴 분석을 통한 통계 기법을 활용하여 법령이나 판례 등을 양방향으로 정
확하게 번역할 수 있을 것이다 .

3.5.8 법제 분야에서의 법령안 작성 및 검토 지원


입법 분야에서 법령안을 작성하고 검토하는데 시맨틱 기술이 활용될 여지
가 많다 법령을 새로 입안하는 경우 입안자의 입법 의도를 파악하여 기존
.

법령이나 유사법령을 검색하여 패턴을 찾아내고 패턴에 따라 법령을 입안 ,

하도록 지원할 수 있다 .

또한 법령내용에 누락되거나 중복되는 부분은 없는지 기존의 다른 법령 ,

과 상충되는 점은 없는지 헌법에 위배되지는 않는지 조문 제목의 순서는


, ,

논리적인지 법령의 적용시기 등이 적합한지 법령의 문장이 애매하거나 너


, ,

- 53 -
무 포괄적으로 기술하고 있지는 않는지 조문 내용에 따라 법령 문장을 어 ,

떻게 표현하고 국문법에 위배되는지 여부를 점검할 수 있고 기존 법령을 ,

입법하는 과정에서 자주 문제가 발생하거나 이해관계가 복잡한 얽힌 부분을


찾아내고 해결 방안을 제시할 수 있다 아울러 법령을 개정하는 경우 이전 .

법령과의 관계나 상 하위법 등의 관계 등을 명시적으로 보여주어 전체 법


령내용의 일관성을 유지함으로써 법령안에 대한 완성도를 높이고 입법의 효


율성을 향상시킬 수 있다 .

3.5.9 법령 집행과정에서의 자료 작성 및 검토 지원
법령의 집행하는 과정에서 동일한 업무를 반복적으로 이행하는 작업 등을
보다 신속 정확하게 처리하는데 시맨틱 기술을 활용할 수 있을 것으로 보

인다 법령을 집행하는 과정에서 신 구법을 비교해 주기도 하고 법원이나


. ․ ,

경찰 검찰 등의 업무를 수행하는데 가장 유사한 판례 등을 찾아 주기도 하


,

고 자주 반복적으로 수행하는 변론서 판결문 심문조서 등의 작성을 지원


, , ,

하거나 검토하는데 활용할 수 있다 .

3.6 국내 시맨틱 서비스 작용 사례


3.6.1 IT 온톨로지 (KAIST, 한국과학연구원)
정보통신부가 주관하여 를 중심으로 개발한 온톨로지는 국가 차
KAIST IT

원에서 국내 분야 및 국제 표준으로 활용할 수 있는 국가 온톨로지를


IT IT

- 54 -
만들고자 분야 전문용어 전문가
IT 및 상용제품을 대상으로
, , H/W S/W,

온톨로지를 구축하였다 .

온톨로지를 기반으로 시맨틱 서비스를 구현하여 국가의 성장동력을 발굴


하고 이를 통해 일자리를 창출할 수 있는 기회를 마련하기 위해 시범 사업
으로 추진하였으나 주관기관의 해체 및 사업의 연속성 부족으로 현재는 활
,

용도가 미미한 상태이다 .

[ 그림 3-11] IT 온톨로지 인프라 개념도


IT온톨로지는 정부차원에서 의욕을 가지고 추진하였다는 의미를 가지고
있으나 온톨로지를 활용하여 시맨틱 서비스를 적용할 수 있는 활용 분
, IT

야와 수요가 부족하였고 온톨로지를 지속적으로 유지 및 관리하여야 하는


,

문제에 대해서 소홀했다는 지적을 받고 있다 .

- 55 -
3.6.2 연구정보 온톨로지 (KISTI, 한국과학기술정보연구원)
에서 개발한 국가
KISTI 기반정보 온톨로지는 연구정보를 온톨로지 R&D

화하여 저장하고 이를 효과적으로 검색하여 연구가 중복되지 않도록 하고


기존 연구 정보를 효과적으로 열람할 수 있도록 하였다 .

[ 표 3-4] 연구정보 온톨로지 주요 클래스


▶ 저작물 (Outcome) ▶ 발간지 (Publication)

학술논문 - (Paper) 학술지- (Journal)

학위논문 - (Thesis) 학술대회논문집


- (Proceedings)

보고서 - (Report) ▶ 연구영역 (ResearchDomain)

특허 - (Patent) 주제영역
- (TopicDomain)

▶ 기관 (Institution) 분야영역
- (CategoryDomain)

▶ 부서 (Department) ▶ 키워드 (Keyword)

▶ 인력 (Person) 주제키워드
- (TopicKeyword)

▶ 과제 (Project) 분야키워드
- (CategoryKeyword)

▶ 저작정보 (CreationInformation)

이 프로젝트는 국가 기반정보 온톨로지 구축 학술정보 온톨로지 및


R&D ,

RDF구축 온톨로지 기반 추론 시스템 개발을 기본적인 구축 목표로 하고


,

있고 약 개의 온톨로지 클래스가 사용되었다


, 100 .

3.6.3 국가 조달 표준(전자상거래) 온톨로지 (조달청)


조달청에서 개발한 국가 표준온톨로지 시스템은 온톨로지를 이용하여 조
달 상품검색을 효과적으로 지원하기 위한 것으로 전자상거래 활성화를 위 ,

- 56 -
해 각급 행정기관과 민간업체의 카달로그 상품정보 상호 연관정보 등을 국
, ,

가 표준 상품 온톨로지로 구축 및 활용하고 있다 .

그림
[ 3-12] 조달청 지능형상품정보시스템 화면

- 57 -
제 4 장 법령정보 시맨틱 검색 방법론

4.1 법령정보 검색 서비스 개선 방안


키워드 검색 방법은 사용자의 검색 의도와는 관계없이 질의어와 매칭되는
정보를 무조건 제공하기 때문에 질의어와 관련된 검색 결과가 너무 많거나 ,

전혀 발견할 수 없는 경우가 발생하기도 하고 사용자가 원하지 않는 정보 ,

를 제공하는 등 인터넷 정보에 대한 검색의 효율성 측면에서 많은 단점을


가지고 있다 .

이와 같이 법령정보에 대한 키워드 검색 방식의 문제점과 메타데이터 및


시소러스 활용의 한계 등을 극복하고 법령정보에 대한 사전 지식이 없는 사
용자가 일상생활에서 사용하는 생활용어로 법령정보를 검색할 수 있도록 지
원하는 방안으로 법령정보 시맨틱 검색 서비스 모습을 제시한다 .

이 검색 방법을 통해 얻고자 하는 세부 목표는 사용자가 입력한 주제어를


법령내용에서는 어떤 법령용어를 사용하여 기술하고 있는지를 쉽게 알 수
있도록 지원하고 주제어와 관련된 동의어 유의어 반의어 전체어 부분어
, , , , / ,

행위어 종류 등을
, 방식으로 제공하여 법령정보의 검색 범위를
Top-down

축소시키켜 보다 빠르고 정확하게 법령이나 조문을 검색할 수 있도록 서비


스하는 것을 목표로 한다 .

또한 주제어와 연관어 사용자의 검색결과 등을 활용하여 사용자가 찾고


, ,

자 하는 법령의 조문 목록을 제공하고 조문내용과 관련된 행정규칙 자치법 ,

규 판례 등을 한꺼번에 제공할 수 있어 법령정보를 검색하고 이해하기 위


,

해 각각의 법령정보를 검색하는 불편을 최소화하는 것이다 .

- 58 -
[ 그림 4-1] 법령정보 시맨틱 검색 서비스 화면 예시
아울러 사용자의 법령정보 검색 결과에 대한 통계를 추출하여 분석하고
,

주제어와 관련된 연관어를 체계적으로 관리하여 인기 연관어 서비스로 활용


한다든지 단순 검색 결과에 우선 순위를 부여하는데 검색에 활용할 수 있도
록 제공하는데 있다 .

향후 특정한 생활분야와 관련된 법령 질의 응답 서비스 등 법령정보 서․

비스 전반에 시맨틱 기술을 적용하여 지능형 서비스를 제공하기 위해서는

- 59 -
해당되는 법령 문장을 정확하게 검색하는 것이 매우 중요하기 때문에 이와
같은 생활용어 기반의 법령정보 검색 방식은 많은 영향을 미칠 수 있는 가
장 중요한 인프라로 작용할 수 있다
IT .

예를 들어 사용자는 아파트를 구입하고 취득세를 납부하여야 한 경우에


,

취득세와 관련된 법령정보를 검색한느 경우 사용자가 아파트 라는 주제어 , “ ”

를 입력하면 법령정보시스템은 아파트와 관련된 법령용어와 연관어를 지도


맵 형태로 제공한다 그리고 아파트 라는 용어를 부동산 으로 기술하고
( ) . “ ” “ ”

있음을 보여주고 부동산 이라는 주제어와 관련하여 사용자가 무엇을 원하


“ ”

는지를 알기 위해 연관어를 제공해 준다 이 때 사용자가 아파트와 관련된 . ,

연관어 취득세 를 선택하는 경우 법령정보시스템은 아파트 라는 용어를


, “ ” “ ”

“부동산 이라는 용어로 해석하고 취득세 를 연결하여 법령정보를 검색하


” “ ”

고 검색 결과를 조문 단위로 제공해 주는 방식이다 .

4.2 법령정보 시맨틱 검색 서비스 모델


일상생활에서 사용하는 생활용어로 법령정보를 검색하기 위해서 법령정보
시맨틱 검색 서비스 모델을 제안한다 .

법령용어 연계모델은 법령용어사전 법령정보로부터 법령용어를 추출하고 ,

계층적으로 법령용어를 연결할 수 있도록 구성한다 또한 생활용어 연계 모 . ,

델은 인터넷에서 웹 문서를 수집하여 일상생활에서 사용하는 생활용어를 추


출하고 생활용어를 계층적으로 연결할 수 있도록 구성한다 .

아울러 법령정보 연계 모델은 법령정보의 상하위 관계 및 신구법 관계


, ,

법령 조문과 조문의 연계 관계 법령정보와 판례정보의 연계 관계 등 법령


,

- 60 -
체계도 정보를 분석하고 법령용어와 연계성을 가질 수 있도록 각각의 연계
모델을 구성한다 .

[그림 4-2] 법령정보 시맨틱 검색 서비스 모델


마지막으로 법령용어와 생활용어 법령체계도를 서로 밀접하게 연계할 수
,

있도록 법령체계도에 법령용어를 추가하고 법령용어에 생활용어를 추가하


,

는 방식으로 전체 법령용어 의미통합 연관 모델을 완성한다 .

법령용어 온톨로지를 이용하여 생활용어로 법령정보를 검색하는 부분은


사용자 질의어를 분석하여 검색에 필요한 용어를 추출하는 과정 사용자 질 ,

의어를 해석하여 주제어와 연관어를 서로 연결하는 과정 추출한 주제어와 ,

연과어를 법령용어로 확장하는 과정 법령용어로 전환된 주제어를 이용하여


,

법령정보로부터 정확한 법령정보를 조회하는 과정을 서로 연결하여 전체 시


스템 구축에 필요한 시맨틱 검색 모델을 구성하다 .

- 61 -
4.3 검색 서비스 개선을 위한 기술 적용 방안
4.3.1 법령정보 시맨틱 검색 시스템 설계 방안
생활용어 기반으로 법령정보를 검색할 수 있는 시맨틱 검색 시스템은 설
계 방향을 제시한다 법령정보 시맨틱 검색 서비스는 법령용어나 생활용어
.

를 추출하여 법령용어 온톨로지를 구축하는 부분과 사용자의 질의어를 해석


하고 법령용어 온톨로지를 활용하여 사용자 질의를 확장하여 법령정보를 시
맨틱 검색하는 부분으로 구성한다 .

그림
[ 4-3] 법령정보 시맨틱 검색 시스템 구성도
법령용어 추출 및 온톨로지를 구축하는 부분은 법령명이나 메타데이터를

- 62 -
입력하여 인터넷에서 웹 문서를 수집하는 기능 법령정보나 웹 문서를 구성 ,

하고 있는 문장을 대상으로 형태소 및 구분을 분석하여 용어를 추출하고 분


류하는 기능 문장에서 추출한 용어에 대한 상호 연관성을 분석하여 유사
,

주제어 및 연관어를 추출하고 군집하는 기능 법령용어 및 생활용어의 상호 ,

연관성 분석 및 시맨틱 정보 검색 기능 트리플을 저장하고 시맨틱 메타데 ,

이터 등을 관리하는 기능 등으로 구성하여 연결한다 .

사용자 질의를 확장하여 법령정보를 시맨틱 검색하는 부분은 사용자의 질


의를 해석하고 주제어 및 연관어를 추출하는 기능 온톨로지로부터 주제어 ,

와 연관어의 관계를 해석하는 기능 온톨로지를 활용하여 주제어 및 연관어


,

를 확장하는 기능 확장된 주제어를 이용하여 결합하여 법령정보를 검색하


,

는 기능 등으로 구성하여 전체 시스템을 완성한다 .

4.3.2 법령용어 추출 및 온톨로지 구축 방안


생활용어 기반의 법령정보 시맨틱 검색 시스템을 구축하기 위해서는 법령
용어 온톨로지 구축이 필요하다 또한 생활용어와 법령용어는 항상 생성 활
. ,

용 소멸 등 라이프 사이클을 가지고 있기 때문에 주기적으로 수집하여 추


,

출하고 온톨로지를 반영하여 관리되어야 한다 .

하지만 생활용어나 법령용어의 범위가 넓고 수만 건에 달하고 있어 이를 ,

수작업으로 관리하는 것은 불가능하다 이와 같은 문제는 시소러스를 구축


.

및 관리하여 검색 등에 활용하는데 나타난 동일한 문제점이기도 하다 .

이에 따라 생활용어와 법령용어를 자동으로 추출하여 구축하는 방안을


,

제안한다 법령용어는 법령이나 판례 법령용어사전 등 법령정보를 대상으로


. ,

법령용어를 추출하고 생활용어는 인터넷에서 수집한 법령정보와 관련된 웹


,

- 63 -
문서나 각급 행정기관에서 제공하는 행정정보 법령과 관련된 질의 응답사 , ․

례 등 민원답변사례 등을 대상으로 생활용어를 추출하는 방식으로 용어를


추출할 수 있다 참고로 인터넷 웹 문서 수집 법령용어 온톨로지의 구축
. , ,

및 관리 법령 문장이나 웹 문서 분석을 위한 형태소 및 구문 분석 등을 위


,

한 기능은 이미 인터넷 상에서 공개된 소스가 존재하거나 상용 패키지 형태


로 공급되고 있기 때문에 여기서는 별로 언급하지 않는다 .

[ 그림 4-4] 생활 법령용어 추출 프로세스


/

첫번째 단계는 법령용어의 기반이 되는 법령용어사전 등을 분석하여 법령


용어와 그 연관어나 동의어 등을 추출하고 법령용어 온톨로지에 계층적 구
조로 저장한다 .

두번째 단계는 법령으로부터 법령명 편 장 절 관과 조문 제목으로 주 , ․ ․ ․

제어를 추출한 다음에 법령문장을 구문 분석하여 연관어를 찾아내고 이를

- 64 -
법령용어 온톨로지에 추가하여 법령용어 온톨로지를 구성할 수 있다 이 때 .

문장으로부터 주제어를 찾고 주제어와 관련된 연관어는 항상 같은 문장에


동시에 포함되어 있다는 법령정보의 특성을 감안하여 제안한다 .

세번째 단계는 판례나 인터넷 웹 문서로부터 생활용어를 법령용어와 동일


한 방식으로 추출하고 법령용어에 추가하게 되면 생활용어와 법령용어가 서
로 연결하여 전체 법령용어 온톨로지를 구성할 수 있다 이 때 인터넷 웹 .

문서를 수집하는 방법은 법령명이나 법령의 메터데이터를 결합하여 검색하


는 방식을 제안한다 .

4.3.3 생활용어 추출 및 법령용어와 연계 방안


법령용어 온톨로지를 계층적 구조로 구축하는데 있어 용어간의 상하관계
를 명확하게 규명하여 구축하는 것이 매우 중요하다 이는 법령용어를 구축 .

하는 단계에서도 규명할 수도 있고 법령정보를 실제 검색하는 과정에서도


상하관계를 밝혀서 보정할 수 있다 .

법령용어의 상하 관계를 규명하는 방법은 주제어와 관련된 하위 용어나


연관어가 서로 동일한 경우 즉 개의 용어가 서로 강한 친밀도를 가지고
, 2

있는 경우에는 용어의 의미가 서로 동일하다고 간주하여 동의어나 유사어 ,

전체어 부분어 상위어 하위어 등으로 간주하여 연결하고 서로 다를 경우


/ ( , ) ,

에는 상위 또는 하위 관계나 연관어의 관계를 파악하여 계층적 관계를 확인


할 수 있다 또한 한 개의 용어를 다른 용어에 추가하는 경우 개 용어의
. 2

연결 결과에 대한 적합성을 평가하고 그 결과를 활용하여 법령용어에 대한


계층적 구조의 완성도를 높여 가도록 시스템을 구현한다 .

이와 같은 구현 방법을 참조하여 부동산과 관련된 법령정보와 법령용어

- 65 -
등으로부터 부동산 과 관련된 다양한 용어를 수집하고 용어와 연관어의 관
“ ”

계를 파악하여 단순 형태의 법령용어 온톨로지를 예시해 보았다 .

그림
[ 4-5] 법령 생활용어간의 관계 구축 예시
/

4.3.4 사용자 질의어 확장을 통한 법령정보 검색 방안


법령용어 온톨로지를 이용하여 사용자 질의어를 확장하고 추출된 법령용
어를 이용하여 법령정보를 검색함으로써 법령정보 검색의 정확성을 제고하
기 위한 방안이다 .

법령용어 온톨로지 기반의 법령정보 검색 방안은 사용자 질의 해석 용어 ,

의미 연관성 해석 사용자 질의 확장 법령정보 검색 등의 단계로 구성한다


, , .

- 66 -
첫번째 단계는 사용자 질의어를 분석하여 해석하는 단계이다 사용자의 .

질의어는 주제어나 연관어 형태일 수도 있고 자연어 형태의 문장일 수 있


다 자연어 형태의 질의 문장인 경우 문장에 대한 형태소를 분석하여 문장
.

속에 포함된 용어를 추출하고 그 용어가 법령용어 온톨로지에 포함되어 있


,

으면 그 용어를 사용자 질의어로 출력하도록 구현한다 .

[그림 4-6] 온톨로지를 활용한 법령정보 검색 프로세스


두번째 단계는 용어의 의미 연관성을 해석하는 단계이다 사용자 질의어.

로부터 추출된 용어와 그 상위어로 연결된 용어를 찾는 방법으로 최상위 용

- 67 -
어까지 상위어를 연속해서 추적하고 이 과정에서 추출된 용어를 상위어 하 , /

위어 관계로 그룹핑한다 이 때 최상위 단계에 있는 용어는 그룹과 그룹을


.

연결하는 용어를 말한다 .

세번째 단계는 사용자 질의어를 확장하는 단계이다 각 용어 그룹에서 생 .

활용어를 제거하고 각 그룹에 포함되어 있는 용어를 모두 조건으로 AND

결합하여 확장한 질의어로 활용한다 그리고 이 확장된 질의어로 법령정보 .

를 검색하여 결과가 나타나지 않으면 전체 질의어에서 그룹별로 최하위어를


하나씩 제거하고 다시 법령정보를 검색하는 방식으로 최종 확장된 질의어를
결정하는 모듈을 구현한다 .

네번째 단계는 최종 확장된 질의어를 이용하여 법령정보를 법령단위와 조


문단위로 검색하는 단계이다 먼저 확장된 질의어로 법령정보를 법령 단위
.

로 검색한 다음에 그 결과로 산출된 법령정보를 대상으로 다시 조문을 검


,

색할 수 있는 시스템을 구현한다 이 때 법령 조문에 대한 검색은 최종적으.

로 선택된 용어를 각 그룹별로 분리하고 그룹과 그룹의 각 용어를 일대일



(1:1) 조건으로 연결하여 법령의 조문 검색에 활용한다
AND .

4.4 법령분야 시맨틱 서비스 구현 사례


4.4.1 법제정보 시맨틱 검색 서비스 - iLAW시스템 법무부 ( )

국내 외의 법제정보를 입체적으로 분석하고 제공하여 효율적인 입법과


법제연구를 지원하기 위해 추진되었으며 우리나라 미국 일본 등 국 , , , EU, ․

내외의 입법정보 법령 판례 논문 민원처리결과 등을 법제정보의 종류에


, , , ,

- 68 -
따라 통합 검색하여 시각적으로 제공하는 시스템이다 .

국내 외의 다양한 법제정보에 대한 접근 및 검색 경로를 제공하여 사용


자가 특정 주제어와 관련된 법제정보가 어디에 어떤 내용으로 존재하고 있


으며 법제정보의 동향을 파악할 수 있도록 안내자 역할에 수행하고 있다
, .

그림
[ 4-7] 법무부 iLAW 시스템 검색결과 화면
이 시스템은 구글 네이버 등과 같이 키워드와 일치하는 정보를 제공하는
,

데 그치지 않고 검색어를 이용하여 찾은 정보를 컴퓨터가 스스로 분석하고


,

추론하는 지능형 서비스를 제공하고 있다 특정 분야의 전문가가 아니라도 .

- 69 -
키워드와 관련된 법제정보를 입체적으로 파악할 수 있도록 국가별 법제정보
지도 다차원정보 동향정보 전문가정보 연관어 정보 등을 상세히 확인할
, , , ,

수 있도록 제공하고 있으며 특정 키워드에 대한 검색결과가 나타나지 않거


,

나 검색되는 정보가 부족한 경우에 검색되는 자료의 양을 확대하여 사용자


의 만족도를 높여 주는 기능을 갖추고 있다 .

특정 분야의 전문가가 아니라도 키워드와 관련된 법제정보를 입체적으로


파악할 수 있도록 국가별 법제정보지도 다차원정보 동향정보 전문가정보
, , , ,

연관어 등을 상세히 확인할 수 있도록 제공하고 있으며 특정 키워드에 대 ,

한 검색결과가 나타나지 않거나 검색되는 정보가 부족한 경우에 검색되는


자료의 양을 확대하여 사용자의 만족도를 높여 주는 기능을 갖추고 있다 .

그림
[ 4-8] iLAW 시스템 다차원정보 서비스 화면
또한 법제정보에 대한 검색의 효율성을 제고하기 위해 다차원정보를 구
,

축하여 용어 서비스 및 정보 검색 등에 활용하고 있다 이러한 다차원정보 .

- 70 -
는 마이닝 기법 등을 이용하여 다양한 정보를부터 주제어와 연관어 등을 자
동으로 추출하거나 시소러스 등으로부터 추출한 연관어의 집합으로써 사용 ,

자가 특정 주제어와 관련된 연관어를 법령기준 판례기준 논문기준 “ ”, “ ”, “ ”

등으로 분류하여 쉽게 확인하거나 연관어를 이용하여 법제정보를 용이하게


검색할 수 있도록 지원하는 시맨틱 서비스이다 .

4.4.2 이탈리아의 JurWordNet 법률정보 이론과 기술 연구소


( )

비전문가인 사용자들이 온라인상의 법률 정보 검색을 하고자 할 때 대부 ,

분 일상용어로 검색을 시도하고 법률용어와 일상용어의 차이로 인해 올바른


검색이 행해지지 않는다는 아이디어로부터 시작되었다 .

[그림 4-9] 이탈리아


홈페이지 화면 JurWordNet

은 언어의 형태와 상관 없이 데이터와


JurWordNet(http://www.ittig.cnr.it)

정보에 의미적으로 접근하기 위한 도구로 법률 어휘의 의미와 이들 의미 간

- 71 -
의관계를 정의한 법률 어휘 온톨로지이다 이 온톨로지는 일반 어휘 혹은 .

다른 나라 언어와 관계하는 이탈리어의 법률 용어의 의미를 찾음으로써 법


률 정보 검색 및 정보 공유를 목표로 한다 .

4.4.3 유럽 공동체의 LKIF-CORE, LKIF-Extended 온톨로지


LKIF-CORE, 온톨로지
LKIF-Extended (http://www.estrellaproject.org/

는 기본적인 법률 용어의 표준을 정의하고 정의된 용어를 서로


lkif-core/) ,

다른 지식기반 시스템 간 정보 교환을 위해 사용한다 이 온톨로지는 .

법령이나 인간의 상식의 도메인으로부터 밀접히 연관된 법 개념


ESTRELLA

과 의미 관계를 나타내는 온톨로지의 집합으로 구성된다 이 프로젝트는 약 .

개의 온톨로지 클래스를 이용하고 있고 유럽 공동체의 국가들 간에 법


200 ,

령 지식 교환을 통한 법 집행의 효율성 제고를 목표로 한다 .

4.4.4 법령 번역을 지원하는 Legal WordNets 유럽 각국의 언어 구성된


(

법률 관련 어휘망 )

유럽공동체에서 LOIS(Lexical Ontologies for Legal Information Sharing)

과제로 추진하고 있는 은 유럽 각국의 법률정보와 판례정보


Legal WordNets

를 언어의 장벽 없이 공유 이해와 해석 하기 위해 구축한 온톨로지이다


( ) .

현재 이탈리아 영국 독일 체코 포르투칼 네덜란드 등 개국이 참여하


, , , , , 6

여 추진하고 있는 프로젝트로 유럽 각국의 법률 정보를 언어의 장벽 없이


공유하는 것을 목표로 한다 .

4.4.5 네델란드의 BARTINA 당사자 합의 법률 온톨로지 ( )

- 72 -
법률 온톨로지는 피해분쟁을 해결 및 중재하는 사례법을 상담
BARTINA

하는 프로그램 개발을 목표로 한다 사용자가 자연어로 자신의 사례를 설명


.

하면 로봇서비스는 이에 유사한 사례와 판정 근거 등의 정보와 추론결과


,

설명 를 제공함으로써 사용자가 조정이나 유리한 입장을 정하도록 도와주


( ) ,

는 서비스이다 이 온톨로지는 피해 분쟁관련 법률 온톨로지와 일반인 질의


.

어 온톨로지로 구성된다 .

4.4.6 법률 온톨로지 검색 서비스 COGNITION


는 자연어질의 사건 관련 입력에 대해
Giving technologies new meaning ( )

관련된 판례 정보를 검색해주는 서비스이다 ※ . http://www.ittig.cnr.it

그림
[ 4-10] 애플 특허 제소 사례 검색 화면

- 73 -
그림
[ 4-11] 특허 제소 사례 내용 조회 화면
4.4.7 포르트갈의 Portuguese attorney general 법무부 정보검색시스템
( )

은 자연어 처리 기술과 멀티 에이전트 기술을


Portuguese attorney general

이용한 정보 검색 시스템이다 예를 들어 자연어 처리 기술과 온톨로지와


.

같은 질의 분야의 지식을 이용하여 질의 의도를 파악하고 사용자와 소통을 ,

하며 사용자에게 필요한 정보를 찾아주는 등의 작업을 수행한다 .

- 74 -
제 5 장 시스템 구현 및 평가

5.1. 법령정보 시맨틱 검색 시스템 구현


5.1.1 시스템 구현에 필요한 환경
이 논문에서 제안한 법령정보 시맨틱 검색 시스템을 구현해 보기 위해
법령용어 및 생활용어를 추출하여 법령용어 온톨로지를 구성하는 부분과 법
령용어 온톨로지를 이용하여 생활용어로 법령정보를 검색할 수 있는 법령정
보 시맨틱 검색 시스템 부분으로 나누어 구현하였다 .

법령정보 데이터베이스 스키마 구조는 기존 법령정보 구조와 동일하게 조


문단위로 법령정보를 저장하고 검색할 수 있도록 설계하였고 는인 , DBMS

터넷에서 제공하는 오픈소스를 이용하여 구성하였다 .

[ 표 5-1] 법령정보 시맨틱 검색대상 목록


법률 시행령 시행규칙

조세특례제한법 조세특례제한법 시행령 조세특례제한법 시행규칙


종합부동산세법 종합부동산세법 시행령 종합부동산세법 시행규칙
지방세기본법 지방세기본법 시행령 지방세기본법 시행규칙
지방세법 지방세법 시행령 지방세법 시행규칙
지방세특례제한법 지방세특례제한법 시행령 지방세특례제한법 시행규칙
국세와 지방세의 조정 등에 관한 법률

- 75 -
또한 시스템 구현 및 실험을 위해 필요한 법령정보는 표 과 같이
, [ 5-1]

“부동산 과 취득세 등과 관련된 법령정보 건을 수집하여 로 구축하


” “ ” 16 DB

였다 생활용어는 로 구축한 법령정보의 법령명과 그 법령의 주요 키워


. DB

드를 이용하여 인터넷에서 웹문서를 수집하였다 .

법령용어를 추출하고 용어와 다른 용어의 연관성을 밝혀내기 위해 검색대


상 법령정보를 한 곳에 통합하고 문장 단위로 분리하였고 법령정보 검색엔 ,

진에 사용하고 있는 법령정보색인사전과 기반의 로 개발한 Java NetBeans

꼬꼬마 형태소 분석기 서울대학교 지능형데이터베이스 연구실에서 개발 를 ( )

이용하였다 .

법령용어는 법령명 편 장 절 관 및 조문의 제목 항의 내용을 대상으, ․ ․ ․ ,

로 추출하였으며 호 목의 내용이나 항의 단서 등의 내용은 용어 추출 대


, ․

상에서 제외하였다 법령 문장에 대한 형태소를 분석하여 단어를 추출하고


.

법령정보색인사전에 포함되어 있지 않거나 중복되는 용어도 제거하였다 .

또한 법령정보에 포함되어 있는 모든 용어의 상호 연관성을 통계적으로


,

분석하기 위해 문장 단위로 용어별 를 분석하여 특정 용어와 Co-Occurrence

다른 용어와의 관계를 규명하였다 하지만 생활용어는 웹 문서에서 포함된 .

문장에서 명사의 어미를 강제적으로 분리하고 법령용어와 중복성을 제거하


여 추출하였으며 법령용어와의 연관성은 수작업으로 임의로 구성하였다
, .

이와 같이 구성된 법령용어와 관계를 법령용어 온톨로지로 구축하기 위해


서 미국 스탠포드대학교에서 개발하여 오픈소스로 제공하고 있는 를 Protégé

사용하여 법령용어 도메인을 모델링하였고 법령용어와 생활용어 용 OWL , ,

어의 관계는 온톨로지 형태
SKOS(Simple knowledge Organization System)

로 표현하였다 .

또한 , 를 이용하여
JAVA 형태의 온톨로지를
Netbeans SKOS Smart

- 76 -
의 트리플 모델로 변환하고 인스턴스를 생성하여
Engine Smart DB(Legal

에 저장하였다 그림
Ontology) 의 온톨로지 구성 결과를 보
. [ 5-1] Smart DB

여주는 모습이며 이를 통해 법령용어와 생활용어가 서로 계층적으로 연결


,

된 모습을 알 수 있다 .

그림
[ 5-1] SKOS 기반 법령용어 온톨로지 구성 결과
5.1.2 용어 의미의 연관성 해석
사용자 질의어는 단어 형태로 입력받을 수 있도록 구현하였으며 사용자
질의어를 법령용어 온톨로지를 이용하여 상위어를 최상위 용어까지 연속해
- 77 -
서 추적하고 질의어의 상위어를 모두 모아서 출력하고 이를 그룹핑하도록
,

구현하였다 그림 는 사용자 질의에 대한 연관성 의미 해석 결과를 보


. [ 5-2]

여주기 위해 을 이용하여 구현한 검색창과 결과를 보기 위한 사


JSP/Tomcat

용자 페이지이다
View .

[그림 5-2] 용어 의미의 연관성 해석 결과


사용자가 빌라 와 취등록세금 를 입력하고 각 용어별로 의미의 연관성
“ ” “ ”

을 분석하여 그룹별로 보여주고 있다 빌라 는 빌라 연립주택 공동주 . “ ” “ - -

택 주택 건축물 부동산 으로 취등록세금 은 취득세금 취득세 로


- - - ” , “ ” “ - ”

그룹핑되어 있음을 보여주고 있다 .

- 78 -
5.1.3 사용자 질의 확장
용어 의미에 대한 연관성 분석을 통해 산출된 용어의 그룹과 그룹이 특정
한 연관어로 연결되어 있는지 확인하고 연관어가 있는 경우 그 연관어의
,

상위어가 그룹을 연결하고 있지 않으면 용어 그룹에서 그 상위어를 제거하


였다 .

그림
[ 5-3] 사용자 질의 확장 및 검색 절차
각 그룹에 포함되어 있는 생활용어를 제거하여 용어의 그룹을 만들고 각 ,

그룹에 포함되어 있는 모든 용어를 조건으로 결합하여 사용자 질의어


AND

를 확장하였다 .

- 79 -
또한 법령정보 검색에 필요한 질의어의 효용성을 확보하기 위해서 확장
,

된 질의어를 입력하여 법령본문을 검색하여 법령정보 검색건수가 건 이상 1

이면 질의어가 유효하다고 간주하고 검색결과가 없으면 검색 가치가 없는 ,

질의어로 간주하여 다시 각 그룹별로 교대로 최하위어를 제거하고 다시 질


의어를 만들어지도록 구현하였다 .

그림 는 법령정보를 검색할 수 있도록 사용자 질의어를 법령용어로


[ 5-3]

확장는 하는 전체적인 절차를 그려 보았다 먼저 빌라 와 취득세금 이 생 . , “ ” “ ”

활용어이기 때문에 각 그룹에서 제거하여 각 용어의 그룹이 완성되었고 그 ,

룹과 그룹을 연결하여 사용자 질의어 빌라 와 취득세금 을 연립주택 “ ” “ ” “ &

공동주택 주택 건축물 부동산 취득세 로 확장되었다


& & & & ” .

그러나 연립주택 공동주택 주택 건축물 부동산 취득세 로


, “ & & & & & ”

법령본문을 검색한 결과가 나타나지 않아 부동산 용어 그룹에서 최하위어 “ ”

“연립주택 를 제거하고 다시 법령정보를 검색하여 사용자 질의어가 최종적


으로 공동주택 주택 건축물 부동산 취득세 로 확장되었음을 나


“ & & & & ”

타내었다 .

5.1.4 법령정보 시맨틱 검색


법령정보 검색어로 확정된 질의어를 입력하여 법령정보를 검색하고 그 검
색결과를 대상으로 조문을 검색하도록 구현하였다 이 때 조문 검색은 그룹 .

에 포함되어 있는 용어와 다른 그룹의 용어를 일대일 로 결합하고 이를 (1:1)

합하여 조문 검색결과로 출력되도록 구현하였다 이 때 법령정보는 제 장에 . , 3

서 기술한 바와 같이 조문의 항 내용은 조문 제목의 실제 내용을 기술하고


있고 호 목의 내용은 항의 내용에 대한 조건 단서 예외사항 상세 종류
, ․ , , , ,

- 80 -
등을 기술하는 특징이 있기 때문에 법령 편 장 절 관 및 조문의 제목 ․ ․ ․ ,

법령정보의 메타데이터 조문의 항 내용을 대상으로 조문을 검색하도록 구


,

현하였으며 법령의 항 내용에 포함되어 있는 호 목 및 단서의 내용 법령


, ․ ,

명이나 괄호의 내용은 검색 대상에서 제외되도록 하였다 .

[ 그림 5-4] 법령정보 시맨틱 검색 결과


[ 그림 5-4] 는 법령용어 확장한 결과를 입력하여 법령정보와 조문을 검색한

- 81 -
결과를 보여주는 모습이다 법령정보를 검색하기 위해 질의어로 공동주택 . [

& 주택 건축물 부동산 취득세 을 입력하여 검색하였고 조문에 대


& & & ] ,

한 검색은 공동주택 취득세 주택 취득세 건축물 취득세 부동


[ & ], [ & ], [ & ], [

산 취득세 을 입력하여 각각 결과를 출력하고 이를 모두 합하여 산출된


& ]

검색결과로 보여주고 있다 .

5.2. 평가
법령정보 시맨틱 검색 방법의 효과를 알아보기 위해 이 논문에서 선정한
개 법령정보를 대상으로 법령정보를 검색하여 비교해 보았다
16 .

먼저 키워드 방식으로 법령정보를 검색해 보면 사용자가 입력한 질의어 ,

로 빌라 취득세금 를 입력하여 검색한결과 일반국민이 자주 검색하는 법령


“ ”

제목 법령본문 조문내용 등에서 검색결과가 전혀 나타나지 않았다 또한


, , . ,

“빌라 와 취득세금 를 부동선 과 취득세 로 변환하여 입력하고 다시 검


” “ ” “ ” “ ”

색한 결과 법령제목이나 조문제목에서는 검색가 없었으나 법령본문에서는


, ,

「 조세특례제한법 지방세기본법 지방세법 지방세법 시행령 」, 「 」, 「 」, 「 」,

「 지방세법 시행규칙 지방세특례제한법 지방세특례제한법 시행 」, 「 」, 「

령 지방세특례제한법 시행규칙 등 건의 법령정보가 검색되었고 조문


」, 「 」 8 ,

내용은 건이 검색되었다 72 .

그러나 법령정보를 시맨틱 기술로 검색해 보면 법령정보는 건 조문은


, , 3 ,

5건이 검색되었다 이를 통해 법령정보 검색의 신속성 및 정확성 측면에서


.

법령정보 검색에 시맨틱 기술을 적용하는 것이 기존 키워드 검색 방식에 비


하여 보다 효과적인 방법임을 알 수 있다 .

- 82 -
하지만 법령정보 검색에 시맨틱 기술을 적용하는데 있어서 앞으로 해결해
야 할 과제도 많이 남아 있다 생활용어와 법령용어가 정확하게 연결되어
.

있지 않은 경우 법령정보 검색 결과가 전혀 없거나 너무 많은 건수가 검색


되는 등 기존 키워드 검색의 문제점을 그대로 반복하는 경향을 보였기 때문
이다.

법령용어와 생활용어를 신속하게 추출하여 법령용어 온톨로지에 반영하고


것도 중요하고 각각의 용어를 의미 기반으로 분석하여 서로 긴밀하고 정확
,

하게 연결하는 것이 법령정보의 정확성을 결정하는 가장 중요한 요인이다 .

즉 법령용어 온톨로지의 완성도에 따라 법령정보 검색의 정확성이 좌우되고


있을을 실험을 통해서 알 수 있었다 먼저 법령정보나 웹 문서로부터 다양.

한 용어를 추출하고 연관성을 분석하여 법령용어와 생활용어 등을 정확하게


연결하기 위해서는 구문 및 의미 분석 등의 작업이 선행되어야 할 것으로
보인다 특히 부동산 과 취득세 와 관련된 법령정보를 대상으로 실험하였
. “ ” “ ”

기 때문에 앞으로 전체 법령정보로 검색 대상을 확대할 경우 수만 건의 법


령용어나 생활용어를 추출하고 연결하는데 보다 더 과학적인 방법이 접목되
어야할 것으로 보인다 .

또한 이번 연구 과정에서 법령용어로 확장하여 법령정보를 검색하였더라


,

도 검색결과에 따라 정확성이 달라지고 있는 현상이 많이 발생하였다 이는 .

법령용어에 대한 확장 방법에 따라 검색결과가 많아서 법령정보 검색의 정


확성이 낮아지기도 하고 검색결과가 적어서 검색결과가 전혀 나타나지 않
,

기도 하였다 이는 법령용어로 확장하는 과정에서 확장 범위에 문제가 있음


.

을 의미한다 .

- 83 -
제 6 장 결론

6.1. 연구결과 요약
온톨로지는 컴퓨터가 정보를 이해하고 추론할 수 있도록 가공 및 처리한
지식베이스이다 또한 온톨로지 기반의 시맨틱 기술은 다양한 지능형 서비
.

스를 창출할 수 있도록 지원하는 기술이다 최근 인터넷 서비스를 개선하기 .

위한 다양한 시도가 이루어지고 있는 가운데 온톨로지를 기반으로 하는 시


맨틱 기술이 각광을 받고 있다 .

따라서 이 논문은 기존의 법령정보 서비스의 문제점을 극복하고 향후 새


,

로운 개념의 서비스를 창출하기 위해 법령정보 서비스에 시맨틱 기술 적용


방안을 제안하였다 .

먼저 법령정보의 서비스 현황과 문제점을 조사하고 법령정보의 특징을 분


석하여 법령정보가 전체적으로 시맨틱 기술을 적용하기에 적합한 분야인지
여부를 알아 보았고 법령정보 서비스에 시맨틱 기술을 활용하여 구현 가능
,

한 사례를 발굴하였다 .

또한 법령용어 온톨로지 기반의 법령정보 시맨틱 검색 시스템 구축 방안


,

을 제안하고 사용자 질의어를 온톨로지를 이용하여 법령용어로 확장하고


,

연관어를 추출하여 법령정보를 검색에 적용할 수 있도록 법령정보 시맨틱


검색 부분을 구현해 보았다 .

이를 통해 기존 키워드 검색 방법에서는 생활용어로 법령정보에 대한 검


,

색이 용이하지 않았으나 앞으로는 법령정보에 대한 사전 지식이 없더라도


,

누구나 일상생활에서 사용하는 생활용어로 법령정보를 쉽고 검색할 수 있다

- 84 -
는 것을 확인하였다 또한 사용자 질의와 관련된 연관어를 추출하여 법령정
.

보 검색에 활용함으로써 법령정보를 조문단위로 제공할 수 있고 법령정보


검색의 정확성 을 향상시킬 수 있음을 알 수 있었다
(Precision) .

6.2. 연구의 한계점 및 향후 연구방향


이 논문에서는 사용자 질의어를 온톨로지를 이용하여 법령용어로 확장하
고 연관어를 추출하여 법령정보를 검색에 적용할 수 있도록 법령정보 시맨
틱 검색 부분을 구현해 보았다 .

그러나 생활용어와 법령용어가 정확하게 연결되어 있는지 여부에 따라


, ,

즉 법령용어 온톨로지의 완성도에 따라 법령정보 검색의 정확성이 좌우되고


있음을 실험을 통해서 알 수 있었다 .

또한 생활용어를 법령용어로 확장하여 법령정보를 검색하였더라도 검색


,

결과에 따라 정확성이 달라지고 있는 현상이 발생한다 검색결과가 많거나 .

없으면 법령정보 검색의 정확성이 낮아진다 이는 법령용어를 확장하는 과 .

정에서 확장 범위에 대한 연구가 필요하다는 것을 의미한다 .

이에 따라 향후에는 일상생활에서 변화하는 생활용어와 법령용어를 법령


용어 온톨로지에 정확하게 반영하기 위해 법령용어와 생활용어를 자동으로
추출하여 완성도가 높은 법령용어 온톨로지를 구축에 대한 연구가 이루어져
야 할 것이다 또한 법령용어를 정확하게 확장하는 기술에 대한 연구가 될
. ,

것이다 .

- 85 -
참고문헌
[1] 인터넷상에서 Ontology 를 이용한 정보의 분류와 획득을 위한 지능형
에이전트의 설계 (A Design of Intelligent Agent for Classification and

Acquisition of Information using Ontology based on Internet), 양성기 이광옥


최길환 오창윤 배상현 (統計硏究所論文誌, Vol.2 No.1, [2000])

[2] 시멘틱 검색 엔진 설계 및 구현 (A Design and Implementation of the

허선영
Senamtic Search Engine), 김은경 (Sun-Young Heo) (Eun-Gyung Kim)

한국정보과학회 학술발표논문집
( , Vol.35 No.1, [2008])

[3] 지식기반 으로서의 온톨로지


(Knowledge Base) 와 시멘틱 웹 (Ontology) (Semantic

신효필 정보처리학회지
Web), ( , Vol.11 No.2, [2004])

[4] 온톨로지를 통한 추론형 시멘틱 검색 시스템에 관한 연구 (Ontology Based

하상범
Semantic Search System Using Inference), (Sangbum Ha)

박영택 한국정보과학회 학술발표논문집


(YoungTack Park) ( , Vol.31 No.1B, [2004])

[5] 개념 및 관계 분류를 통한 분야 온톨로지 구축 (Building Domain Ontology

황금하
through Concept and Relation Classification), (Jin-Xia Huang)

신지애 최기선
(Ji-Ae Shin) 정보과학회논문지 소프트웨어 및
(Key-Sun Choi) ( :

응용 , Vol.35 No.9, [2008])

[6] 전문용어 기반 인문사회분야 온톨로지 구축에 관한 연구 (A Study on

김규환
Domain-Specific Ontology Construction by Terminology), (Gyu-Hwan

장보성
Kim) 남영준
(Bo Seong Jang) (Young-Joon Nam) (韓國情報管理學會

學術大會論文集, Vol.2008 No.-, [2008])

[7] 전문용어 기반 인문사회분야 온톨로지 구축에 관한 연구 (A Study on

Domain-Specific Ontology Construction by Terminology), 김규환 (Gyu-Hwan

Kim) 장보성 (Bo Seong Jang) 남영준 (Young-Joon Nam) (韓國情報管理學會

- 86 -
學術大會論文集, Vol.2008 No.-, [2008])

[8] 연구자 중심 연구성과를 의미검색을 위한 인문사회 학술용어 온톨로지 적용 및


유지관리 체계 연구 (A Study on the Application and Management Framework

of Social Science Scholarly Ontology for Semantic Information Navigation),

유사라 이혜원
(Sa-Rah Yoo) 송인석 (Hye-Won Lee) (Inseok Song)

한국문헌정보학회지
( , Vol.43 No.2, [2009])

[9] 개인의 선호도를 고려한 시멘틱 웹기반의 정보검색시스템의 설계 (Design of

the Semantic Web-based Information Retrieval System Using Personlized

김주연
Preference), 김종우
(Ju-Yeon Kim) (Jong-Woo Kim) 김창수 (Chang-soo

Kim) ( 한국멀티미디어학회 학술발표논문집 , Vol.2006 No.1, [2006])

[10] 법령과 조례의 관계에 대한 연구 양승미 , (法學論集, Vol.14 No.3, [2010])

[11] 미국 법전의 편재방식과 법령정보의 검색 인용방법 · (The Types of the U.S.

Code of Laws and the Searching Methods of Legal Informations), 신영수


법학논고
( , Vol.32 No.-, [2010])

[12] [ 법령입안심사기준 알기 쉬운 법령정비기준 법제업무편람 법제처


], [ ], [ ] ( , 2009 ~

2011)

- 87 -
[ABSTRACT]

A Study on Methodology of Semantic Search

for Law Information using Life Term

Jung, Syung tack

Major in Industrial Information Management

The Graduate School of Engineering

Yonsei University

Supervised by Prof. Kim, Woo ju

Although number and complexity of law information are increasing,

keyword search method for law information has many defects, the

method providing results independent of intention of users, results

wrong results which users do not intend or too many results or none.

Because law terms and sentence are difficult to understand, access or

search of the terms is difficult. Law information always has been a

monopoly of the experts because the contents are difficult for users to

understand and apply, for the contents related to part of specific living

lie in various law cases.

This study researches current status and problems of the service to

improve service quality by introducing a semantic technology, analyzes

distinction of law information, evaluate whether law information is

suitable to apply semantic technology, and finds examples of realizing

- 88 -
law information service by applying semantic technology.

Furthermore, this study researches semantic search method for solving

a problem of searching law information system, the method enabling

users who feed ordinary terms to find accurate result easily using

ontology.

- 89 -

You might also like