Professional Documents
Culture Documents
Ýè°¿ë Î Â ÝÀÇ Ý ÉÁ º à ÇÆ °Ë Ö Æ Ý Ð¿¡ °üÇÑ ¿ PDF
Ýè°¿ë Î Â ÝÀÇ Ý ÉÁ º à ÇÆ °Ë Ö Æ Ý Ð¿¡ °üÇÑ ¿ PDF
검색 방법론에 관한 연구
연세대학교 공학대학원
산업정보경영 전공
정 승 택
차 례
표차례 ................................................................................................... iii
그림차례 ............................................................................................... iv
국문요약 ............................................................................................... vi
제1장 서론 ··················································································· 1
1.1 연구배경 및 목적 ············································································· 1
- i -
3.3 온톨로지 구축 기술 ····································································· 29
제 5 장 시스템 구현 및 평가 ·················································· 75
5.1 법령정보 시맨틱 검색 시스템 구현 ········································· 75
5.2 평가 ································································································· 82
제 6 장 결론 ················································································· 84
6.1. 연구결과 요약 ·············································································· 84
참고문헌 .............................................................................................. 86
ABSTRACT ......................................................................................... 88
- ii -
표차례
표
[ 3-1] OWL 의 어플리케이션 응용 가능 분야 31
표
[ 3-2] OWL 2 분류표 32
표
[ 3-3] 법령내용을 구성하고 있는 주요내용 40
표
[ 3-4] 연구정보 온톨로지 주요 클래스 56
표
[ 5-1] 법령정보 시맨틱 검색대상 목록 75
- iii -
그림차례
그림
[ 2-1] 국가법령정보센터 홈페이지 화면 6
그림
[ 2-2] 생활법령정보 서비스 화면 7
그림
[ 2-3] 소방안전관리 서비스 사례 8
그림
[ 2-4] 법령정보 키워드 검색시스템 구성도 15
그림
[ 3-1] 시맨틱 기술의 계층 구조 23
그림
[ 3-2] 온톨로지 구축 방법론
Ontology 101 34
그림
[ 3-3] 법령정보의 계층적 구조 35
그림
[ 3-4] 법령내용의 계층적 구조 37
그림
[ 3-5] 판례내용의 계층적 구조 37
그림
[ 3-6] 법령정보 질의 응답 서비스의 예
․ 44
그림
[ 3-7] 생활분야별 법령정보 통합 서비스의 예 47
그림
[ 3-8] 법령에 기술된 산식 계산의 예 50
그림
[ 3-9] 법령계산 개발 환경 구성도 51
그림
[ 3-10] 법령문장 번역 데이터베이스 구성도 53
그림
[ 3-11] IT 온톨로지 인프라 개념도 55
그림
[ 3-12] 조달청 지능형상품정보시스템 화면 57
- iv -
그림
[ 4-1] 법령정보 시맨틱 검색 서비스 화면 예시 59
그림
[ 4-2] 법령정보 시맨틱 검색 서비스 모델 61
그림
[ 4-3] 법령정보 시맨틱 검색 시스템 구성도 62
그림
[ 4-4] 생활 법령용어 추출 프로세스
/ 64
그림
[ 4-5] 법령 생활용어간의 관계 구축 예시
/ 66
그림
[ 4-6] 온톨로지를 활용한 법령정보 검색 프로세스 67
그림
[ 4-7] 법무부 시스템 검색결과 화면
iLAW 69
그림
[ 4-8] 시스템 다차원정보 서비스 화면
iLAW 70
그림
[ 4-9] 이탈리아 홈페이지 화면
JurWordNet 71
그림
[ 4-10] 애플 특허 제소 사례 검색 화면 73
그림
[ 4-11] 특허 제소 사례 내용 조회 화면 74
그림
[ 5-1] SKOS기반 법령용어 구성 결과 77
그림
[ 5-2] 용어 의미 연관성 해석 결과 78
그림
[ 5-3] 사용자 질의 확장 및 검색 절차 79
그림
[ 5-4] 법령정보 시맨틱 검색 결과 81
- v -
국문요약
생활용어 기반의 법령정보 시맨틱
검색 방법론에 관한 연구
연세대학교 공학대학원
산업정보경영 전공
정 승 택
사회환경의 변화와 기술발달의 속도가 빨라져 법령정보의 건수 및 법령
정보의 복잡도가 점점 증가하고 있음에도 불구하고 법령정보에 대한 키워드
검색 방식은 사용자의 검색 의도와는 관계없이 질의어와 매칭되는 정보를
무조건 제공하기 때문에 질의어와 관련된 검색 결과가 너무 많거나 전혀 ,
- vi -
조사하고 법령정보의 특징을 분석하여 법령정보가 전체적으로 시맨틱 기술
을 적용하기에 적합한 분야인지 여부를 알아 보고 법령정보 서비스에 시맨
,
- vii -
제1장 서론
1.1 연구배경 및 목적
정보통신기술 이 발달하고 사회 전반에 대한 정보화 수준이 제고됨에
(ICT)
- 1 -
법령정보의 경우에도 국민생활과 공공기관의 행정업무 등에 밀접한 영향
을 미치고 있음에도 불구하고 법령용어나 문장이 어려워 법령정보를 검색
,
- 2 -
1.2 연구범위 및 방법
이 논문에서는 법령용어 온톨로지가 구축되었다는 전제 하에 생활용어를
법령용어로 전환하는 연구 시맨틱 기술을 이용하여 법령정보를 검색하는
,
- 3 -
1.3 논문의 구성
이 논문은 전체 개의 장으로 구성되어 있다
6 .
해서 살펴 본다 .
- 4 -
제 2 장 법령정보 서비스 현황 및 한계
- 5 -
또한 년부터는 종전의 현행법령과 법령연혁 중심의 법령정보 서비스
, 2009
- 6 -
2.1.3 법령정보에 대한 이해 및 적용의 용이성 제고를 위한 서비스
법치주의가 정착되면서 국민들이 일상생활에서 법률 문제에 부딪히는 일
들이 점차 늘어나고 그에 따라 법을 쉽게 찾아내고 이해할 수 있도록 기본
적인 법령정보 제공 인프라가 마련되어야 한다는 바램도 커지고 있다 .
- 7 -
수요자 중심의 생활법령정보 서비스는 법령 수요자인 국민의 입장에서
일상생활에 필요한 법령을 쉽게 찾아보고 이해할 수 있도록 정부 각 기관
의 업무 중심으로 복잡하게 얽힌 법령간의 관계를 국민의 생활 중심으로
통합적 체계적으로 재분류하고 전문가의 시각에서 쓰인 어려운 법령의
ㆍ ,
그림
[ 소방안전관리 서비스 사례
2-3]
- 8 -
에 전기 분야의 전기사업법 전기공사업법 등 가스 분야의 고압
「 」, 「 」 , 「
법령용어 관계 법령 및 판례 책자 수준의 인쇄 및 저장 등이 있다
, , .
- 9 -
2.1.5 법령정보의 이용 현황
우리나라 법령정보에 대한 전체 고객은 변호사 세무사 등 전문가 공무원 , ,
2.2 법령정보의 특징
2.2.1 검색하고 이해하기 어려운 법령용어
년부터 현행법령을 디지털로 변환하여 통신망 등을 통해 제공하
1985 PC
- 10 -
을 기울여 왔다 이는 사회 인프라 구축 차원에서 한 나라의 모든 법령정
.
- 11 -
기관의 행정업무 등에 밀접한 영향을 미치고 있기 때문에 법령내용은 전체
적으로 항상 일관성을 유지하기 위해서는 집합어 등을 사용하거나 법령문
장을 포괄적으로 기술할 수밖에 없는 불가피한 측면이 있다 .
를 많이 사용하고 있기 때문이다 .
지고 있기 때문이다 .
- 12 -
2.2.4 다수의 법령에 산재되어 기술된 생활분야별 법령내용
특정한 생활분야와 관련된 법령내용이 여러 법령에서 분산 기술되어 있
는 점을 들 수 있다 현재 우리나라의 법체계는 법령 공급자인 행정주체
. ,
- 13 -
따라서 생계 유지에 전념하고 있는 일반인이 일상생활에서 겪는 법적인
문제를 해결하기 위해 법령을 검색하고 이해하는 것은 쉽지가 않다 결론 .
2.2.6 법령정보의 구축 현황
약 만건 지방자치단체의 조례 규칙 만건 판례등 약 만건 법령
2.8 , ․ 30.2 , 12.4 ,
용어 약 만건 생활법령정보 등 기타 만건 등 전체 약 만건에 달하
6.7 , 1.6 63.4
에 이른다 .
고 있어 전체 법령정보의 양은 점점 크게 증가하고 있다 .
- 14 -
2.3 법령정보시스템 및 서비스의 한계
2.3.1 키워드 중심의 검색엔진의 문제점
키워드 검색은 사용자의 검색 의도와는 관계없이 질의어와 매칭되는 정
보를 무조건 제공하기 때문에 질의어와 관련된 검색 결과가 너무 많거나 ,
그림
[ 2-4] 법령정보 키워드 검색시스템 구성도
- 15 -
또한 키워드 검색에 활용하는 용어는 법령정보에서 추출하여 법령용어를
,
띄고 있다 .
- 16 -
2.3.2 KMS, 마이닝 기술 등의 한계
일부 기업이나 포털 사이트를 중심으로 지식을 체계적으로 구축하고 활용
하여 사용자의 의도를 파악하고 찾고자 하는 정보를 정확하게 제공하고자
하는 노력이 시도되고 있다 .
이를 위해 지식관리시스템 구축
(KMS, Knowledge Management System) ,
한 마이닝 기술 등 을 도입한
(Data Mining, Text Mining, Network Mining )
- 17 -
구축 동향은 과거에 구축한 데이터에 비하여 수요는 많지 않으나 보관의 필
요성이 있는 데이터로 구축 범위가 확대되고 있다 .
- 18 -
2.3.4 법령정보에 대한 부가정보 서비스의 한계
현재의 시스템들은 디지털 정보를 단순히 송 수신하여 사용자에게 제공 ․
하는 한계점을 가지고 있다 .
- 19 -
또한 표 이미지 한글 파일 등 다양한 형태로 구성되어 있어 스마트폰에서
, ,
- 20 -
있으며 이동하면서 사용자의 특정 상황에 부합하는 법령정보를 선별적으로
제공하는 지능형 서비스가 필요하다.
- 21 -
제 3 장 시맨틱 서비스 개요
- 22 -
고 활용한다는 관점이다 정보검색 관점은 시맨틱 메타데이터 및 시맨틱 네
.
신뢰 (Trust)
증명 (Proof)
전 암
논리 (Logic)
자 호
온톨로지 (Ontology) 서
명 화
RDF + RDF Schema
- 23 -
3.2 온톨로지와 시맨틱 서비스의 개요
3.2.1 데이터에 대한 지식을 보관하는 온톨로지
온톨로지는 철학에서의 존재론으로 실재 에 대한 정확한 이해를 추 (reality)
온톨로지는 개념 속성 관계 제약조건
(Concept/Class), (Property), (Relation),
공리
(Constraint), 인스턴스 등으로 구성되어 있다 이 때
(Axiom), (Instance) . ,
성질을 말한다 .
- 24 -
한 일반상식 온톨로지 일상생활 어휘 명사 동사 형용사 등 의 지식을 기술
, ( , , )
- 25 -
3.2.3 시맨틱 마이닝 서비스
시맨틱 마이닝 서비스에는 데이터 통합 지식관리 개인정보관리 저장소 , , , ,
- 26 -
3.2.4 의미통합 시맨틱 서비스
의미통합 시맨틱 서비스는 사용자가 입력하는 질의어의 의미를 정확하게
인식하여 동음이의어 등을 구분할 수 있고 동의어나 유의어 연관어 등을 , ,
시맨틱 포털
(intelligent agent), 등의 개발 사례를 포함하 (semantic portal)
고 있다 .
며 계획
, 평가 추론 등의 지능적 처리가 가능해야 한다
(planning), , .
이다 .
- 27 -
3.2.5 문장인식 시맨틱 서비스
문장인식 시맨틱에는 주석 및 정보 강화 카탈로그
(annotation) (enriching),
시소로스
(catalog)/ 관리 등의 개발 사례를 포함하고 있다
(thesaurus) .
구조화된 통제 어휘 는 전자 도서관 을
(controlled vocabulary) (digital library)
위한 시소러스 나 전자상거래를 위한 상품 목록
(thesaurus) 등을 구성 (catalog)
관의 정보 자원 관리에 크게 공헌을 하고 있다 .
- 28 -
3.3 온톨로지 구축 기술
3.3.1 데이터의 의미를 메타데이터로 표현하기 위한 RDF
는 기반으로 만들어진 생성
RDF(Resource Description Framework) XML
성 언어이다 .
성 속성값
(predicate), 의 세 부분으로 이루어진
(object) 즉 선언 triple ( , RDF
를 나타낸다 예를 들어 . 을 기술하고자 할
, “The coffee has the color black"
때 에서는
, RDF 는 자원으로
”coffee" 는 속성으로 은 , "has the color" , "black"
속성값으로 표현된다 .
로 식별될 수 있다
URI(Uniform Resource Identifier) .
- 29 -
가지는 문자열 로 정의된다 는 그 자체만으로는 속성에
(Unicode string) . RDF
질 수 있도록 한다 .
상의 약속된 어휘들이다 .
며 의 출현은
, OWL 스키마가 제공하는 기본적인 기능을 넘어서 기계
RDF ,
- 30 -
[ 표 의 어플리케이션 응용 가능 분야
3-1] OWL
분야 설명
인터넷 포탈 분류 법칙을 이용한 검색 기능 확장
멀티미디어 멀티미디어 내용에 기반을 둔 검색
기업 웹 데이터와 문서의 자동 텍사노미 생성 기업부서 ,
에이전트 의 콘텐트 매핑
웹 서비스 및 웹서비스 발견 및 구성 저작권 및 접근 관리
유비쿼터스 컴퓨팅 ,
래스간의 상호 관계 또한 표현할 수 있다 .
와
RDF 는 웹 자원의 메타데이터를 기술할 수 있는 표준이지
RDF Schema
과 마찬가지로 도
DAML+OIL 스키마의 상위 수준에서 어휘의
OWL RDF
- 31 -
의미를 정의하고 있으며 의 클래스와 속성을 이용한다
, RDF 은 . OWL
하고 있다 년에 개정된
. 2009 는 표현 수준에 따라 OWL 2 OWL 2 EL, OWL
로 나뉜다
2 QL, OWL 2 RL .
- 32 -
3.3.3 SPARQL
은
SPARQL 와 같은 데이터 공개와 공유 서비스에서 표준화된
data.gov.uk
이들에 바로 접근 질의할 수 있다 , .
등으로 불리고 있다
Semantic Repository .
- 33 -
3.3.5 온톨로지 모델링 방법론
다양한 기술적인 요소들과 함께 지식베이스를 구축하기 위해서는 지식 베
이스의 체계인 온톨로지를 모델링하는 것이 매우 중요하다 .
적용범위 기존 자원 용어 클래스
설정 ➡ 재활용 검토 ➡ 열거 ➡ 정의
속성 제약조건 인스턴트
➡ 정의 ➡ 정의 ➡ 생성
와
Requirements Specification Document) 를작 CQ(Com petency Questions)
- 34 -
3.4 법령정보의 시맨틱 기술 적용 가능성
3.4.1 법령정보 구성체계의 특징
법령정보는 헌법을 중심으로 법률 시행령 대통령령 국회규칙 대법원규
, ( , ,
그림
[ 3-3] 법령정보의 계층적 구조
법률은 국회에서만 제 개정할 수 있으며 대통령령 등 시행령은 법률에
․ ,
- 35 -
시행령이나 시행규칙 등에서 상세한 내용을 기술하고 있다 .
한 행정규칙을 제 개정하고 있다 ․ .
하고 단서 나 후단 등은 항 에 기술한다
(但書) (後但) (項) .
- 36 -
그림
[ 3-4] 법령내용의 계층적 구조
판례내용의 경우에도 판시사항 판결요지 참조조문 참조판결 전문 등으
, , , ,
그림
[ 3-5] 판례내용의 계층적 구조
- 37 -
3.4.3 법령 내용의 특징
법령정보의 내용에 대한 특징은 법령 문장에 대한 법적인 표현이나 기술
(記述)방법 등을 분석하려고 하는 것이 아니며 법령문장을 기계가 인식하
고 분석하는데 필요한 특징을 살펴보고자 한다 .
기술하고 있다 .
- 38 -
3.4.4 법령 문장의 특징
법령 문장에서 사용하는 단어나 어미의 특징을 보면 법령내용을 기술하는
데 사용하는 단어는 법령용어나 일상생활에서 사용하는 표준 단어를 사용한
다는 점이다 사투리나 약어 자 성어 등 숙어 속담 의성어나 의태어 등을
. , 4 , ,
나고 있으며 판례 등의 경우 반복되는 부사
, 구 절 등을 상세 (副詞), (句), (節)
- 39 -
[ 표 3-3] 법령내용을 구성하고 있는 주요내용
목적 정의 / 수수료 사용료 /
총칙 해석 적용범위 / 비용의 부담
다른 법령과의 관계 자료조사 자료보관 장부비치 / /
인허가의 의제 협의 권한의 위임 위탁 대행
/ / /
부담금 정보보호
실체적 연체금 가산금 행정강제 손실보상 손해배상
규정 지원금 보조 출자 출연 융자
/ / /
/ / / / 행위제한 원상회복 /
재정 회계 국가계약 기금
/ / /
규정 법정형 양벌규정 /
검사 검정 인증 시험
/ / / 시행일
위원회 특수법인 영조물 유효기간 적용시한
부칙
/ / /
- 40 -
종류에 따라 일정한 패턴의 문장 형식으로 기술되어 있으며 법령내용을 구 ,
- 41 -
3.5 법령정보 시맨틱 서비스 구현 가능 분야
3.5.1 생활/법령용어에 대한 의미통합 검색 및 연관어 서비스
생활용어 법령용어 법령과 판례 등을 서로 밀접하게 연결하고 전체 용
, , ,
- 42 -
법령정보를 모두 읽어 보더라도 법령내용을 파악할 수가 없다 이러한 문제 .
3.5.2 법령내용에 대한 단순 질의 응답
․
- 43 -
법령정보에 대한 답변은 다른 행정기관에 많은 영향을 미치고 있을 뿐만
이 아니라 컴퓨터에서 제공하는 답변과 행정기관 등에서 제공하는 답변이
서로 다를 경우 국민이나 행정기관에 혼란을 줄 수 있고 행정기관을 대상
,
국법센터 ) 나이와 성별 남자 여자 은 ( , ) ?
일반국민 ) 저는 세의 남자입니다
24 .
- 44 -
사용자와 컴퓨터가 특정 행위에 대한 질문과 답변을 지속적으로 주고 받으
면서 사용자가 원하는 최종적인 답변을 찾을 수 있도록 도와주는 방식이다 .
- 45 -
법령내용은 법률 시행령 시행규칙 등으로 분산된 기술되어 있어 법률을
, ,
함되어 있는 편 장 절 관 조문
(編), 등의 제목
(章), 등을 (節), (款), (條文) (題目)
- 46 -
일반법인 동물보호법 외에도 사료관리법
「 가축전염병예방법」 「 」, 「 」,
를 규정하고 있다 .
- 47 -
또한 동물보호법 의 시행령 시행규칙까지 전부 포함할 경우 해당되는
「 」 ,
3.5.5 법령에서 정한 기준 및 절차 등에 대한 사전 점검
일상생활에서 필요할 것으로 생각되는 서비스로 법령에서 정한 기준이나
절차 등을 준수 또는 구비했는지 여부를 기준이나 절차별로 질의 응답을 ․
- 48 -
제출한 점검표와 결과가 일치하는지 여부를 확인하고 허가 여부를 통보하도
록 지원하면 된다 이를 통해 사업자 등 민원인은 경제적인 손해를 줄일 수
.
3.5.6 법령에서 정한 산식 계산
법령에 복잡하게 기술된 각종 계산을 간편하게 처리하여 제공하는 산식
계산 서비스가 필요하다 .
- 49 -
할 수 있다 .
증여세 계산 서비스
□ 증여하고자 하는 사람은 ?
증여세 : 5,382만원
▶ 관계 법령 상속세 및 증여세법 제 조 같은 법 시행령 제 조
: 333 , 444
▶ 계산 결과
만원 증여금액
- 24,000 만원 불산입재산
( 만원 채무부담액 ) - 2,000 ( ) - 5,000 ( )
만원 증여재산 가산액
+ 12,000 만원 공제액 만원 감정
( ) - 3,000 ( ) - 300 (
평가 수수료 억 천 백만원 ) = 2 5 7
- 만원 과세대상
[25,700 세율 만원 누진공제액
( ) X 20%( ) - 1,000 ( ) ] X
만원
130% = 5,382
- 50 -
법령산식은 사용자로부터 텍스트나 데이터 값을 입력받거나 다수의 항목
에서 사용자가 선택한 항목에 따라 산식을 계산하는 것이 대부분이기 때문
에 많은 도구나 복잡한 함수없이 구현이 가능할 것으로 예상하고 있다 .
상자 명령 단추 선택 버튼 라디오 버튼 레이블
, , ( 리스트 박스 등의
), (Label),
- 51 -
으며 일반 사용자는 법령용어와 그 연관어 등을 검색하거나 법령 질의응답
,
3.5.7 국내 외의 법령, 판례 등에 대한 번역
․
에 대한 외국인의 국내 교육 관광 의료 투자 등이 빈번하여 국내 외 기
, , , ․
해외 여행 관광 및 교육 등을 지원하며 정부정책의 수립 및 입법 등을 지
, ,
- 52 -
그림
[ 3-10] 법령문장 번역 데이터베이스 구성도
법령이나 판례 등도 문장의 구와 절의 패턴을 분석하여 문장 온톨로지를
구축하는 것이 불가피하기 때문에 이 과정에서 문장의 구와 절에 해당하는
영문을 데이터베이스로 구축하고 한글 법령 문장 온톨로지에 연결하게 되면
패턴 분석을 통한 통계 기법을 활용하여 법령이나 판례 등을 양방향으로 정
확하게 번역할 수 있을 것이다 .
하도록 지원할 수 있다 .
- 53 -
무 포괄적으로 기술하고 있지는 않는지 조문 내용에 따라 법령 문장을 어 ,
3.5.9 법령 집행과정에서의 자료 작성 및 검토 지원
법령의 집행하는 과정에서 동일한 업무를 반복적으로 이행하는 작업 등을
보다 신속 정확하게 처리하는데 시맨틱 기술을 활용할 수 있을 것으로 보
․
- 54 -
만들고자 분야 전문용어 전문가
IT 및 상용제품을 대상으로
, , H/W S/W,
온톨로지를 구축하였다 .
- 55 -
3.6.2 연구정보 온톨로지 (KISTI, 한국과학기술정보연구원)
에서 개발한 국가
KISTI 기반정보 온톨로지는 연구정보를 온톨로지 R&D
특허 - (Patent) 주제영역
- (TopicDomain)
▶ 기관 (Institution) 분야영역
- (CategoryDomain)
▶ 인력 (Person) 주제키워드
- (TopicKeyword)
▶ 과제 (Project) 분야키워드
- (CategoryKeyword)
▶ 저작정보 (CreationInformation)
- 56 -
해 각급 행정기관과 민간업체의 카달로그 상품정보 상호 연관정보 등을 국
, ,
가 표준 상품 온톨로지로 구축 및 활용하고 있다 .
그림
[ 3-12] 조달청 지능형상품정보시스템 화면
- 57 -
제 4 장 법령정보 시맨틱 검색 방법론
행위어 종류 등을
, 방식으로 제공하여 법령정보의 검색 범위를
Top-down
- 58 -
[ 그림 4-1] 법령정보 시맨틱 검색 서비스 화면 예시
아울러 사용자의 법령정보 검색 결과에 대한 통계를 추출하여 분석하고
,
- 59 -
해당되는 법령 문장을 정확하게 검색하는 것이 매우 중요하기 때문에 이와
같은 생활용어 기반의 법령정보 검색 방식은 많은 영향을 미칠 수 있는 가
장 중요한 인프라로 작용할 수 있다
IT .
- 60 -
체계도 정보를 분석하고 법령용어와 연계성을 가질 수 있도록 각각의 연계
모델을 구성한다 .
- 61 -
4.3 검색 서비스 개선을 위한 기술 적용 방안
4.3.1 법령정보 시맨틱 검색 시스템 설계 방안
생활용어 기반으로 법령정보를 검색할 수 있는 시맨틱 검색 시스템은 설
계 방향을 제시한다 법령정보 시맨틱 검색 서비스는 법령용어나 생활용어
.
그림
[ 4-3] 법령정보 시맨틱 검색 시스템 구성도
법령용어 추출 및 온톨로지를 구축하는 부분은 법령명이나 메타데이터를
- 62 -
입력하여 인터넷에서 웹 문서를 수집하는 기능 법령정보나 웹 문서를 구성 ,
- 63 -
문서나 각급 행정기관에서 제공하는 행정정보 법령과 관련된 질의 응답사 , ․
- 64 -
법령용어 온톨로지에 추가하여 법령용어 온톨로지를 구성할 수 있다 이 때 .
- 65 -
등으로부터 부동산 과 관련된 다양한 용어를 수집하고 용어와 연관어의 관
“ ”
그림
[ 4-5] 법령 생활용어간의 관계 구축 예시
/
- 66 -
첫번째 단계는 사용자 질의어를 분석하여 해석하는 단계이다 사용자의 .
- 67 -
어까지 상위어를 연속해서 추적하고 이 과정에서 추출된 용어를 상위어 하 , /
- 68 -
따라 통합 검색하여 시각적으로 제공하는 시스템이다 .
그림
[ 4-7] 법무부 iLAW 시스템 검색결과 화면
이 시스템은 구글 네이버 등과 같이 키워드와 일치하는 정보를 제공하는
,
- 69 -
키워드와 관련된 법제정보를 입체적으로 파악할 수 있도록 국가별 법제정보
지도 다차원정보 동향정보 전문가정보 연관어 정보 등을 상세히 확인할
, , , ,
그림
[ 4-8] iLAW 시스템 다차원정보 서비스 화면
또한 법제정보에 대한 검색의 효율성을 제고하기 위해 다차원정보를 구
,
- 70 -
는 마이닝 기법 등을 이용하여 다양한 정보를부터 주제어와 연관어 등을 자
동으로 추출하거나 시소러스 등으로부터 추출한 연관어의 집합으로써 사용 ,
- 71 -
의관계를 정의한 법률 어휘 온톨로지이다 이 온톨로지는 일반 어휘 혹은 .
법률 관련 어휘망 )
- 72 -
법률 온톨로지는 피해분쟁을 해결 및 중재하는 사례법을 상담
BARTINA
어 온톨로지로 구성된다 .
그림
[ 4-10] 애플 특허 제소 사례 검색 화면
- 73 -
그림
[ 4-11] 특허 제소 사례 내용 조회 화면
4.4.7 포르트갈의 Portuguese attorney general 법무부 정보검색시스템
( )
- 74 -
제 5 장 시스템 구현 및 평가
- 75 -
또한 시스템 구현 및 실험을 위해 필요한 법령정보는 표 과 같이
, [ 5-1]
이용하였다 .
어의 관계는 온톨로지 형태
SKOS(Simple knowledge Organization System)
로 표현하였다 .
또한 , 를 이용하여
JAVA 형태의 온톨로지를
Netbeans SKOS Smart
- 76 -
의 트리플 모델로 변환하고 인스턴스를 생성하여
Engine Smart DB(Legal
에 저장하였다 그림
Ontology) 의 온톨로지 구성 결과를 보
. [ 5-1] Smart DB
된 모습을 알 수 있다 .
그림
[ 5-1] SKOS 기반 법령용어 온톨로지 구성 결과
5.1.2 용어 의미의 연관성 해석
사용자 질의어는 단어 형태로 입력받을 수 있도록 구현하였으며 사용자
질의어를 법령용어 온톨로지를 이용하여 상위어를 최상위 용어까지 연속해
- 77 -
서 추적하고 질의어의 상위어를 모두 모아서 출력하고 이를 그룹핑하도록
,
용자 페이지이다
View .
- 78 -
5.1.3 사용자 질의 확장
용어 의미에 대한 연관성 분석을 통해 산출된 용어의 그룹과 그룹이 특정
한 연관어로 연결되어 있는지 확인하고 연관어가 있는 경우 그 연관어의
,
그림
[ 5-3] 사용자 질의 확장 및 검색 절차
각 그룹에 포함되어 있는 생활용어를 제거하여 용어의 그룹을 만들고 각 ,
를 확장하였다 .
- 79 -
또한 법령정보 검색에 필요한 질의어의 효용성을 확보하기 위해서 확장
,
타내었다 .
- 80 -
등을 기술하는 특징이 있기 때문에 법령 편 장 절 관 및 조문의 제목 ․ ․ ․ ,
- 81 -
결과를 보여주는 모습이다 법령정보를 검색하기 위해 질의어로 공동주택 . [
검색결과로 보여주고 있다 .
5.2. 평가
법령정보 시맨틱 검색 방법의 효과를 알아보기 위해 이 논문에서 선정한
개 법령정보를 대상으로 법령정보를 검색하여 비교해 보았다
16 .
내용은 건이 검색되었다 72 .
- 82 -
하지만 법령정보 검색에 시맨틱 기술을 적용하는데 있어서 앞으로 해결해
야 할 과제도 많이 남아 있다 생활용어와 법령용어가 정확하게 연결되어
.
을 의미한다 .
- 83 -
제 6 장 결론
6.1. 연구결과 요약
온톨로지는 컴퓨터가 정보를 이해하고 추론할 수 있도록 가공 및 처리한
지식베이스이다 또한 온톨로지 기반의 시맨틱 기술은 다양한 지능형 서비
.
한 사례를 발굴하였다 .
- 84 -
는 것을 확인하였다 또한 사용자 질의와 관련된 연관어를 추출하여 법령정
.
것이다 .
- 85 -
참고문헌
[1] 인터넷상에서 Ontology 를 이용한 정보의 분류와 획득을 위한 지능형
에이전트의 설계 (A Design of Intelligent Agent for Classification and
허선영
Senamtic Search Engine), 김은경 (Sun-Young Heo) (Eun-Gyung Kim)
한국정보과학회 학술발표논문집
( , Vol.35 No.1, [2008])
신효필 정보처리학회지
Web), ( , Vol.11 No.2, [2004])
하상범
Semantic Search System Using Inference), (Sangbum Ha)
황금하
through Concept and Relation Classification), (Jin-Xia Huang)
신지애 최기선
(Ji-Ae Shin) 정보과학회논문지 소프트웨어 및
(Key-Sun Choi) ( :
김규환
Domain-Specific Ontology Construction by Terminology), (Gyu-Hwan
장보성
Kim) 남영준
(Bo Seong Jang) (Young-Joon Nam) (韓國情報管理學會
- 86 -
學術大會論文集, Vol.2008 No.-, [2008])
유사라 이혜원
(Sa-Rah Yoo) 송인석 (Hye-Won Lee) (Inseok Song)
한국문헌정보학회지
( , Vol.43 No.2, [2009])
김주연
Preference), 김종우
(Ju-Yeon Kim) (Jong-Woo Kim) 김창수 (Chang-soo
2011)
- 87 -
[ABSTRACT]
Yonsei University
keyword search method for law information has many defects, the
wrong results which users do not intend or too many results or none.
monopoly of the experts because the contents are difficult for users to
understand and apply, for the contents related to part of specific living
- 88 -
law information service by applying semantic technology.
users who feed ordinary terms to find accurate result easily using
ontology.
- 89 -