| 연구원소개 | 산하연구센터 | 수행과제 | 학술행사 | 사전 | 간행물 | 자료실 | 게시판
 
인문한국사업단
한국어사전편찬실
언어관측소
연구진흥센터
 
산하연구센터
  산하연구센터 > 언어관측소
언어관측소
 

언어관측소는 201112월 개소한 이래, 현대인의 언어사용을 반영한 다양한 형태의 언어 자료를 구축하고, 구축된 언어자료를 언어정보학적 방법론을 사용하여 분석하는 연구 활동을 수행해 오고 있다.

1. 언어관측소 구축 언어자료

<말뭉치>

종류

규모(총 어절 수)

트위터1

16,904,995                      

트위터2

945,175,620                      

트위터3

1,579,819,644                      

신문기사

339,388,770                      

정치 담화

306,681                      

전직 대통령 연설문

2,881,365                      

대중가요 가사

2,046,203                      

8,258,478                      

다면자료(구어 전사분)

18,986                      

합계

2,894,800,742                      

 

<언어지도>

지도 구축 및 분석 도구인 GIS(지리 정보 시스템)를 사용하여, 전국 한국어 교육기관 분포 지도, 세계 한국어 교육기관 분포 지도, 결혼 이민 여성 및 이주 노동자를 포함한 국내 거주 외국인 분포 지도 등을 구축하였다. 구축된 언어지도 가운데 일부는 HK인문언어사업단 홈페이지에 공개되어 있다.

 

2. 현재 구축 중인 언어자료

<민중자서전 말뭉치 >

- 출판사 뿌리깊은나무에서 발간된 전 20권의 구술 자료

- 목수, 반가 며느리, 보부상, 어부 등 20인이 각 지역 방언으로 이야기한 내러티브 자 료.

 

한글대장경 말뭉치

- 불설류를 비롯한 경문 1,289개와 서문 및 해제로 구성.

- 텍스트 원자료 구축 후 교정과 주석 작업 진행중.

 

독립신문 말뭉치

- 전체 6(영문판 3권 제외), 779호로 구성됨

- 국문 텍스트 원자료 구축 후 교정과 주석 작업 진행중.