| 연구원소개 | 산하연구센터 | 수행과제 | 학술행사 | 사전 | 간행물 | 자료실 | 게시판
 
소장자료
말뭉치
소개
목록
 
자료실
  자료실 > 말뭉치> 목록
말뭉치
 
번호 학술서명 발간년월일 수상내역

1

연세 말뭉치1
(균형말뭉치)

1연세 말뭉치 중 가장 이르게 구축된 말뭉치로, '현대 한국인의 독서 실태'에 관한 설문 조사에 의해 구축된 균형 말뭉치. 표본의 대표성을 확보하고 표본 선정 기준을 마련하기 위해, '전문가 조사'에서는 교과서의 배제 또는 표집 비율 조정, 문제 번역물의 표집과 관계된 문제, 독서물의 유목 분류 문제에 대한 조사가 이루어졌으며, '일반인 조사'에서는 전문가 연구의 결과를 토대로 구축됨. 샘플 텍스트 말뭉치. 자세한 것은, 정찬섭 외 (1990:7~70) 참조 바람.

290만

2 연세 말뭉치2
(균형말뭉치)
도서 대출 빈도에 따른 균형 잡힌 말뭉치를 구성할 목적으로 주제별 선정 기준을 사용함. 문헌정보학적 방법을 응용한 것으로, 가능한 모든 주제 분야의 낱말이 망라되도록 하기 위해 듀이 섭진 분류법(Dewey Decimal Classification) 을 이용하여 한국어 문헌을 크게 열 가지 대범주(총류, 철학, 종교, 사회 ,과학, 언어학 ,순수과학, 응용과학. 예술 ,문학, 역사 등의 분야)로 나누어 수집함. 또한 도서의 대출 빈도는 각 낱말의 인지도를 간접적으로 나타낸다는 전제 아래, 주로 1987~1988년의 도서를 대상으로 대출빈도가 높은 자료를 중심으로 하여, 234개의 표본을 선정하여 1990년~1988년에 걸쳐 구축됨. 총류(7.8%), 철학(9.9%), 종교(10.7%), 사회과학(12.8%), 언어(5.7%), 순수과학(11%), 응용과학(11.7%), 예술(8.1%), 문학(11.2%), 역사(11.3%) 등의 주제별 구성으로 구축되어 있음. 110만
3 연세 말뭉치3
(1980년대말뭉치)
사람들이 많이 접하는 문헌에 각 낱말의 인지도가 간접적으로 반영된다고 보고, 1980년대 우수 출판물 목록에서 표본을 선정. 598만
4 연세 말뭉치 4
(1990년대 입말뭉치)
실제 사용된 입말을 녹음하여 전사하는 '순수 입말'(구어)과, 희곡, 방송 대본, 시나리오 따위를 중심으로 한 '버금 입말'(준구어)로 구성. 대화(26%), 강연(24%), 상담(14%), 희곡·대본(13%), DJ방송(13%), 토론(8%), 회의(2%), 등의 내용으로 구성되어 있다. 다른 글말뭉치와는 달리, 여기에는 발화자 참여자의 나이, 성별, 직업에 대한 정보, 발화참여자의 수와 발화의 성격, 전사자의 정보, 녹음시간 정보 등이 덧붙여져 있음. 77만
5 연세 말뭉치 5
(1980년 대)
1970년대 문헌을 대상으로 하여, 교과서에서 신문에 이르는 다양한 문헌 자료로 구성. 1970년대 문헌을 대상으로 하여, 신문(10%), 소설·수필(50%), 일반 서적(35%), 교과서(5%), 등의 문헌 자료를 수집함으로써 구축됨. 860만
6 연세 말뭉치 6
(1960년 대)
해방 이후의 우리말의 모습을 제대로 반영한 말뭉치 구축을 위해, 1960년대 문헌을 대상으로 하여 말뭉치를 구축하기 시작하였으며, 1000만 어절을 목표로 하고 있음. 723만
7 연세 말뭉치 7
(1990년 대)
1990년 대 중반까지의 자료로 주로 소설과 수필로 이루어져 있음. 1994년부터 1995년에 걸쳐 구축됨. 1,367만
8 연세 말뭉치 8
(교과서)
초등학교 전 과목 및 중·고등학교의 국어, 사회를 중심으로 구성. 제5차(한영균 말뭉치), 제6차 교과과정의 두 종류. 87만
9 연세 말뭉치 9
(아동도서)
순 우리말의 사용 빈도가 높고 문장도 비교적 우리말의 구조에 맞게 사용되는, 아동 교육용 도서 중에서 적합한 자료를 선정하여, 1996년에 구축됨. 150만
10 연세 말뭉치 10 (1945~1965년
단행본)
<연세 현대한국어사전> 편찬을 위해 보완된 1시기(1945~1965년) 말뭉치 중 단행본으로 구성 78만
11 연세 말뭉치 11(1945~1965년
교과서)
<연세 현대한국어사전> 편찬을 위해 보완된 1시기(1945~1965년) 말뭉치 중 교과서로 구성 73만