이제 본문 붙여넣기 만으로 세트를 만들 수 있습니다!2018.08.29 17:20
managerid 운영자

지난 방학에 새학기 준비를 하면서 좀 특별한 기능을 추가하고 싶었습니다. 고민중에, 미추홀외고 박성한 선생님께서 고객센터를 통해 이런 글을 주셨습니다. 

"지문을 붙여 넣으면 단어장이 주르륵 만들어지는 것도 언젠가 있으면 좋을 기능같아요. 
지금 외부 논문에서 시험출제하려는데 단어장 만들려니 아.. 이것도 일이네요"

사실 선생님들은 교과서 뿐 아니라 인터넷의 다양한 텍스트를 이용하여 수업을 하시니 그 때마다 단어장을 만드는 수고를 하고 계시잖아요? 그걸 도와드리기 위해, 이 멋진 생각을 실현해 내고 싶어 졌습니다. 

  1. 약 1만개의 영어단어 DB를 만들고,
  2. 텍스트를 단어로 나누는 파서(parser)로 단어 목록을 뽑아 냅니다.
  3. 동사는 원형으로 바꾸고, 명사는 단수형으로 바꾸고, 형동사는 기본형으로 바꾸고...
  4. 다시 중복단어를 없애고, 정관사 등 단순 단어를 제거합니다.
  5. 학생 수준에 너무 쉬운단어들를 쉽게 제거할 수 있도록 단어를 난이도 순으로 배열한 후,
  6. 단어의 의미를 검색해서 결합합니다

이런 과정을 담은 "본문 단어 추출하기"를 완성하여 공개합니다. 

숙어를 추출하지 못하는 것이 아쉽습니다.이 문제는 계속 고민해 보려고 합니다.
그리고 본문에 사용된 의미 (context meaning)만 표시하는 것도 가능하지만 학습목적을 고려해 제한하지 않았습니다.

만들어서 직접 이런 저런 세트를 만들어 보니 신기하고 또 재미있습니다. 이걸로 선생님들의 세트를 만드는 일이 이전보다 더 편리해 지기를 기대해 봅니다.

박성한 선생님, 멋진 아이디어에 감사드립니다.