Enhancement for Supporting Language Analysis in Full-Text Search System 'Himawari'
- Resource Type
- Authors
- Masaya, YAMAGUCHI
- Source
- 言語資源活用ワークショップ発表論文集 = Proceedings of Language Resources Workshop. 1:226-233
- Subject
- Aozora Bunko
国会会議録
青空文庫
Nagoya University Conversation Corpus
名大会話コーパス
The Minutes of the National Diet of Japan
- Language
- Japanese
会議名: 言語資源活用ワークショップ2016, 開催地: 国立国語研究所, 会期: 2017年3月7日-8日, 主催: 国立国語研究所 コーパス開発センター
本稿では,筆者が開発している全文検索システム『ひまわり』の言語分析支援機能の拡張について述べる。元来,『ひまわり』は言語資料の検索と閲覧を目的に設計されたコンコーダンサであり,検索結果を分析するための機能を十分に備えていなかった。しかし,検索対象の資料の規模が大きくなると,大量の検索結果を単に表示するのではなく,集約して分析する必要性が生じる。また,検索結果の統計的な分析には,資料に含まれる文字数といった,基本的な情報を計測できなければならない。そこで,(1) 検索結果の集約機能,(2) 統計的分析のための基礎データの収集機能を『ひまわり』に実装した。拡張された機能を用いることにより,例えば『名大会話コーパス』の各会話中の発話数,文字数,単語数,特定の単語の出現数といった情報を収集できるようになる。