Comainuとは
Comainuは、音声研究に適した中単位、及び、構文・意味研究に適した長単位を自動構成するツールです。
文 | 固有名詞仮名表記に関して論文を三本執筆した。 | ||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
文節 | 固有名詞仮名表記に関して | 論文を | 三本 | 執筆した。 | |||||||||||
長単位 | 固有名詞仮名表記 | に関して | 論文 | を | 三本 | 執筆し | た | 。 | |||||||
中単位 | 固有名詞 | 仮名表記 | に関して | 論文 | を | 三本 | 執筆し | た | 。 | ||||||
短単位 | 固有 | 名詞 | 仮名 | 表記 | に | 関し | て | 論文 | を | 三 | 本 | 執筆 | し | た | 。 |
機能
本ツールは以下の機能を持ちます。
長単位解析
平文または短単位列を入力すると、長単位を付与した短単位列を出力することができる。
中単位境界解析
平文または短単位列もしくは長単位情報を付与された短単位列を入力すると、中・長単位を付与した短単位列を出力することができる。
文節境界解析
平文または短単位列を入力すると、文節境界を付与した短単位列を出力することができる。
性能
長単位解析の性能は、BCCWJのコアデータを利用した実験において、長単位境界で99.2%、長単位品詞で98.8%の推定性能を示しています。本実験は短単位は適切な情報が付与されているという前提の下で実験されています。
中単位解析の性能は、BCCWJのコアデータの一部を利用した実験において、適切な長単位が付与されている前提の下で、99.2%の推定精度が得られています。
詳しくは関連文献などをご覧ください。