Conversation
Notices
-
Embed this notice
CHISE Project (Morioka Tomohiko) (chise@gnusocial.jp)'s status on Friday, 18-Nov-2022 21:22:59 JST CHISE Project (Morioka Tomohiko) (今日のコーパス班で話題になった ONCOJ
https://oncoj.ninjal.ac.jp/front_page_Japanese.html
には上代日本語の形態・統語解析アノテーションされたコーパス(TEI とS式)と辞書があって、形態素には ID もついててなかなか良い感じ)-
Embed this notice
CHISE Project (Morioka Tomohiko) (chise@gnusocial.jp)'s status on Friday, 18-Nov-2022 21:37:03 JST CHISE Project (Morioka Tomohiko) ( (コーパスは個人的には TEI よりS式の方が圧倒的に読みやすいが、これは個人差ありか。ただ、Lisper じゃなくても、論文とか教科書とかでは木かS式のような気がする。ちなみに、この分野、JSON は流行ってないのかな?)) In conversation permalink -
Embed this notice
CHISE Project (Morioka Tomohiko) (chise@gnusocial.jp)'s status on Friday, 18-Nov-2022 21:40:48 JST CHISE Project (Morioka Tomohiko) (ONCOJ の各文の原表記(万葉仮名)を形態素解析するのに、上代日本語 UniDic が使えないかと思って試してみたが、これは万葉仮名に対応してなくてだめだった。やっぱ、自分でつくらないとだめなのか?でも、作業用になんか作ってても不思議はない気もする) In conversation permalink
-
Embed this notice