Google Bardに聞いてみました。
「bag-of-words と transformerの間のようなニューラルネットワークの手法があったら紹介してください。」ふむふむ。引き続き、
「先程紹介していただいたもののうち、Twitterのツイートのような沢山の短いテキストを分類したり意味的な距離を推定するのに適したアーキテクチャーはどれでしょうか?」ふむふむ。
CNN, fastText, bidirectional LSTM, attention-based bidirectional LSTM などが挙がってきたが。
#Google #Bard #bag-of-words #Transformer #CNN #Tweet
Conversation
Notices
-
Embed this notice
sumiyaki (sumiyaki@misskey.cloud)'s status on Monday, 13-Nov-2023 16:45:45 JST sumiyaki
-
Embed this notice
sumiyaki (sumiyaki@misskey.cloud)'s status on Monday, 13-Nov-2023 17:26:43 JST sumiyaki
引き続き、Bardに聞きました。
「TwitterなどSNSの記事の相互の意味的距離を分析するopen sourceのツールがあったら教えてください。」ふむふむ。
Gensim, TextRnak, SimRank, word2vec, Glove, fastText,spaCy などが挙がった。
#Bard #NLP #Tweet #SNS #Twitter #AI -
Embed this notice
sumiyaki (sumiyaki@misskey.cloud)'s status on Wednesday, 15-Nov-2023 01:19:14 JST sumiyaki
Gensim を使い、まずはハッシュタグ分析からやってみようかな。bag-of-words だし。Anacondaライブラリにはいっているから、簡単にインストできるだろう。LDA (Latent Dirichlet Allocation)でトピックモデルの解析をするのかな。
データつまりtweet, toot, noteなどが大量に必要。Fediverse の Relayを使ってデータ集め。許可されるかどうか、その前にこちらにそのための技術とリソースがそろうかどうか。
Gensimにはword2vecなども実装されているそうだから、それも使えるようになるとよいな。
実際のスタートは来年になりそう。
#NLP #Gensim #topicmodel #トピックモデル #LDA #word2vec #AI
-
Embed this notice