分散型のDBで検索機能ってどういう仕組みで組んだんだろ
Conversation
Notices
-
Embed this notice
門永 (kdng@mstdn.jp)'s status on Friday, 22-Sep-2023 09:49:41 JST 門永 -
Embed this notice
のえる (noellabo@fedibird.com)'s status on Friday, 22-Sep-2023 09:49:40 JST のえる @kdng 従来のActivityPubの仕組み通り、サーバに届いている投稿をインデックスするだけなので、ひとりサーバなどでは全然未知の投稿を検索できません。分散ならではの部分は……いまのところありません。
-
Embed this notice
のえる (noellabo@fedibird.com)'s status on Friday, 22-Sep-2023 10:37:15 JST のえる @kdng Elasticsearch設置の負担なども含め、連合の厚い中規模〜大規模なサーバが未知の情報の検索・発見を担い(なので必要ならそちらのアカウントを使い)、個人規模のサーバは自分の投稿や過去にみたものの読み直しに特化する方向になりそうです。
-
Embed this notice
門永 (kdng@mstdn.jp)'s status on Friday, 22-Sep-2023 10:37:16 JST 門永 @noellabo なるほど...あくまで検索者が所属するサーバの連合TLの中身から抽出できるといった感じですかね
-
Embed this notice
のえる (noellabo@fedibird.com)'s status on Friday, 22-Sep-2023 11:59:54 JST のえる @kdng 個人やテーマサーバなどの連合は、見たくないモノがほとんど含まれないという綺麗さが強みになるので、サーバによって検索結果が異なるというのは本当はとても面白いところです。
ある程度は大規模なところで検索して不要なものをカットする方が効率的ですが、不要なものが多すぎると不便になるので、そのあたりのバランスですよね。
-
Embed this notice
門永 (kdng@mstdn.jp)'s status on Friday, 22-Sep-2023 11:59:55 JST 門永 @noellabo 私はあまりバックエンドに明るくないのですが…S3との連携HowTo記事読んでみました。情報量もトラフィックも大規模サーバでないと、Twitterのような検索は難しそうな印象を受けました。
その分、情報の範囲が狭いなりの活用方法が様々生まれそうですね
-
Embed this notice