Conversation
Notices
-
Embed this notice
ピッカマンV (pikkamanv@social.nauka.moe)'s status on Thursday, 23-Jan-2025 09:37:09 JST ピッカマンV
日本語に強くてエロも書けるそこそこ賢いモデルとしては東工大のLlama 3.1 Swallow 70B Instruct v0.3があるが、70BあるのでVRAM 16GB x2ではIQ3_M量子化モデルが限界で、4bit量子化ではメインメモリにはみ出してしまいチャットで使うには遅すぎる
https://social.nauka.moe/notice/AqLFlWIcVwVwEnKvYm