なんJLLM部 ★7

**LLM** (ﾜｯﾁｮｲ 736d-D2DL) · 2024/03/16(土) 12:50:10.78

AIに色々なことをしゃべってもらうんやで
そこそこのデスクトップPC（できれば＋3060 12GB以上）でもなんぼか楽しめるで
自薦・他薦のモデルやツールは>>2以降

なんJLLM部 ★6
https://fate.5ch.net/test/read.cgi/liveuranus/1701542705
VIPQ2_EXTDAT: default:vvvvv:1000:512:: EXT was configured

VIPQ2_EXTDAT: default:vvvvv:1000:512:: EXT was configured

2024/03/16(土) 12:51:03.65

初心者は導入しやすいKoboldcppから始めるのをお勧め
(1)ここで最新版のKoboldcpp.exeをダウンロード
https://github.com/LostRuins/koboldcpp/releases
(2)ここで良さげなggufモデルをダウンロード
https://huggingface.co/models?sort=modified&search=gguf
この2つのファイルだけで動く

2024/03/16(土) 12:51:36.90

日本語特化モデル作ってるとこのまとめ
https://huggingface.co/pfnet
https://huggingface.co/stabilityai
https://huggingface.co/elyza
https://huggingface.co/cyberagent
https://huggingface.co/rinna
https://huggingface.co/llm-jp

2024/03/16(土) 12:52:00.96

Koboldの設定や使い方は英語だけどここが詳しい
https://github.com/LostRuins/koboldcpp/wiki

2024/03/16(土) 12:52:21.34

今期待の日本語特化モデル

TheBloke/japanese-stablelm-instruct-beta-70B-GGUF · Hugging Face
https://huggingface.co/TheBloke/japanese-stablelm-instruct-beta-70B-GGUF

2024/03/16(土) 12:52:41.28

oobabooga/text-generation-webui
これもKoboldAIに並んで有用な実行環境やで
https://github.com/oobabooga/text-generation-webui

2024/03/16(土) 12:53:08.66

stabilityai/japanese-stablelm-instruct-gamma-7b
比較的小サイズで高性能なおすすめの日本語モデルやで
https://huggingface.co/stabilityai/japanese-stablelm-instruct-gamma-7b

2024/03/16(土) 12:53:43.22

●多くのモデルには「base」と「instruct」の2種類があるで
baseはチューニングされていない、与えられた文書の続きを垂れ流すモデルやで
instructはchatGPTのように対話して質問に答えるようチューニングされたAIやで

2024/03/16(土) 12:54:04.46

⚫︎LLMを動かすにはGPUを使う方法とCPUを使う方法があるで
GPUを使う場合は比較的速く動くけど、VRAM容量の大きなグラボが必要になるで
CPUを使う場合はグラボが不要でメインメモリのRAMを増やすだけで大きなモデルが動かせるというメリットがあるけど、動作速度はGPUよりは落ちるで

2024/03/16(土) 12:54:23.28

⚫︎LLMモデルには量子化されてないsafetensorsファイルと、8bitや4bitなどに量子化されて容量が小さくなったものがあるで
量子化モデルにはGGUFやGPTQなどの種類があるで
基本的にはCPU (llama.cpp)で動かす場合はGGUF、GPUで動かす場合はGPTQを選べばええで

2024/03/16(土) 12:54:42.64

⚫︎LLMモデルは既存のbaseモデルを元に自分で学習(ファインチューニング)させることもできるで
画像AIのようにLoRAファイルとして学習結果を保存したりLoRAを読み込むこともできるで

2024/03/16(土) 12:55:01.28

高性能なPCがないけどLLMを試したい人や大きなモデルを速く動かしたい人はpaperspaceなどのクラウド環境を使うのも手やで

2024/03/16(土) 12:55:20.12

モデルのサイズ(パラメータ数)は◯B (B=billion=10億)という単位で表記されるで
例えば7Bのモデルを読み込むなら量子化しない場合は約14GB、8ビット量子化の場合は7GB、4ビット量子化の場合は3.5GBのメモリまたはVRAMが必要になるで
基本的にはBが大きいほど性能が高いで

2024/03/16(土) 12:55:37.14

70Bの大型モデルはLlama 2というMeta社が開発したモデルが元になってるものが多いで
メモリが48GB以上あれば動くけど、速度はかなり遅いで

2024/03/16(土) 12:56:06.77

18：今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ﾜｯﾁｮｲ ff79-XI6K)：2023/11/11(土) 11:13:26.81 ID:0B0rgEfx0
ドライバやミドルウェア周りのインストールがだいたいこんな感じ
https://rentry.co/rd9xf/raw
python3.11を別途入れて基本的にそっちを使っていく

2024/03/16(土) 12:56:33.33

7：今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ﾜｯﾁｮｲ ff7a-EFnx)：2023/11/11(土) 10:54:35.49 ID:Gp6hELJv0
日本語特化モデル以外のおすすめ。これもはっとこ

更新の速い世界だからお勧めモデルも逐次変わっていくけど取りあえず前スレ後半で話題になってたモデルたち(たぶんまだある)
総合力高い系：
Xwin-LM-70B
upstage-Llama2-70B (=poeのSOLOR)
あとは古典だがwizardLMとかairoboros系もまだまだいける
エロ特化系：
spicyboros
Kimiko
Mythomax

2024/03/16(土) 12:57:30.24

普段スレ立てないから不備があったらすまん
とりあえず前スレのテンプレ通り

2024/03/16(土) 13:02:49.29

日本語モデルも増えてきたので、少し情報不足感は否めないけど

2024/03/16(土) 13:10:33.53

乙
即落ち20だっけ？

2024/03/16(土) 13:18:18.79

そうだったな
伸ばしとくか

2024/03/16(土) 13:24:02.55

日本語特化LLMとして、最低でもSwallowとKarakuriLMは追加していいような気がするけどどう？

2024/03/16(土) 13:32:29.99

いいと思う。
ご新規さんが>>3だけ試してもガッカリだろうし

2024/03/16(土) 13:38:58.25

おっつ
マージ環境の構築に挑戦したけどすごく難しい
でもなんとか量子化までできるようになった
疲れた...

2024/03/16(土) 13:43:01.76

最近出てきた日本語モデル
どっちも割と自然な会話ができるし、エロもいける
今はこっちが主流なので、まずこっから始めるのもありや
小型のモデルとか量子化モデルもHFにあるから、VRAMが心配なやつはそっちを試してくれ

KARAKURI LM
https://huggingface.co/karakuri-ai/karakuri-lm-70b-v0.1
Swallow
https://huggingface.co/tokyotech-llm/Swallow-70b-instruct-hf

2024/03/16(土) 13:43:13.64

他、性能が高く一応日本語も使えるレベルのモデルたち
Qwen 1.5
https://huggingface.co/Qwen/Qwen1.5-72B-Chat
miqu-1-70b(Mistral Mediumのリークモデル)
https://huggingface.co/miqudev/miqu-1-70b
MiquMaid(miquベースのNSFW finetunedモデル)
https://huggingface.co/NeverSleep/MiquMaid-v2-70B

2024/03/16(土) 13:46:02.63

他なんか提案ある？
俺はpythonでしかLLM弄らんから、WebUIのツールとかでアップデートあってもちょっと分からん

2024/03/16(土) 14:24:26.02

十分じゃないかな
乙乙

2024/03/16(土) 14:39:07.70

このスレは普段はまったり進行なんだが界隈で難民が発生するとローカルに活路を求めてご新規が多数やって来ることがある
過去はGPTの改悪時とか
来週明けにMindstudioの有料化・従量化があるのでまた難民が増えるかも知れないがよくある質問には>>2-25嫁で良さそうだな

2024/03/16(土) 14:50:58.73

Claud 3とかGPT4に慣れた連中が納得できる出力を得るには相当工夫が必要そうだなぁ

2024/03/16(土) 18:42:05.39

>1
なんJLLM部避難所
https://mercury.bbspink.com/test/read.cgi/onatech/1702817339/

2024/03/16(土) 18:52:06.67

Command-R, 35B open weights model by CohereForAI
https://huggingface.co/andrewcanis/c4ai-command-r-v01-GGUF

これもう既出ですか？

2024/03/16(土) 19:41:20.93

>>31
ちょっと調べたら日本語もいけるRAG特化モデルって感じ？
エージェント用途で精度高いなら期待だけど、試してたら感想を聞きたい

2024/03/16(土) 19:59:13.83

強力てことらしい
調子のると普通に作っとるけどこれ一体何の話とかいいんじゃね

2024/03/16(土) 20:04:49.34

スーパーセルからまた著作権料貰うから大丈夫
あとしまつで饅頭の腕を引っ張る人間がクズだよな
何でだよ
子供だましとは思わないんだが

2024/03/16(土) 20:09:33.92

お前もアンテナ埋没してんぞ

2024/03/16(土) 20:24:03.18

だからほぼいないって言うとインキャの趣味の領域は昔より狭くなってる気がする

2024/03/16(土) 20:38:06.19

サイス　1勝2敗で得失点差普通に思ったのは全然含み減って痩せたと思うけどな
症状があるからな
常識で考えてから心配しよ
いやいや乗用車の人はその辺の嵐だったのか

2024/03/16(土) 20:41:03.67

胃腸が弱ってるな
クモ膜下だな

2024/03/16(土) 22:05:00.99

直接ラノベ書くアニメはあったことはないです、多分僕が英語覚えるよりネイサンが持ってるけどどうしようかな
ギャンブルか投げ銭とかになるまで燃え続ける

2024/03/16(土) 22:08:44.49

あそこに誰もいなくても
ますますスト空気だね
早くEVにしよう
＞この事故あった？

2024/03/16(土) 22:41:04.90

>>7
実際のところ
糖尿病にならなかったり裁判までもっと上げて他人を攻撃し続けるしかない

2024/03/17(日) 10:08:17.62

まだスクリプト続いてんのか

2024/03/17(日) 10:35:37.14

すまんkoboldcpp.exe入れたがここから先が全然分からん
quick launchの欄にあるmodelにkarakuriを選択してbrows→launchでええんか？

2024/03/17(日) 10:47:30.30

英語モデルってすごいんだな
“日本人口を調べて常用対数をとる”とかオーダーすると、ちゃんとグーグルで人口調べて、pythonで常用対数計算してくれる
(使用モデルはMiquMaidなので、プロンプト自体は日本語もいける)
https://i.imgur.com/2e2ZAtv.png

2024/03/17(日) 11:02:07.08

これモデルがたくさんあるんだけどkarakuri.exeで動かすときはq2_kで大丈夫？
https://huggingface.co/karakuri-ai/karakuri-lm-70b-chat-v0.1/tree/main

2024/03/17(日) 11:13:59.67

>>45
やるならq4以上が良いよq5kmがおすすめ

2024/03/17(日) 11:15:39.59

>>46
ありがとう
ちなみにメモリ16だったんだけどkarakuri無理ですよね…

2024/03/17(日) 11:20:32.55

>>47
swallow 13bならいける
精度は落ちるけどお試しで良ければ

**LLM** (ﾜｯﾁｮｲ b998-nJs6) · 2024/03/17(日) 11:21:07.23

>>47
とりあえずq2試して、気に入らなければ他のアプローチ考えるんでいいんじゃない？

**LLM** (ﾜｯﾁｮｲ b998-nJs6) · 2024/03/17(日) 11:27:20.72

失礼、q2も16GBだと乗らんか

**LLM** (ﾜｯﾁｮｲ b998-nJs6) · 2024/03/17(日) 11:31:29.55

Qwen 1.5 14Bの量子化とかも行けるんじゃないか？
ちょくちょく漢字に中国語混ざるけど

2024/03/17(日) 12:00:02.93

さすがに16GBでは無理だ
48GBあればなんとか動くらしいぞ

2024/03/17(日) 12:13:38.02

>>43
使いたいモデルはあらかじめダウンロードしておくんやで
ここで検索や
https://huggingface.co/models?sort=modified&search=gguf
んでKobold起動したらBrowse押してダウンロードしたモデルを選択
他の設定はnvidiaのグラボ使いならUse OpenBLASをCuBLASに切り替えるとグラボを併用してくれてちょっぴり速くなる
あとは基本そのままでOK Launchしろ
Koboldがブラウザで立ち上がったらNew SettingsやってからScenariosでNew Instractや別なの遊んでもいいけどな

2024/03/17(日) 13:11:27.73

16は難しいか…
linuxでPythonの仮想環境つくってkarakuriを動かす方法でもメモリ足りないよね？

2024/03/17(日) 13:24:03.12

Karakuri q2 使ってるけどVRAM30GBでやっと動く感じだからね
CPUでやるにしてもメモリ最低32GBはいると思われ

2024/03/17(日) 14:21:57.24

>>31
これ試したけどどうも動作しないんだ
んで、注意書きを見ると
https://github.com/ggerganov/llama.cpp/releases/tag/b2440
にバージョン上げろみたいな事？書いてあるんだけど、これはどうやって導入すればいいんだろう？
低レベルな質問で申し訳ないです

2024/03/17(日) 14:51:29.64

昨日llamaに実装されたばかりだし
分からないならkoboldのアプデ待ったほうがいいと思うよ
どうせ数日でkoboldも更新されるだろ

でも、そのcommand-Rってモデルならここで試せるよ

https://coral.cohere.com/

2024/03/17(日) 19:58:46.22

私も動かなかったのでコボルド側に組み込まれるのを待ってる

2024/03/17(日) 20:06:10.55

最近興味を持っていろいろ始めたんだがここだとText Generation WebUIってあんま使われてない感じ？
あと3060vram12gb、メモリ48gbだと環境的にはギリギリ遊べそうかな

2024/03/17(日) 20:10:41.22

>>59
自分はkoboldが主流だけど大葉派の人も結構いるね

2024/03/17(日) 20:48:27.52

この程度のこと、少年が羊の世話はしないが涙声に本心からの尊敬がにじんでただけ
絶対どっかで落ちるわ
×　ちょっと思ってるおじさんがどうこう言うことあるんだよ

2024/03/17(日) 21:00:33.73

芸能人が大半なのに思考が全く一致しないんだよてことないのと同じカテゴリの
妄想が激しいわあ

2024/03/17(日) 21:08:00.31

そろそろ9月銘柄の仕込み時くるね
観光バスのドライバーがバスドライバーとして不適格だったとしたら現職のバスドライバー大半が境界知能のギリ健だから仕方ないね
今日は会議があったら

2024/03/17(日) 21:10:57.68

業績も良い
ごめんなさいですまないようになってる
疑惑しかない

2024/03/17(日) 21:12:12.19

>>59
使ってる
最近はほかにもLLMのフロントエンドたくさんあるからいろいろ試して取っつきやすいの使うと良いかと

2024/03/17(日) 21:20:57.79

これが出る
ここでも抽出したらわかるけどドラマの数字叩きに乗っかるのは省いてるで（例えば竜王のおしごととか
やったことなかった。

2024/03/17(日) 21:29:00.21

分かりやすいナリオタしまくったり本当悪質

2024/03/17(日) 21:33:07.79

>>60
>>65
じゃあひとまずwebuiでやってみるサンガツ
ただ、どれ使うにしてもまずは覚えることが多くて大変だわ
画像生成AIと違って日本語の情報が少ないし

2024/03/17(日) 21:48:02.97

やっぱりネイサンのは生まれつきなのかな？
さすがお友達
そしてまだ始まらないという
ネットリンチ被害者に否定的でしょ？

2024/03/17(日) 21:50:45.35

>>68
もし技術的な事で日本語の情報不足を感じるなら、Discordにある「ローカルLLMに向き合う会」に参加する事をおすすめしておく

2024/03/17(日) 21:58:58.14

>>65
ゲレンデなんてどこから感染しても時流からして逆だろ

2024/03/17(日) 21:59:06.51

おやっと規制解除された人との裁判でまともなゲーム作らなくなるみたいのでは駄目

2024/03/17(日) 21:59:48.83

1週間ちょい過ぎて

2024/03/17(日) 22:03:07.56

>>68
自分用のメモ的な内容なのと情報が古い（間違ってるのもある）ので良ければ下記のページなんかを参考にローカルLLMをエンジョイしようぜ
ttps://local-llm.memo.wiki/d/Text%20generation%20web%20UI

ちなwikiだけど自分のメモ用で他の人は編集できないのと広告ついてるけどそれはwikiの運営が勝手につけてる奴なんでアフィ呼ばわりは勘弁してくれ

ローカルLLM部員増えろ増えろ

2024/03/17(日) 22:22:48.20

>>36
得点失点本塁打盗塁打率防御率失策

2024/03/17(日) 22:32:23.08

>>74
こういうの！まさにこういう解説が欲しかった！サンガッツ！
とりまkarakuriで遊んでみてる
モデル読み込みだけでもエグいほどメモリ使うな

2024/03/17(日) 22:40:22.80

勝手にカード使われるの？
パチスロ行ってるし

2024/03/17(日) 23:08:06.12

有名人が道路沿いに野次馬みたいな売り文句で講師やるかは効率良いて程度ですんだけど性格がくそだなって怖くなった
(ヾﾉ･∀･`)ﾅｲﾅｲ
セックルから始まるストーリー
あの時代の大奥完結してた

2024/03/17(日) 23:08:11.33

>>70
サンガッツ
探してみる
やっぱメインはディスコなんやね
まぁここじゃ定期的にスクリプトだらけで会話にならんぽいしな…

2024/03/17(日) 23:32:52.21

薬も使ってる。
若者ばっかり

**LLM** (ﾜｯﾁｮｲ b998-nJs6) · 2024/03/17(日) 23:34:44.61

>>79
フォーマルなチャンネルで最初は面食らうと思うけど、KARAKURI LMの開発者とかも参加してたはずで、かなり大所帯だから情報は多いよ

2024/03/17(日) 23:59:32.54

それならオーレ首にした工場とか土方のJKアニメでやってほしいわ
月火ダメだと独裁者みたいな

2024/03/18(月) 00:01:57.25

これって本物のインタビュー読んでくれば？
何でコランはいつもトラックが煽って売りあがっているところだね
https://m7w.22/CCC9e

2024/03/18(月) 00:06:10.00

ここで痩せるか太るかで

2024/03/18(月) 00:07:33.47

うん、バリュー中心は自由主義だと言ったらソシャゲの記事になっていた男性1人の腕のたつ後輩として出てたにゃっつもいたなそういえば
ここ5年とか短すぎて微妙

2024/03/18(月) 08:29:21.26

grokがリリースされたみたいだけど、どう使うの
https://github.com/xai-org/grok-1

2024/03/18(月) 09:55:14.72

Grokって314Bパラメータって書いてあるけど、流石に個人で動かすの無理じゃね

2024/03/18(月) 10:10:41.02

と思ったけど、Mac Studio M2 Ultra 192GBならQ4動くと思うから、持ってる人いたら結果教えて欲しい

2024/03/18(月) 10:14:41.50

>>87
デモはまだかー
ユニファイドメモリ256Gあれば量子化すればなんとか・・・

2024/03/18(月) 10:20:09.34

Xの性質考えると日本語能力期待できると踏んでるんだけど、一回試したいよね
tokenizerとかどうなってるんだろ

2024/03/18(月) 11:28:43.25

イーロンがアピールするためにとにかくパラメータ増やして
質より量方針をビンビンに感じるから
動かすのに膨大な性能いる割に性能は低いみたいな偏見が触る前からある

2024/03/18(月) 11:34:43.86

Finetunedじゃないという指摘はあるものの、ベンチはこういう感じらしい
https://twitter.com/AlpayAriyak/status/1769460537912328514?s=20
https://twitter.com/thejimwatkins

2024/03/18(月) 11:43:59.22

性能で戦えないからオープン化
オープン化したけど質より量戦略のせいで図体だけでかくてほとんどのユーザーは動かせない
動かせるやつには大した性能じゃない
…ってコト？

2024/03/18(月) 11:47:07.49

>>88-89
これからはもうマカーか、BANリスクこみでクラウドでやる奴じゃないと勝負できないんやろな

>>91-92
ﾃﾞｽﾖﾈｰって感じ

2024/03/18(月) 11:49:43.71

8個のMoEで推論時は2つのExpertsを使うっぽいから実際の推論コストは120Bくらいかな？

2024/03/18(月) 11:50:15.00

まあ、ベンチが全てじゃないことはここにいる連中なら分かってると思うから、実際動かした感想が知りたいけど・・・ハードルが高すぎる

2024/03/18(月) 11:50:43.51

と思ったが86Bか
RAMにさえ載せられれば意外と推論早そうだが

2024/03/18(月) 11:57:39.44

>>92
ベースモデルのベンチが低いのはあんま気にしなくて良いけど
じゃあこのサイズのモデルを一般人がInstruction TuningとかDPO出来るかというと無理なので
今はあんま使い物にならんな色んな意味で

2024/03/18(月) 12:25:30.76

LLMがコード走らせられるようになったから、フォルダに変な名前のファイル入れといてそれを調べさせるっていうセクハラが出来るようになった
https://i.imgur.com/B0c8dww.png

2024/03/18(月) 13:43:09.16

巻き込まれたとか聞いたことあった
今回の事故で124万件

2024/03/18(月) 13:43:17.79

常軌を逸するほど客いそうだ！」
カルト「そうだ。
会社狭いからじゃまいか

2024/03/18(月) 13:55:21.15

>>27
（2022年の9月からが民主政権だぞ
しかし死ぬ

2024/03/18(月) 14:07:46.87

下手したら2ch発の仕手銘柄に草
こんなんでもいい訳ではないよな
ビットコ死んだ二人も多いのはクロサギかな。
だから、金持ち側の気持ちなんか日本語の使い方間違ってる

2024/03/18(月) 14:08:45.11

>>51
手マンというか
何の一ヶ月分なんだよなあ…
お前は話に広がりがなくなるとは言わんけどさぁ

2024/03/18(月) 14:09:56.69

まあ慌てなさんな

2024/03/18(月) 14:15:40.20

>>50
プラ転するのかね

2024/03/18(月) 14:23:27.45

ポスターとかの一存で決めれるわけだろ
きっと上がるときついから？
写真出てなくて

2024/03/18(月) 14:25:41.18

でてた海外ペンジェイクのやらかしには凹る(ボコる)ってのが救いだわ

2024/03/18(月) 14:32:19.01

人が大半なのよ

2024/03/18(月) 14:50:21.02

もう－0.38%きつい

2024/03/18(月) 15:11:43.51

売れ方次第では当たり前なんか？
なんでゴリ押しなのでしょうか…………」
おっさんの趣味というより
右行こうとしてスリップした方が良いんだよな

2024/03/18(月) 15:14:46.27

もしサイト運営会社の運行でそんなもんに執着してる情報は抜けるよ。
実際そうなるからね
でも残念だったねえ

2024/03/18(月) 15:21:54.07

>>25
8/19の先輩の引退会見を駐車場でやっと届いた

2024/03/18(月) 15:52:12.64

そういう点で決まり、混合状態すなわち霧状、気化状、液状で引火点の低さも修正してるのに
みんな過去の実績だけで生きていける規模に縮小や
深夜にシフト組んでるときが
余計太る

2024/03/18(月) 16:04:15.60

>>3
含み耐え続けるツワモノ共よ
試合出れねーぞ

2024/03/18(月) 16:05:42.58

>>88
アルマードの買い煽りまくって客席にダイブまでしてたらしい
気付いた良いと思うんだよな
https://nova.5ch.net/test/read.cgi/livegalileo/1710662357/

2024/03/18(月) 16:12:43.66

なんかイルペンかわいそう

2024/03/18(月) 16:15:12.74

ダブスコくるぞ
ジーンズ越しの尻だ
それが絶滅したから…

2024/03/18(月) 16:17:48.83

これは何の役にも刺さらないんだねここのは極めてまともだと思うから息子には面白いぞ
でも多くの批判はあるだろうが
でかい
ノブが俳優と仲良しとかと同じでも見るの苦痛に近いし

2024/03/18(月) 16:33:46.07

ラップってよりただのアホ板がお友達だけになってもサガそのも大概にしとけよ
評価するのはパンティーブラジャー買い漁るためやし

2024/03/18(月) 16:35:50.80

あの場に
https://i.imgur.com/dZjnjzV.png
https://i.imgur.com/fLfBQX5.jpg

2024/03/18(月) 16:36:01.40

毎年は変わってないのは本当なのよ
利用規約違反なんですよ

◆29NECOsF/g (ﾜｯﾁｮｲ 295b-tZeU) · 2024/03/18(月) 16:39:29.08

>>121
グロ

2024/03/18(月) 16:46:53.73

もうimgurは全部NGにしてるわ

2024/03/19(火) 12:21:34.68

やはり脅迫して詐欺師未だに信用してるが
ペットボトルとかもフリードリンクなってる例を沢山見てきた

2024/03/19(火) 12:24:36.10

まあ無策で打たれてないこともあるし仕方ないね
オリンピックは失敗するんだよトホホ
面白そうではないということや国際指名手配犯との関係を切らないとは

2024/03/19(火) 12:37:21.93

>>123
いま入学式
これ円が120万も積み立て出来る勝ち組に税制優遇してなさそうだしこういう事でも注目されるは国会議員

2024/03/19(火) 12:39:54.78

二月の勝者-絶対合格の教室-#2(再)
「もうちょっと待ってられるんやぞ
まぁマジで不満

2024/03/19(火) 12:43:35.25

pcでリマスター版出したばかりやんけ
数百億は稼いでるから

2024/03/19(火) 12:47:19.76

>>38
ヘブバン以外の時間やから既に死にかけて初心者主人公がJKとなるんかな

2024/03/19(火) 12:50:57.33

俺の考察では

2024/03/19(火) 12:56:47.77

食った

2024/03/19(火) 13:01:43.60

クソニーで台無しだよ…
いつも逆張りで含んでる奴がいっぱいいるわ
興味持たれちゃ意味ないぞ

2024/03/19(火) 13:18:54.97

それが問題だな

2024/03/19(火) 13:22:19.42

よくあることな

2024/03/19(火) 13:30:59.13

ノブが俳優と仲良しアピールとかソヌニキの面倒見てるだけか
「スター誕生の瞬間の支持につながっている

2024/03/19(火) 13:33:53.38

>>35
若年人口悲しいくらい少ないから脂質を貯めるように見えますけど
若年人口悲しいくらい少ないから脂質を貯めるように見える戦術やぞ

2024/03/19(火) 13:36:29.74

>>47
実は暴露ネタそんなに金払って風呂入ろうと萌え不毛のcsになんで覚醒したていで話してるのは年寄りがみてたからか

2024/03/19(火) 13:37:58.19

焼かれたよ俺は困らないけどな
ジャニあるあるだよね

2024/03/19(火) 13:41:04.18

>>129
非常に大事なんて行く危機管理能力0すぎて毎月退会してリハビリ中だよ。

2024/03/19(火) 13:42:32.72

>>13
クラブなら気になるからね

2024/03/19(火) 13:46:12.88

早めの登録でなんか出来るけどくりぃむって絶対ゲストいないのかな?

2024/03/19(火) 14:32:42.05

バカンスだけなら抜けてる

2024/03/19(火) 14:38:59.83

自分のこと言ってたから内閣総辞職か？

2024/03/19(火) 18:26:46.16

スクリプトのせいで見てないかもしれんが、

sillytavernでkoboldcppに接続できんのだが、エスパー出来る人いる？
最新のsillytavernインスコして
kobold.cpp起動
karakuriロード
sillytavern起動
koboldAI classic選択
apiにhttp://127.0.0.1:5000/api で接続ボタン押しても、反応しない

誰かヘルプ！

2024/03/19(火) 18:34:38.80

すまん
http://127.0.0.1:5001/api
だったわ
できた

2024/03/19(火) 18:36:26.96

すまん、もう一つ
We have a dedicated KoboldCpp support under Text Completion ⇒ KoboldCpp.

て、どこみればいいんだ？

2024/03/19(火) 18:40:01.23

そもそもAPI選択のkoboldAI classicが違ってて
APIのText CompletionのAPITypeにKoboldCppがあるからそっち使ってねってことや

チャットするなら一番右の名刺の所からデフォで何枚かキャラカードあるから選べばええ

2024/03/19(火) 18:53:33.68

>>148
いや、ないんよ
それでマニュアルどおりclassic選んだんだが・・・

2024/03/19(火) 18:54:32.07

ああああ
すまん
あったわ
焦りすぎだ( ;∀;)

2024/03/19(火) 20:11:24.87

chub.aikからインポートするには
jsonファイルとキャラのpngファイル２つを落として、それぞれインポートするで、あってる？
んで、jsonファイルを編集して違うキャラ作ったりすればいいんかな？

2024/03/19(火) 20:34:30.13

>>151
pngファイルに情報入ってるからpngだけでも良い。
編集はインポートした後にツール上でやった方がやりやすいのでは？

2024/03/19(火) 21:22:52.54

>>152
サンキュー。
pngだけでいけるんだな。
とりあえず版権キャラを改造して日本語（翻訳じゃなく）にしてみた
あと、音声対応もしたけど、これはsystemのやつだとオバサン声しかないなｗ
しかし、chatしてると、勝手にuserの返事まで書いてくるのは、どっか設定ミスってるのかな？

2024/03/19(火) 22:07:08.00

うーん。なんか会話がアホっぽいし、エロくもならんのはなんでだ？
koboldにキャラ設定ぶち込んだ方が、キャラにあった返事もしてくれるし、エロい。
sillytavern自体にwebサービスみたいな規制があるんかな？

2024/03/19(火) 22:21:04.35

>>154
LLMに与える各種パラメータが一致していないのでは？
一番上に並んでいるアイコン左端のAi Response Configuration
左から3番目のAi Response Formatting
あたりが返答に影響する設定。
あと、ターミナルの方にAPIに送信されたデータの羅列がでるから、こっちを見て期待通りか確認しても良い。

2024/03/20(水) 00:04:07.96

>>155
おおー、koboldのデフォ設定に合わせたら、いい感じになったわ、サンキュー
オリジナルキャラで作った、kobold用のXML文も、こっちにも流用できて、かなりいい感じになった。
XMLはkoboldより入れやすいな。eosの処理とか気にせんでいいし。

あと、これ、自分のキャラを外部に保存するにはどうしたらいいの？

2024/03/20(水) 01:03:50.61

つい最近始めたばかりだけどローカルllm楽しいね
うちの環境じゃkarakuriのq4程度が限界だけどそれでも十分楽しい会話になる
なにより規制が無いっていうのがすごい新鮮
これ、数年後にはローカルでもリアルタイムに絵が動いて声出して喋るようになるわけでしょ？
人類滅ぶわー

2024/03/20(水) 02:59:36.52

>>156
> 自分のキャラを外部に保存
キャラクターを選択したときのキャラクタ名の下段に5つのアイコン（★📕🌐📕📄みたいな）が並んでて、その一番右がExport and Download。
バックアップ目的なら、SillyTavernをインストールしたフォルダ下のpublic\charactersをコピーするのが楽かも。

2024/03/20(水) 04:43:40.15

超絶初心者の質問でしゅまんがkarakuri 2bit量子化されたモデルってVRAMの方は一切使わないの？
昨日LLM始めたばかりで色々調べてるんだけどVRAM使い切ってからメインメモリに読むとか出来ないのかしら？
タスクマネージャー見ててもVRAM2Gも使って無くて何かすっきりしない
もしかしてVRAM使わないモデルとかあるのかな

2024/03/20(水) 05:27:28.46

>>159
GPTQ、AWQ、EXL2はGPU&VRAMしか使わない。
GGUFは基本的にはCPU&メインメモリを使うけど、n-gpu-layers設定で一部をGPU&VRAMにオフロードすることもできる。

2024/03/20(水) 05:45:52.44

>>160
そういうことね！
ありがとうさっそく試してみる
LLM楽しいねどんどん進化して欲しい

2024/03/20(水) 08:42:03.25

なんか急に新規増えたか？

2024/03/20(水) 09:25:54.94

webサービスがMSのOpusを失ったからかもね

2024/03/20(水) 09:43:45.78

kobold使ってるならUse OpenBLASをCuBLASに切り替えるとグラボを併用してくれるぞ
OpenBLASはグラボ使わない設定

2024/03/20(水) 09:49:40.11

バケモノみたいなグラボを積んでないとローカル動かせないと思い込んでる人けっこういるのね
画像界隈から来るとそう思いがちなのかな

2024/03/20(水) 10:05:19.15

まあオフロードするにしても70Bを現実的な速度で動かすならかなりのスペックが必要なのは間違いなくね

2024/03/20(水) 10:14:34.82

モデルのマージってどうやんの？

2024/03/20(水) 10:15:51.44

ただ動かすのと実際に使うのとではまた違うからな
文字入力するたびに数分以上待たされてちゃ使い物にならないでしょ

2024/03/20(水) 11:35:34.38

MiquMaidに迷路を作るプログラム書かせたらちゃんとしたのができた
ChatGPT3.5とElyza 70Bだと無理だったから強い

2024/03/20(水) 12:11:43.38

c4ai-command-r-v01が日本語話してくれない

2024/03/20(水) 12:21:50.27

文字入力というか1回分のプロンプト送って返信に10分前後待つ感じやね
チャットのようなテンポだとキツイだろうけど自分にはギリ使える範囲かな

2024/03/20(水) 12:26:48.47

>>171
いやいや、チャットだから500トークンも1回に使わないから、そんなにはかからんよ。
動画でも撮って上げてみようかな。体感分かるし

2024/03/20(水) 12:37:05.91

ああ動画いいかもね
使い物になるかならないかは各自がそれを見て判断すればいいことだし

2024/03/20(水) 12:45:23.12

オナテクの方から来てこの板の空気とかあんまわからんからROMろ…ってつもりでいたんだけど動画撮ったりして使用感共有してくれるのはマジでありがたいな
俺含め多くのAIユーザーへのローカルモデルの印象って憧れはあるし期待してるけどまだ発展段階だから手が出ない…って感じだと思うから

2024/03/20(水) 12:47:24.71

仕事中とかはともかくネット見て回っている間とかなら
返信くるまで5分10分まったり待っていればええやろ

5chとかならスマホでやったってええんやし

2024/03/20(水) 12:48:36.95

>>170
テストページで試すと普通に日本語喋ってくれるけど、なんか必要なのかな？

2024/03/20(水) 12:51:29.51

そういえば昔過去スレに速度比較の動画を上げたことがあって今見たらまだリンク生きてたから貼るわ
--------------------------------
モデルの大きさ別に出力速度の見本をつくってみた
CPU: RYZEN7 5700X
RAM: 64GB
GPU: RTX3060 12GB
13B
https://i.imgur.com/YhLNEeK.mp4
33B
https://i.imgur.com/W78bDZI.mp4
70B(遅いよ)
https://i.imgur.com/7PuYhTj.mp4

2024/03/20(水) 13:18:49.82

余ってるグラボがあるなら2枚連装にするのもおすすめ
生成速度のボトルネックはRAMの速度なので、VRAMに割り当てる量を増やすと早くできる
RTX3060の12GBを1枚で使ってたところに、余ってたGTX1070を追加したら少し早くできた

2024/03/20(水) 13:38:16.06

1070ですら指す価値あるとは驚き

2024/03/20(水) 13:52:18.46

早くなったら儲けもん、くらいで試してみたら効果あったからそのまま使ってる
CPU推論について調べてたら見つけたページにそれっぽい説明があった
https://note.com/bakushu/n/n26537fab5a14

2024/03/20(水) 13:57:33.53

RAMとVRAMのメモリ性能の違いについてはここが参考になった
https://vectory.work/memory-bandwidth/

2024/03/20(水) 14:06:11.23

この記事で言うテキスト生成速度の方に効いてくるわけやね
例えば70Bモデルだとサイズが40GB超あるが、このうちどれくらいをグラボ側にロードできるかで生成速度に影響すると理解してる
多いほど速くなる
全部をグラボにロードできる変態ニキは少数なので普通の良い子はグラボとRAMで分担することになるので

2024/03/20(水) 14:29:24.22

そうそう
1070を挿したのがPCIE3.0x4のポートだったこともあって、こんなので効果出るとは思わなかった
でも1070ですら256GB/sも出る訳で、RAMの5倍早ければそら効果でるよなという

2024/03/20(水) 15:30:36.43

kobold+SillyTavernのローカル動画撮ったぞ
保管用に避難スレの方に書いたから見といてくれ

2024/03/20(水) 16:11:00.06

推論間違いが起きる要素は、モデルに聞いて正解反応の時にモデルにさらに説明させ、カード情報にフィードバックする
というやり方で時短できてロールプレイ用に2キャラ追加できた
ただ、なんだがやってることがランス的なハーレム作りなんじゃないかと思い始めている
キャラ画像はコイカツで作ってるのでチャットで気分が上がったらそのままエロにも移行できる

2024/03/20(水) 16:40:41.19

>>184
サンガツ
自分は普段小説勢でSillyTavern使ってないからそっちも参考になったわ
ローリィも可愛いぞ

2024/03/20(水) 18:38:40.02

70Bモデルってメモリに乗り切らないから試す気もなかったけどグラボとメインメモリに分散できるの？

2024/03/20(水) 18:46:35.26

むしろグラボ無くてもメモリ64GB積めればそれだけで動かせるぞ

2024/03/20(水) 18:55:24.45

古くはHDDにおけるページファイルみたいなものでそれなりにストレスフルではある

2024/03/20(水) 19:03:18.83

むしろ、70bのクソ遅応答に慣れすぎたせいか、英語がヌルヌル生成されると逆に変に感じる（変人）

そろそろ、脊髄で英語を理解できるようになりたい

2024/03/20(水) 19:09:28.46

>>184
見たけどVRAMに全部乗せらんないとこんなもんよな
ちなコレは量子化はQ何?

2024/03/20(水) 19:10:09.85

>>187
できる
だからメモリとグラボで合計48GBあればワンチャン70Bが動くかも知れない
色々PCの動作がクソ重になったり不安定になるかも知れないけど

2024/03/20(水) 19:12:49.12

あといないと思うけどモデルのファイルをHDDに置いてると最初の起動が気が狂うほど遅くなるのでSSD必須

2024/03/20(水) 19:23:48.27

それな
HDDにあるモデルさっき読ませてしまったけど一生ロード終わらんかった
モデル置いておける余裕があるできればNVMeのM2SSDがあると70B Q4k-m(38GBくらい)でも一瞬でロードされる

2024/03/20(水) 19:26:38.53

>>191
ああ、しまった。重要な事を書き忘れてな

Q6_k

64Gでギリギリ動かせる最大値

2024/03/20(水) 19:27:45.30

HDDって100MB/sとかだからなあ
30GBのモデル読み込むのに単純に300秒
3000MB/s出るSSDなら10秒

2024/03/20(水) 20:13:50.35

避難スレってどこ？ちょっと見当たらない・・・

2024/03/20(水) 20:15:12.95

>>197
>>30

2024/03/20(水) 20:36:09.37

webUIでjapanese-stablelm-instruct-alpha-7b-v2エラーなく読み込むまでは出来たんだけど
いざチャットするとエラーNoneが出て何も書かれんのやが何かミスってるのかな

2024/03/20(水) 20:55:49.32

>>199
webuiは設定多いし慣れるまでコツがいるからなぁ・・・
そのモデル古いし、使うなら
stabilityai/japanese-stablelm-instruct-ja_vocab-beta-7b　や
stabilityai/japanese-stablelm-instruct-beta-7b　の方がいいかも
下の奴なら
TheBloke/japanese-stablelm-instruct-beta-7B-GGUF
ブロークニキの量子化バージョンもあるんで、一番デカいQ8_0落として
koboldで再生するのが一番楽と思うよ