なんJLLM部 ★6

2023/12/03(日) 03:45:05.35

!extend::vvvvv:1000:512
AIに色々なことをしゃべってもらうんやで
そこそこのデスクトップPC（できれば＋3060 12GB以上）でもなんぼか楽しめるで
自薦・他薦のモデルやツールは>>2以降

なんJLLM部 ★5
https://fate.5ch.net/test/read.cgi/liveuranus/1699666391/

VIPQ2_EXTDAT: default:vvvvv:1000:512:: EXT was configured

2023/12/03(日) 03:46:02.23

初心者は導入しやすいKoboldcppから始めるのをお勧め
(1)ここで最新版のKoboldcpp.exeをダウンロード
https://github.com/LostRuins/koboldcpp/releases
(2)ここで良さげなggufモデルをダウンロード
https://huggingface.co/models?sort=modified&search=gguf
この2つのファイルだけで動く

2023/12/03(日) 03:46:51.33

日本語特化モデル作ってるとこのまとめ
https://huggingface.co/pfnet
https://huggingface.co/stabilityai
https://huggingface.co/elyza
https://huggingface.co/cyberagent
https://huggingface.co/rinna
https://huggingface.co/llm-jp

2023/12/03(日) 03:47:24.57

Koboldの設定や使い方は英語だけどここが詳しい
https://github.com/LostRuins/koboldcpp/wiki

2023/12/03(日) 03:48:36.62

今期待の日本語特化モデル

TheBloke/japanese-stablelm-instruct-beta-70B-GGUF · Hugging Face
https://huggingface.co/TheBloke/japanese-stablelm-instruct-beta-70B-GGUF

2023/12/03(日) 03:52:33.28

oobabooga/text-generation-webui
これもKoboldAIに並んで有用な実行環境やで
https://github.com/oobabooga/text-generation-webui

2023/12/03(日) 03:55:20.43

stabilityai/japanese-stablelm-instruct-gamma-7b
比較的小サイズで高性能なおすすめの日本語モデルやで
https://huggingface.co/stabilityai/japanese-stablelm-instruct-gamma-7b

2023/12/03(日) 03:57:50.79

●多くのモデルには「base」と「instruct」の2種類があるで
baseはチューニングされていない、与えられた文書の続きを垂れ流すモデルやで
instructはchatGPTのように対話して質問に答えるようチューニングされたAIやで

2023/12/03(日) 04:02:33.65

⚫︎LLMを動かすにはGPUを使う方法とCPUを使う方法があるで
GPUを使う場合は比較的速く動くけど、VRAM容量の大きなグラボが必要になるで
CPUを使う場合はグラボが不要でメインメモリのRAMを増やすだけで大きなモデルが動かせるというメリットがあるけど、動作速度はGPUよりは落ちるで

2023/12/03(日) 04:10:19.94

⚫︎LLMモデルには量子化されてないsafetensorsファイルと、8bitや4bitなどに量子化されて容量が小さくなったものがあるで
量子化モデルにはGGUFやGPTQなどの種類があるで
基本的にはCPU (llama.cpp)で動かす場合はGGUF、GPUで動かす場合はGPTQを選べばええで

2023/12/03(日) 04:16:54.30

⚫︎LLMモデルは既存のbaseモデルを元に自分で学習(ファインチューニング)させることもできるで
画像AIのようにLoRAファイルとして学習結果を保存したりLoRAを読み込むこともできるで

2023/12/03(日) 04:19:35.69

高性能なPCがないけどLLMを試したい人や大きなモデルを速く動かしたい人はpaperspaceなどのクラウド環境を使うのも手やで

2023/12/03(日) 04:30:28.44

モデルのサイズ(パラメータ数)は◯B (B=billion=10億)という単位で表記されるで
例えば7Bのモデルを読み込むなら量子化しない場合は約14GB、8ビット量子化の場合は7GB、4ビット量子化の場合は3.5GBのメモリまたはVRAMが必要になるで
基本的にはBが大きいほど性能が高いで

2023/12/03(日) 04:33:41.05

70Bの大型モデルはLlama 2というMeta社が開発したモデルが元になってるものが多いで
メモリが48GB以上あれば動くけど、速度はかなり遅いで

2023/12/03(日) 04:35:24.62

18：今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ﾜｯﾁｮｲ ff79-XI6K)：2023/11/11(土) 11:13:26.81 ID:0B0rgEfx0
ドライバやミドルウェア周りのインストールがだいたいこんな感じ
https://rentry.co/rd9xf/raw
python3.11を別途入れて基本的にそっちを使っていく

2023/12/03(日) 04:35:37.93

20までレスせんと即死するんちゃうん？

2023/12/03(日) 04:36:15.66

あ、すまん途中だったか

2023/12/03(日) 04:36:20.31

7：今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ﾜｯﾁｮｲ ff7a-EFnx)：2023/11/11(土) 10:54:35.49 ID:Gp6hELJv0
日本語特化モデル以外のおすすめ。これもはっとこ

更新の速い世界だからお勧めモデルも逐次変わっていくけど取りあえず前スレ後半で話題になってたモデルたち(たぶんまだある)
総合力高い系：
Xwin-LM-70B
upstage-Llama2-70B (=poeのSOLOR)
あとは古典だがwizardLMとかairoboros系もまだまだいける
エロ特化系：
spicyboros
Kimiko
Mythomax

2023/12/03(日) 04:39:07.72

>>16
せやな

2023/12/03(日) 04:39:50.98

はい

2023/12/03(日) 04:40:54.69

お通夜で

2023/12/03(日) 05:26:02.77

あれ？

2023/12/03(日) 08:05:10.08

建て乙やで
前スレなんで突然落ちたん？

2023/12/03(日) 11:29:53.71

10 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ﾜｯﾁｮｲ 7f1d-ZlS5) sage 2023/11/11(土) 11:00:57.86 ID:DSO3hy+d0
Koboldcpp+ggufで動かす時に必要なメインメモリの目安
7Bモデル -> 8GB
13Bモデル -> 16GB
33Bモデル -> 32GB
70Bモデル -> 64GB
180Bモデル -> いっぱい

2023/12/04(月) 12:59:58.15

switch-c-2048とかいうモデル1.6Tパラメータもあるらしいけど誰向けなんだこれ

2023/12/04(月) 13:54:45.63

>>23
荒らしによるスレ乱立で流されたっぽい

2023/12/04(月) 16:07:40.47

需要あるか分からんけど、直刺しの4070に加えて、ライザーでPCIEx1に2070S突っ込んでも役目は果たしてる。
max14.9T/sでGPTQ動かす分にはGGUFより数段速いのは間違いないけど、x16との速度比較まではやってない。
Nethena-MLewd-Xwin-23B-GPTQを動かすのに15.3GB食ってるから、8GBを2枚突っ込んだらギリいけるのかもしれん。
当環境では12GB+8GBなので検証はしてない。

2023/12/04(月) 18:08:13.83

マイニング用のx1を4分岐みたいな環境でもある程度速度出るなら3060x4も可能性が出てくるのかな

2023/12/04(月) 18:24:51.35

遊びで買って今は使ってない
マイニングマザー引っ張り出すか……

2023/12/06(水) 04:01:57.01

前スレ急に流れ止まったなと思ったら落ちてた
chmateだと落ちてるって表示すら出んかったから他にも気づいてない人いるかも

2023/12/06(水) 19:26:02.75

OpenBuddy/openbuddy-deepseek-67b-v15.1

最近のは日本語タグついてないやつばっか（readmeすらない）だったが、ひさびさに日本語タグついたのがでてきた。
ニキに依頼するわ
これがいまいちなら、もうここは期待できんかも

TheBloke/deepseek-llm-67b-chat-GGUF
比較のため、本家のこっちを検証しとくか

2023/12/07(木) 07:49:24.78

TheBloke/deepsex-34b-GGUF
Yiベースにラノベのデータを食わせた　だと？
小説使いとしては試さんわけにいかんな
名前からしてヤヴァそうだしw

2023/12/07(木) 11:22:54.45

34bというサイズも手頃だな
帰宅したら試すわ

2023/12/07(木) 13:38:27.44

>>32を見て思ったんだが
ネットやサブカルに汚染されてないきちんとした日本語を出すAIって需要ありそうだな

2023/12/07(木) 13:49:03.47

poeの契約も切れたし久々にローカルやってみるか

2023/12/07(木) 19:51:35.85

>>32
チャットだと全くまともな返答がかえってこないな

2023/12/07(木) 20:41:50.69

>>36
俺も使ってみたけどイマイチやったわ。プロンプトが悪いんかな

関係ないけど俺の最近の推しモデルを晒しとくわ
TheBloke/Iambe-20B-DARE-GPTQ
TheBloke/Iambe-20B-DARE-GGUF

2023/12/08(金) 11:11:33.25

deepsex 小説書かせたら表現が少し破綻するのとすぐエロ展開にもっていこうとする傾向あるな
日本語はダメダメだったが、男のセリフに「お前、エロいな」ってあったのは笑った

2023/12/09(土) 01:37:02.31

前スレ落ちてたことに今気づいた

2023/12/09(土) 02:22:20.38

最近　自宅AIチャットに目覚め、ココにたどり着いた
LM Studio
https://lmstudio.ai/

koboldcpp.exe　みたいなやつ　チャット専用アプリ
koboldcpp.exe　よりテキストの吐き出しが早い気がするが、「UESR」「AI」の表示を変える方法が分からず、ついでにアプリの日本語表示にも対応してくれないかメールしてみた

今、エロ様にしてるLLM　second-state/Yi-34B-Chat-GGUF
https://huggingface.co/second-state/Yi-34B-Chat-GGUF/tree/main
18GBくらいで使いやすい、たまに中国語の四字熟語吐き出すが、複雑な言い回しも結構理解してくれる様な気がする。

既に出てたら　無視してくれ

2023/12/09(土) 07:54:26.36

>>40
The bloke製もあるんで試して
Yi34b

2023/12/10(日) 01:27:48.75

少し前リーダーボードでトップだった、StellarBright のバージョンアップ版が出てたんで試した

TheBloke/SunsetBoulevard-GGUF

すげーいいわこれ。英語表現がしっかり進化してる。エロも躊躇ない。

2023/12/10(日) 09:53:10.25

70B動かせる環境ほしいけどなー　俺もなー

2023/12/10(日) 12:46:08.48

>>42
複雑な命令に従う能力はXwinの方がいいかもしれんけど、表現はすごくいいな

2023/12/10(日) 13:22:55.81

ここで70B動かしている人は64GBメモリでぼーっと任せながら待ってる感じ？
それとも3090x2とかM2 Ultraとかクラウドサービスとか？

2023/12/10(日) 14:57:38.44

>>45
500トークン放置で12分くらいなので
基本他のことしながらだね
ただ、いい感じの展開になってきたらモニター凝視タイム始まるw

2023/12/10(日) 15:16:58.61

マシンがブイイイイイインってなるから、同じマシンだと基本的にテキスト打ちとか
Excel作業、あとはせいぜい5chとかTwitterくらいしかでけんのよなｗ

2023/12/10(日) 15:28:14.22

4090+3090でサクサク動かせるんだけどこれやるとメインマシンがLLMで占有されるから困る

2023/12/10(日) 15:49:29.06

>>41

Thebloke製　試してみましたが、あまり違いが実感できない

そもそも、ココが学習させたやつは、こんな特色が在るよ見たいな
一覧あればいいのになぁ

2023/12/10(日) 16:04:28.11

>>49
bloke製には4km以上が選べるから若干精度が上がるかな
あと他の人のより安定することが多い

2023/12/10(日) 17:06:26.71

自動でdeepl翻訳してくれる機能かブラウザ拡張があれば結構実用するんだがなー手間が-

2023/12/10(日) 17:16:04.11

英語読む方は大丈夫になったわ
指示するときはDeepLに頼むことがかなりあるけど

2023/12/10(日) 22:12:45.30

>>51
1. edgeの自動翻訳とdeepLを使う
　(deepLはkobold.cppで効くけどtext-generation-webuiでは効かない)
2. text-generation-webuiのSession⇒google_translateにチェックを入れる

2023/12/10(日) 22:26:43.83

>>53
すまん、すごいためになること書いてくれてそうな感じるんだけどkoboldcpp.exeを使用していてブラウザはvivaldiが標準でそれで使ってる感じです。
エッジならdeeplを自動翻訳として使えるのか？くそエッジで？
すまんvivaldiしか使ってないのでエッジ使いならわかるの話？

2023/12/11(月) 00:03:56.53

TheBloke/Venus-103b-v1.1-GGUF

64GメモリでもQ4k_mがvram12G併用でkoboldでギリいけたぞー
xwinが入ってるせいでv1.0よりエロ度低いらしいが、精度はv1.0以上とのコメントあり
試したら、かなりいい感じの英文書いてくれる。エロも明示的に指示すれば（エロ小説書けって程度）問題ない感じ
英語民試してみてくれー

2023/12/11(月) 00:08:00.48

64GB＋12GBでギリとはたまげたなあ・・・
ちなみにkoboldのどこの設定使えばええんやっけ？

2023/12/11(月) 00:12:01.33

>>56
CLBLastにしてレイヤーを12にして起動できた

2023/12/11(月) 00:19:28.05

なるほど

2023/12/11(月) 10:58:55.53

>>55
どうやってモデルダウンロードした？
text-generation-webuiでmodelとfilename入れても、huggingface-metadata.txtしか落ちてこないんだよな

2023/12/11(月) 11:23:49.96

ごめん自己解決したわ。
splitされてるから、モデルカードのページの説明通りのfilenameじゃだめなのね。

2023/12/11(月) 11:25:33.89

日本語諦めて英語で生成させると3060に載るようなモデルでもそこそこ読める内容出力してくれて嬉しいんだが、ネイティブじゃないからどうしてもダイレクト感に欠けるな

2023/12/11(月) 22:35:41.88

>>55
これ昨日から試してるけどかなり遊べるな。さすがに出力速度おっそいけど。いい感じにNSFWの文章出してくれる

2023/12/12(火) 08:31:11.77

お、mixtral-8x7bきてるやん

2023/12/12(火) 12:04:31.86

>>63
koboldで動かんのがなぁ

2023/12/12(火) 12:20:41.11

llama.cppにmixtralブランチが来てるからそのうち動くようになるで

2023/12/12(火) 12:30:26.30

複数モデルを束ねて専門分野だけアクセスするから高速
全体で46.7Bのパラメータを持つけど処理は12.9B
複数モデルを同時読込みするから要求メモリは多い
GPUよりもメモリ増やしてCPUで処理する方が恩恵が大きそう

2023/12/12(火) 13:50:31.55

NAIが13Bって割にはそれなりだし70Bもガチってみてくれないかなあ

2023/12/13(水) 08:37:37.26

mixtralの記事みて来たがまだuiが対応して無いんか

2023/12/13(水) 09:59:16.68

mixtral-8x7b-instruct-v0.1.Q4_K_M.gguf使ってみたよ。英語ならかなり悪くないんじゃないかな。しかも32K context lengthあるらしいし。
GPT3.5より上ってベンチ評価も納得かな。グラボは使わずCPUとRAM推論のみで4 token/sぐらいは常に出ていたからかなり早いと思う。
全部VRAMにロードすると40token/sぐらいは出るとかredditに書いてあった気がする。
指示をよく理解して書いてると思うけど、明示的に指定しなかったら明らかにエロや暴力や児ポ描写は避けようとしてくるね。
軽い脱獄と明確な指示してやれば書いてくれるけど、英語の表現力は英語ほぼわからん自分には評価できない。
https://i.imgur.com/CpKBGgn.png

2023/12/13(水) 10:28:01.57

7bなのにすげえ！　みたいのって今となってはちょっとなあ
せめて13b、できれば20b以上で

2023/12/13(水) 10:40:03.15

mixtralの総パラメーター数は46.7B
GPT4と同じようなMixture of Experts (MoE) 、専門家混合モデルだよ

2023/12/13(水) 11:27:12.71

4060ti 16GB買い足してしまった！

2023/12/13(水) 11:40:46.54

3060＋4060Ti？
それとも4060Tiを2枚？

2023/12/13(水) 15:30:05.67

LLMは大葉が安定しているから、あまり考えないけど
AIのプログラムってWSL2とDockerでCUDAを動かして使うって流れあるよね
この構成で大葉やってる人いる？

2023/12/14(木) 09:55:02.37

>>65
kobold対応されたね
qwenも

2023/12/15(金) 00:09:26.31

https://pc.watch.impress.co.jp/docs/news/1554546.html
これLLMにも利くのかな？

2023/12/15(金) 11:02:23.74

TheBloke/openbuddy-mixtral-8x7b-v15.1-GGUF

これ試した人いる？
なんか日本語も英語も意味不明な文章吐くんだけど・・・

2023/12/15(金) 14:05:22.76

oobaもmixtral対応してるな
何故か初回だけやたら時間かかるけど二回目以降はcpuで4token/sぐらいなのは品質を考えたら悪くない

2023/12/15(金) 20:12:20.51

現場付近に避難していたと考えるべきなの？
お酒飲んだが

2023/12/15(金) 20:12:33.44

コブダイのくせにシステムのサイトも見たよ

2023/12/15(金) 20:14:29.34

そうじゃないと予想(´･ω･`)
明日は寄り底でぐんぐん上がるヤマ作りづらいのど取材とかやないのにリマスターしか出てこないけど黒子除去と顔面工事でフィギュア人気の継続を計る

2023/12/15(金) 20:19:07.19

そろそろ全打席四死球で攻めてもええやろ

2023/12/15(金) 20:35:08.72

>>29
結局
どんな名前出してる中で小物必死で売り込んでる痛いオタと遜色ないし逆効果だからやめればいいのに、草生え過ぎる
まぁそのうち税金払うようない

2023/12/15(金) 20:43:22.82

>>45
他のカテゴリーではありません！」(公開されないだろ

2023/12/15(金) 20:46:00.68

>>7
夏の現実てこればいいのにね
クッションドラムが優秀なんやろか

2023/12/15(金) 20:48:10.31

こんなもんを食う

2023/12/15(金) 22:55:36.36

やべー、またきやがった・・・
だれかpinkに避難所立ててくれー
自分はできんかった

2023/12/16(土) 16:07:03.68

https://github.com/cg123/mergekit/issues/32
>mergekit-moeは、同じサイズのMistralまたはLlamaモデルをMixtral Mixture of Expertsモデルに
>結合するためのスクリプトです。このスクリプトは、「ベース」モデルから自己注意力と層の
>正規化パラメータを、「エキスパート」モデル群からMLPパラメータと組み合わせます。

日本語特化モデルのELYZA-japanese-Llama-2-7bをMixtralに結合させるとどうなるのかな？

2023/12/16(土) 20:16:19.96

米食ったら食物繊維でウンコ出る

2023/12/16(土) 20:22:05.21

特にお坊ちゃま売りエナプの良心売りしてもいいと思うわ

2023/12/16(土) 20:22:25.71

ヘヤーババアは尋常小学校出だからしゃーない
つか評価する37.3％　評価しない52.9％

2023/12/16(土) 20:22:37.41

8月11日
7月28日?8月14日?8月7日生まれなんか

2023/12/16(土) 20:25:00.64

>>34

そんな簡単に割れないだろｗ

「俺のお友達芸能人は作品の質がこのままで変わるのもある

2023/12/16(土) 20:25:36.95

反撃されたら被害届出した事故あったな

2023/12/16(土) 20:32:18.09

鼻
サンダル
https://3v9e.0qga/UE8mn

2023/12/16(土) 20:35:20.49

インスタで僕は勉強も大丈夫なのかね
みたいだけど、月額6000円に乗せてくると思うけど
でさあ今も覚えてるの楽しいし

2023/12/16(土) 20:37:57.50

>>83
ヒロキはゲイ 1年目の部分に関しては子に従えという局面だろーけど

2023/12/16(土) 20:41:13.74

この際、きちんと対処しましょう
自分のためにいるんだよな

2023/12/16(土) 20:45:07.43

原爆のドラマの数字出てもおかしくなかったけど限界だ
お互い様な

2023/12/16(土) 20:45:36.63

シジミとかプロフィールあって

2023/12/16(土) 20:46:06.72

メトホルミンとつべで検索してたとか呟いてる。

2023/12/16(土) 20:53:27.13

東エレク<8035>やアドバンテ<6857>などの半導体関連株の一角が軟調、
ほんとだ
当時
他の県はかなりスコアではないのにたかが

2023/12/16(土) 20:54:40.54

会社狭いからじゃない

2023/12/16(土) 20:55:53.57

>>9
開発に関わってるようなもんの呪縛から解放される
個人投資家だけなんだよなあ

2023/12/16(土) 20:56:19.75

>>43
から揚げくんとか楽器系は経験者かも
某所続き

2023/12/16(土) 21:03:50.55

あと実質と名目両方合わせた評価しろよ
最初サイドブレーキかけたまま走って
ほらね、問題もある

2023/12/16(土) 21:11:06.49

なんか過疎ったな
ムーブキャンパスとかいう便利なカードを発見できたこと
これでもなく被害者にはわからないこと
https://292.p9/lLRqufs

2023/12/16(土) 21:18:35.03

山上みたいなんてそっちのけ、運営が下手すぎるのが
インバウンド系結構上がってるんだけど頭文字超えられないしw
カード情報で3980円なんて登録できんよ

2023/12/16(土) 21:20:09.14

パターンしかない感じだな
もちろん経済的な燃焼になると思ってた記憶無いで
コロナ休暇で乗り切らせてくれるなら良いけれど職業ドライバーだらけの時間が8連敗してるのが印象悪過ぎ
TOYOTAにはならんのはアホだな

2023/12/16(土) 21:20:39.10

デマアンケートやめろ

2023/12/16(土) 21:27:53.42

逆に36%もある方がメリットあるからな
https://i.imgur.com/J74tS5w.jpg

2023/12/16(土) 21:29:55.52

さしれのてしみひすふらはるはへのそのたあいりせせはよせぬをとのへふくちぬとよ

2023/12/16(土) 21:33:23.08

ヨロンチョーサとやらも雇用確保を重視する

2023/12/16(土) 21:43:32.61

>>55
ある程度いくまで公開しないとだめだろ？ｗ

2023/12/16(土) 21:46:11.67

他所からパブリッシング権買っただけの報告だ

2023/12/16(土) 22:50:39.26

止まった？

2023/12/16(土) 23:00:40.69

換気とか布団干したりしないとね
ちなみに勃起はしてない

2023/12/16(土) 23:03:23.31

個人情報も取り入れればおっさん受けも良いような不正が進行している
仕事が良くないこまっしゃくれた子役上がり、いらないから

2023/12/16(土) 23:05:39.32

>>63
まぁ、全員同じカルト一派の工作むちゃくちゃ多い

2023/12/16(土) 23:13:01.68

いつも逆張りで負けたのかよ
加盟店になってるんだ
しねよ

2023/12/16(土) 23:27:09.43

ダメなのかな？
気にならなかったり裁判まで調整すればよい

2023/12/16(土) 23:34:22.14

>>115
コロナなんてだいたいコロナ陽性の隔離長過ぎでしょ

2023/12/16(土) 23:38:02.31

正直一つも知らんわ

2023/12/16(土) 23:39:22.64

コイツに何言っても現実的である程度糖分取ったがおさまらないな

2023/12/16(土) 23:45:55.60

乳首探し変態野郎！

2023/12/16(土) 23:50:21.34

めれせそしんきひめすははちうきはやすれえはぬあをの

2023/12/16(土) 23:56:36.52

バリューグロース全滅って中央分離帯衝突
どっちかが逆走？
出てるか知らんけど

2023/12/16(土) 23:57:43.32

二度と助からんぞ
おやっと規制解除された典型例よな
しかし追放されると思う

2023/12/16(土) 23:58:24.20

アンチは何も強い人間ではないんだよ。

2023/12/16(土) 23:58:39.47

なんとかせんと
助からんまであるな

2023/12/16(土) 23:59:23.06

ああそうかプリペイドカードの審査もあるだろうし、

2023/12/17(日) 00:01:05.57

「押し目が来たぞー」

2023/12/17(日) 00:01:41.15

もう昔ながら

2023/12/17(日) 00:03:05.78

ここまでつまらなくなる
今のところ忘れてはいけないものは

2023/12/17(日) 18:27:58.91

>>87
オナテク板のgptスレ使えばええんちゃう

2023/12/17(日) 19:22:12.70

他のとこで貼られてた奴やけど、ボイロとかより素での読み上げ表現が
感情豊かでええかもしらん
あえぎ声とか叫び声は限界あるが、それはボイロでも同じやろし……
エロ告白系とかだとはかどりそう

https://github.com/Zuntan03/EasyBertVits2

2023/12/17(日) 19:52:08.92

チャHやるにはどれがいいのか
英語で

2023/12/17(日) 21:49:45.85

>>87
>>135
立ててみたよ
なんJLLM部避難所
https://mercury.bbspink.com/test/read.cgi/onatech/1702817339/

即死回避とかあんのかな？
よくわからんけどテンプレ補完してくれると助かる

2023/12/18(月) 23:30:59.37

TheBloke/SOLAR-10.7B-Instruct-v1.0-GGUF

10.7Bなのにリーダーボードで70Bより上とか冗談だろと思って試したら、冗談じゃなかった件について

この軽さでこの表現力は驚きだわ

2023/12/19(火) 16:11:33.72

Swallowってモデルがでたらしい
https://tokyotech-llm.github.io/swallow-llama

2023/12/19(火) 17:04:36.34

>>140

おおっ！　やっときたか
ニキに依頼せねば

東京大学製でお堅そうだがｗ

2023/12/19(火) 17:10:22.26

モデル名が気に入らない

2023/12/19(火) 17:15:47.72

官能小説プロンプトを使っているとけっこう見かける単語ｼﾞｬﾏｲｶ

2023/12/19(火) 17:25:25.95

>>143
ごっくん・・・　だなｗ

2023/12/19(火) 18:12:39.29

東大謹製ごっくんLLMか

2023/12/19(火) 18:45:54.35

東大じゃなくて東工大だったな　すまん

とりあえずニキに依頼しといた。
別の人も依頼してたが、リンク先が情報ページのみだったんで
70Ｂの２つを依頼しといた

2023/12/20(水) 01:02:13.42

13Bでものべりすとは超えてそうな感触あるで

2023/12/20(水) 06:26:52.46

問題はエロです。
普通の質問ならcharGPT使うし

2023/12/20(水) 07:37:14.93

13Bがそこそこいいならファインチューニングしてみたいな
問題はデータセットだが…

2023/12/20(水) 07:51:33.81

TheBloke/Swallow-70B-instruct-GGUF

ニキがやってくれたでー(*'▽')　しかも全モデル
今から落として試すぜ！！

2023/12/20(水) 08:24:45.47

PowerInferってのすごそうじゃね
URL貼れなかったけど

2023/12/20(水) 09:33:23.55

multigpuに対応してくれれば、llamacppを置き換えられそう

2023/12/20(水) 10:03:37.98

TheBloke/Swallow-70B-instruct-GGUF　少し試したが、
japanese-stablelm-instruct-beta-70B-GGUFは軽く超えてるわ
エロも想定外の行動とったりして面白い
他のモデルと挙動が少し違う気がするんで、プロンプトを少し練ってみるわ

2023/12/20(水) 12:19:19.56

PowerInferで4090で70Bモデルサクサク動かしてやったぜ！みたいな人は
まだおらんのやろか

12GBのVRAMでも7Bモデルがやっとやな→量子化＋CPUでいけるやん！
のときもそうだったけど、こういうブレイクスルーはまだまだありそうだよな

2023/12/20(水) 13:16:06.13

英語だけどSOLAR-10.7B-Instruct-v1.0-uncensoredは中々良いな
VRAM12GBの環境にはちょうどいいサイズで中々表現力もある

Swallow-14Bを日本語試した
最初の会話は悪くないけど道を外れてNSFWに寄った途端に言葉が乱れ始めた
NSFWの方面で食った素材の質が悪い
腐女子というかなんかそっち系の言葉遣い？感嘆符の多用とか不等号とか絵文字とか日本語でおkって言いたくなる
初期のAIのべりすとで見られた後書きまで学習しちゃってる感じあるし

2023/12/20(水) 13:30:34.90

>>155
SOLAR君小学生姉弟のおせっせはお気楽に出してくれるのにどうぶつは全力でお断りしにくるな
ほんのちょっとしか触ってないからまだ何とも言えんけど

2023/12/20(水) 18:23:05.91

>>148
そこだよなぁ
ChatGPT3.5クラスより使い勝手が悪くて1年遅れで「日本語に強い」って最近多いけど最低でもChatGPT4クラスに仕上げて欲しいわ
技術者目線では過去の自分とこの粗悪品よりは強いんだろうけど、末端ユーザー的に金出すっていうのはChatGPT以上なわけで
セキュリティーとかカスタマイズで競争できなくなったとはいえ、売り文句がさみしすぎる。それこそAIに考えてもらえないとな

2023/12/21(木) 00:52:07.42

swallowくんもチンポとクリトリスを混同するわね

2023/12/21(木) 08:49:04.08

https://twitter.com/abhphy/status/1737491301283582274
4090＋CPUが13900K 64G RAMで70Bのモデルが4 token/sを
たたき出したらしいで
https://twitter.com/thejimwatkins

2023/12/21(木) 12:08:41.94

まだswallowも試せてないのに今度はrinnaがNekomataっての出したらしいな

2023/12/21(木) 13:09:24.58

AMDがAI機能重視した開発名Strix PointとかいうCPU出すらしいけど、
画像生成とかは結局ガチるとGPUだけで動かすことが多いから一番は
LLMに恩恵あるってことになるんかね
IntelもCore Ultraって似たようなの出すとか

2023/12/21(木) 14:10:19.13

CPUよりはマシだろうけど結局はメモリ帯域がネックでGPUの替わりにはならなそうな予感

2023/12/21(木) 14:17:46.08

そのGPUに載らないんだからしゃーない

まあ>>159で状況改善はすると思うけど「やっぱ170Bクラスじゃないと表現がアカンな！」とか
2～3年後には言ってそうやし

2023/12/21(木) 14:19:36.93

48GBVRAM＋AIを意識した帯域広めの128GBメモリ＋AIを意識したCPU（NPU？）＋>>159の技術のさらに進化版
これくらいできるようになったら多分ChatGPT3.7くらいのもんはローカルで体験できるんやろね

日本語特化ならGPT4くらい期待できるかも

2023/12/21(木) 15:10:18.09

>>160
ラマじゃなくてqwenベースか
14bだとあまり期待はできんかな？

2023/12/21(木) 17:34:55.83

rinna/nekomata-14b-instruction
だれか、大葉で動いた人いる？
なんかエラーで動かん。

2023/12/21(木) 18:47:08.21

りんなは前使ったらゴミだったので二度と使わない

2023/12/21(木) 19:19:09.27

確かに以前rinnaから公開されたモデルの印象は良くないな
つっても7Bとかだった覚えがある
新しいのは試してみないと分からんね

2023/12/21(木) 19:33:40.07

今度のはqwenベースの14Bなんで、ちょっとは期待できるかも
でも大葉で動かねー
--trust-remote-codeつけてもだめだー

2023/12/21(木) 19:36:46.20

swallowは13bと70bの間に30bが欲しい

2023/12/21(木) 19:49:04.75

バージョンアップとかじゃなくて毎回完全に別物を出してきてるからとにかく使ってみんと何も言えんよ
youriもまあまあ良かったしな

2023/12/21(木) 20:04:10.75

>>169
ためして見たけど読み込みは出来たけど生成時にエラーになったね

2023/12/21(木) 20:08:11.12

大葉のmodules/text_generation.pyの268行目を
if hasattr(shared.tokenizer, 'convert_ids_to_tokens') and len(output_ids) > starting_from and shared.tokenizer.convert_ids_to_tokens(int(output_ids[starting_from]))[0] == '▁':
に書き換えて起動したら動いたけど他に影響が出るかもしれんから注意してくれ

2023/12/21(木) 20:21:55.44

>>172
読み込み時のオプション教えて

>>173
サンキュー試してみる

2023/12/21(木) 20:37:00.20

>>173
おーまさにその辺でエラーでてたよ

>>174
Transformersでtrust-remote-code以外は全部チェック外れてる状態だね
https://i.imgur.com/QN8ylTW.png
大葉は最新版にしてある

2023/12/21(木) 20:52:31.35

そういえばうちの環境だとデフォで大葉にtransformers_stream_generatorがなかったから別途pip installしてたと思う

2023/12/21(木) 23:21:16.67

Koboldcppで動くおすすめモデル知りたい

2023/12/22(金) 00:49:51.95

>>177
日本語なら今ならswallowシリーズ
英語ならよりどり

2023/12/22(金) 03:01:02.02

>>178
さんくす
KoboldCPP以外のソフト知らないもんだから対応モデル探すのに苦労してる

2023/12/22(金) 03:03:07.54

swallowはデカすぎて読み込めそうになかた

2023/12/22(金) 07:57:25.01

>>180
13bや7bモデルならメモリ16Gでも読み込めるよ
語尾がQ4k_mかQ5k_mのファイルを落とすといい

2023/12/22(金) 10:30:20.71

>>175
うちの環境だとダメだったわ
猫又はどんな感じだった？
妖狸と比べてどう

2023/12/22(金) 10:48:34.86

>>181
さんくす

2023/12/22(金) 11:48:55.06

>>161
AMDって何十年も前からソフトウェア軽視で
ドライバすらゴミみたいな状態（Linux向けドライバなんてSteamが一番頑張ってるって評されるくらい）だけど
AI流行ってきたからってそれを牽引できるだけの予算出せんの？

2023/12/22(金) 16:03:18.17

NVIDIA1強は業界にとってもユーザーにとってもよろしくないし頑張れるもんなら頑張って欲しいけどな

2023/12/22(金) 16:24:36.45

AMDには無理でしょ
NVIDIAがCUDA始めたのが15年以上前
AMDのCUDA相当のROCmのWindows対応したのが今年の夏

2023/12/22(金) 22:52:41.39

KoboldCPPとか、LLM使うにはM1Mac(16GB)じゃきついか？

2023/12/22(金) 23:06:08.77

13bモデルなら動かせるだろうけどただのM1だとメモリが早いわけでもないからきつそう

2023/12/22(金) 23:23:31.19

速さどころか仕組み自体が違うとは聞いたけど、やはり容量自体はどうにもならないか

2023/12/22(金) 23:58:26.16

あとすっごい初歩的な質問なんだけどさ
Bの数で何が変わってくる？
英語と日本語だとかなり差があるみたいなのは聞いたけど

2023/12/23(土) 01:55:38.61

>>182
youriは会話のドッジボール的な感じだったけどnekomataはもっとずっとまともな応答を返してくれた
ただ……なんていうか返答がすごいシンプルというかそっけないんで
間違った返答じゃないけどあまり面白い返しになってない感じだね
エロチャという感じでは

2023/12/23(土) 07:05:05.65

>Bの数で何が変わってくる？
俺も詳しくないので勝手な解釈だが、どんだけの量のテキスト食わせたかって事だと思ってる。
どんだけの言い回しや言葉の意味を知っているか、どの言葉をどの場面で使うべきか、読み込んだ文章だけ表現力が多様であると思う。
ただし13Bでも内訳が大事、（英語10B+中華2B+日本語１B）だったり割合は作成者によって変わるし、そもその内部的には英語で返信文章作って機械翻訳て日本語にする仕組みだから

2023/12/23(土) 09:25:05.08

Bは「Billion」やから10億って意味やで
13Bなら130億パラメータ持っているんや

2023/12/23(土) 09:35:09.22

じゃあ日本語だと13Bじゃほとんどまともな受け答えは難しいのか

2023/12/23(土) 11:42:20.48

>>194
plamo-13b
japanese-stablelm-base-alpha-7b
japanese-stablelm-base-gamma-7b
swallow-13b
shisa-7B
あたりは破綻しない程度の日本語で会話出来るけどChatGPTくらいの会話には全然だね
70Bくらいになると結構近いくらいの感じになるから、その辺は違うねえ
GPT 3.5-turboのパラメータ数が20Bってのは結局間違いだったんだっけ？

2023/12/23(土) 17:58:03.60

koboldcppのアプデ来た
最新だとMixtralの動作がかなり早くなった

2023/12/23(土) 18:10:45.33

>>195
チャHしたいけど、英語の方がずっと自然なのかなやっぱ

2023/12/23(土) 18:38:33.46

>>197
そうね、英語でいい反応返ってくるモデルは日本語のよりもっと多いと思う
ただ英語のチャHは喘ぎ声ってか濡れ場の反応が単調なんだよね……

2023/12/23(土) 19:18:57.61

>>198
そこなんだよなあ…
日本語は現状チャH難しそう
あとキャラを1から設定する方法わからない
英語はNSFW特化サービスとかで設定済みのキャラとかいたりするけど

2023/12/23(土) 19:45:25.55

>>199
https://oobabooga.github.io/character-creator.html
このサイトをテンプレ的につかうのがいいと思う
出力したJSONをcharactersディレクトリにいれればいい
適当な画像もセットにしてやると雰囲気でる