なんJLLM部 ★3

2023/08/10(木) 12:56:06.76

!extend::vvvvv:1000:512
!extend::vvvvv:1000:512
AIに色々なことをしゃべってもらうんやで
英語ならそこそこのデスクトップPC（できれば＋3060 12GB以上）でもなんぼか楽しめるで
日本語は、どう転んでもローカルで動かせる今の世代はオバカなので
そこは期待しすぎんといてな

自薦・他薦のモデルやツールは>>2以降

前スレなんJLLM部 ★2
https://fate.5ch.net/test/read.cgi/liveuranus/1685613014/

VIPQ2_EXTDAT: default:vvvvv:1000:512:: EXT was configured

2023/08/10(木) 12:56:29.52

りんな系
日本語で学習されてて3060でも設定次第で動く、オバカではあるけど現時点でも
そこそこ楽しめるクオリティはある
https://huggingface.co/rinna/bilingual-gpt-neox-4b-instruction-sft
https://huggingface.co/rinna/bilingual-gpt-neox-4b-instruction-ppo

https://huggingface.co/rinna/japanese-gpt-neox-3.6b-instruction-sft-v2
https://huggingface.co/rinna/japanese-gpt-neox-3.6b-instruction-ppo

こっちは前の世代のりんな　前スレの最初のほうでLoRA学習成功したニキがいたっぽい
https://huggingface.co/rinna/japanese-gpt2-medium
https://huggingface.co/rinna/japanese-gpt2-small

2023/08/10(木) 12:56:38.67

OpenCALM系

サイバーエージェントがやってるってことでいじった報告や
動かした報告がネットに多い気がする
https://huggingface.co/cyberagent/open-calm-7b
https://huggingface.co/cyberagent/open-calm-3b

8bit版？
https://huggingface.co/kyo-takano/open-calm-7b-8bit

2023/08/10(木) 12:56:50.23

WebUI

前はスレのニキがりんな動かすツール公開してくれとったけど、消えてしまったから
日本語モデルを手軽に動かすには必須やろな
https://github.com/oobabooga/text-generation-webui

2023/08/10(木) 12:57:00.39

りんなはそのままでは >>4 のツールで動かないのでここを参考に
修正が必要や　ただし3.6b版の情報やしWebUI自体のコードも
変わっているから修正する行番号が違ってくる
https://note.com/npaka/n/n5d25ea4227df

2023/08/10(木) 12:57:10.70

Pythonがわかる奴ならこれ参考にちゃんとインデント（スペース）修正してくれ model.pyはこんな感じの修正になるな
if any(s in model_name.lower() for s in ['gpt-4chan', 'gpt4chan']) and Path(f"{shared.args.model_dir}/gpt-j-6B/").exists():
tokenizer = AutoTokenizer.from_pretrained(Path(f"{shared.args.model_dir}/gpt-j-6B/"))
elif model_name.startswith("bilingual-gpt-neox-4b"):
path_to_model = Path(f"{shared.args.model_dir}/{model_name}/")
if path_to_model.exists():
tokenizer = AutoTokenizer.from_pretrained(path_to_model,trust_remote_code=shared.args.trust_remote_code, use_fast=False)

text_generation.pyは247行目あたりをこうかな
# Encode the input
add_special_tokens = not shared.model_name.startswith("bilingual-gpt-neox-4b-")
input_ids = encode(question, add_bos_token=state['add_bos_token'], truncation_length=get_max_prompt_length(state), add_special_tokens=add_special_tokens)

2023/08/10(木) 12:57:20.09

https://i.imgur.com/DAsUTKV.png
りんなと会話してみた例（sft版）
亡きニキのツールをつかっとるけどこういうの出力させること自体は>>4のツールでもいけるはずやで

2023/08/10(木) 12:57:30.65

https://imgur.com/eBzycUe.jpg
同じくりんなと会話したみた例（ppo版）や

2023/08/10(木) 12:57:38.38

VRAM 12GB環境ないニキでもGoogle Colabやpaperspaceで
環境を借りればりんなのテストくらいはいけるはずやで

2023/08/10(木) 12:57:45.56

Web上にある既存のサービスを利用したいニキは主にここのようやで
【ChatGPT】AIチャット総合 Part7【Bing・Bard】
https://mevius.5ch.net/test/read.cgi/esite/1687670357/

2023/08/10(木) 12:57:53.79

前スレニキのツールはAssistantSeikaってアプリと連携することで
出力結果をボイスロイドとかVOICEVOXとか色々なのに
読ませることもできたのが強かったんやけど消えてもうた

2023/08/10(木) 12:58:28.66

しかしこういう拡張を使うことで、>>4のやつでもできるみたいや

google_bypass (webui読み上げ拡張)
https://github.com/AlgosErgo/google_bypass

読み上げ時の動画
https://imgur.com/Y2q0YJJ.mp4

2023/08/10(木) 12:58:38.56

Kobold.cppで小説っぽいのを作る
https://w.atwiki.jp/localmlhub/pages/19.html
Kobold.cppでAIとチャットしてみる
https://w.atwiki.jp/localmlhub/pages/20.html

りんながあまりにバカなのと、kobold.cppは
ファイル1つ落としてモデルダウンロードしてくれば
すぐつかえる利点があるので最近はこれで遊ぶのも
スレの主流や　基本英語モデルになるけどな

2023/08/10(木) 12:58:50.91

33B版くらいのモデルとかつかえばかなり表現力はあるで
32GBのメモリ積んだここ3年くらいの中堅デスクトップPC以上なら
遅いとはいえ実用的な速度で書いてくれるで

2023/08/10(木) 12:58:59.81

kobold.cppはGGML版ってモデルを使うところは注意やで
>>13の記事にも書いてあるけど

GGMLってのはモデルのサイズを小さくした上で
グラボがなくても動くようにするイカした奴やで

2023/08/10(木) 12:59:08.46

これのおかげで、3090とか4090とかとんでもないグラボを
持っている人間の特権みたいな感じだったローカルLLMが
かなり遊びやすくなったわけや

ただしグラボがあればあるで、設定をすれば高速化の補助に
つかってくれるみたいやで
（最初のプロンプトとかそこまでのお話とかの解釈用？）

2023/08/10(木) 12:59:18.67

llama2とかで70B版なんかのモデルも出てきとるけど、
llama2自体が規制強めのモデルだったりするのと、
重くなる割に性能あがっていない気がするみたいな
意見もあるで

2023/08/10(木) 12:59:29.19

https://huggingface.co/TheBloke/airoboros-33B-gpt4-1.4-GGML/tree/main
https://huggingface.co/TheBloke/WizardLM-33B-V1.0-Uncensored-GGML/tree/main
https://huggingface.co/TheBloke/airochronos-33B-GGML/tree/main

この辺の33Bモデルが現在攻守に強いと言えるやろな

2023/08/10(木) 12:59:38.38

TheBlokeニキは他で出てきたモデルをGGML版とかに変換してくれる
すごいニキやで

2023/08/10(木) 13:00:01.12

というわけでまたローカルLLMやっていこうず

https://ja.stability.ai/blog/japanese-stablelm-alpha
こんなのも出たみたいやで

2023/08/10(木) 13:25:12.35

>>20
おおーこれすげえな。ありがとう

2023/08/10(木) 13:34:55.46

めげずのスレ立て乙
そして>>20は楽しみだな

2023/08/10(木) 13:36:08.27

立て＆保守乙やで
例のblokeニキが>>20のGGML化してくれるのを期待や

2023/08/10(木) 13:39:04.59

サンガツ

2023/08/10(木) 14:18:38.33

ファイルサイズ的には3090か4090でワンチャンくらいのサイズに見えるが果たして
GGML版ほしいな

2023/08/10(木) 14:21:30.79

スレ立てサンガツやでぇ
日本語もモデル期待や

2023/08/10(木) 14:35:40.62

あ、普通にサンプルコードのhalf()の部分コメントアウトしたら動いたわ
baseのほうだけど結構いいんじゃね？

instructのほうも動かしたいんやけど、なんかオーソライズしろって文句出て動かないわ
ローカルに落としても毎回オーソライズしないとあかんのか？

2023/08/10(木) 14:49:34.52

>>20
りんな超えてほしいところだが

2023/08/10(木) 15:05:05.82

サンイチ！ずっと待ってた
Japanese StableLM楽しみや

2023/08/10(木) 16:09:41.91

まだ上手く効率的に生成させられていないけど、とりあえずエロは規制されてないっぽ

2023/08/10(木) 16:11:00.52

朗報やな

2023/08/10(木) 16:12:20.92

ただなんか「掲示板の書き込みの一部を引っこ抜いてきました」みたいになりやすいかも
文脈もいまいち理解してなくて、まさに「つながる可能性がある文が見つかったらそれを表示」
みたいになるのはりんなと同じやね

でもなんとなくりんなよりはこなれてる気がする

2023/08/10(木) 16:14:24.86

速度的には、全く使い物にならんってこたないけど
それなりにキツいね

2023/08/10(木) 16:31:30.56

うーん何度もやってる内に大したことがない気がしてきた
instruct版をローカルで実行するにはどうすればええんやろ

2023/08/10(木) 16:42:27.26

HuggingFaceからアクセストークンもらってきて、tokenizerとか

from huggingface_hub import login
login(token="うんたらかんたらのアクセストークン")

って感じにアクセストークンを貼りつければいいのか

2023/08/10(木) 16:48:12.01

tokenizerとか準備するコードの前に　やった

2023/08/10(木) 16:57:55.40

先駆者ニキありがたいやで

2023/08/10(木) 17:05:28.60

instruct版のがいいとは思うけど、短い回答を待つのに1分～2分弱かかるのは
なかなかきついな
りんなよりマシとはいえそこまで賢いか微妙なとこもあるし

多分量子化とかできればもっとマシなんやろけど
instruct版でもチャットっぽくできるんかなあ

2023/08/10(木) 17:21:45.55

ひょっとしたらVRAMに収まらないからCPUで無理矢理動かしてるってんで
こうなっているのかもしらん

baseのGGML版が出たら多少は遊べるかなあ
instruct版はログイン必要な奴だから勝手にGGMLとかにはできんやろし

2023/08/10(木) 20:51:25.56

日本語stableLM量子化しようとしてるんやけどllamaみたいに簡単にはいかんのやな
なぜかトークナイザーはLlamaTokenizerなのにモデルのロードの方はAutoModel使ってるしそもそもstablelm自体需要なかったからgithubで調べてもツールとか出てこないという
あとモデルのアーキテクチャ名が
JapaneseStableLMAlphaForCasualLMになってるけど普通のStableLMと名前違うだけで実質同じなんかな？
StableLM自体はgpt-neoxの派生やからneox用のツールとかスクリプトでもいけるんやろか
とりあえずautogptqとかggmlが使えそう
stable系はblokeニキも量子化してないっぽいんだよなあ
https://github.com/PanQiWei/AutoGPTQ
https://github.com/ggerganov/ggml

2023/08/10(木) 20:56:36.92

autogptqは一発で通んなかった時のデバッグが面倒で、しかも結局モデル側直さないとどうにもならなくて諦める展開が多かったので割と気が重くなる

2023/08/10(木) 21:32:44.83

TheBloke/Deepnight-Llama-2-70B-Inst-GGML
最近出た↑これも良かったが、

TheBloke/WizardLM-70B-V1.0-GGML
これはVicunaのtuneも入ってるらしく、さらに日本語が達者になってる。
ただ、規制バリバリのラマ2使ってるらしく、すぐ「申し訳～」がでるが、
koboldなら、「申し訳～」を「了解しました」に変更するだけで、書いてくれるのは便利ｗ

2023/08/10(木) 21:50:24.20

うーん、しかし、日本語でエロ書かせてみたけど、道徳的なハッピーエンドに持っていこうとする
傾向が見られるね。これが、全体的な規制というやつなら、DAN使うしかないか。
ローカルは一度DANが構築できれば、対策されないのが強みですな

2023/08/10(木) 22:09:42.72

uncensored化が待たれるな

どこで読んだか忘れたけど、uncensored化する理由について
「私のPCは私の命令に従うべきだ」みたいな回答しててめっちゃクールだった

2023/08/11(金) 07:19:45.72

>>35
ソース書き換えなくても環境変数のHF_TOKENにトークン入れる、で行けるはずやで

2023/08/11(金) 15:51:49.65

独自コードでやってたんや

2023/08/11(金) 15:52:02.46

ああ、Windowsの環境変数？
どっちがラクなんかな

2023/08/11(金) 15:59:07.48

platypus2-70b-instruct.ggmlv3.q5_K_M
こいつを試したが、やはり規制入ってるね。日本語小説書かすと後半、同じ文章の繰り返しが目につきだす。
定番の質問したら、嘘だらけだが、内容が面白かったんで張っておくｗ

https://imgur.com/a/hSwlFD5

2023/08/11(金) 16:06:13.63

何のお手伝いをしてるんですかねぇ……

2023/08/11(金) 16:36:47.55

ドラミ、お前… 消えるのか？

2023/08/11(金) 16:44:24.24

TheBloke/stablecode-instruct-alpha-3b-GGML
これが出たってことは、TheBloke先生やってくれそうですな(*'▽')

2023/08/11(金) 17:27:51.46

たのむで～

2023/08/11(金) 19:50:45.75

>>47
自分はLinuxやから環境変数のほうがずっと楽やけどWindowsだとソースいじる方が楽かもしれんなあ

2023/08/11(金) 20:41:09.33

>>43
凌辱系はrinnaでもかなり苦しい感じだった
エロに限らずネガティブ系は意図的に弾いてる感はある

2023/08/11(金) 20:43:44.41

りんなのオバカさはそれ以前の問題な気がするｗ

2023/08/11(金) 21:46:12.93

うーん、いろいろ試したが、今のところ
TheBloke/Deepnight-Llama-2-70B-Inst-GGML
が規制ないみたいで、日本語でかなり遊べる。セリフ周りも違和感少ない。
gpt2.9ぐらいあるんじゃないか？ｗ

2023/08/11(金) 21:47:42.90

国語のテスト的な「与えられた文章に即して質問に答えなさい」タスクでもりんなはおバカさ加減が斜め下な感がねｗ　なんだろあの「1mmも理解してないのに自信満々な天然おバカ」感は

2023/08/11(金) 21:50:05.65

日本語ローカルモデルで3.5レベルは数年以内に見えてきそうよな
問題は速度や

2023/08/11(金) 21:59:21.07

japanese-stablelm-instruct-alpha-7b動かしてみたけど微妙なところや
申し訳自体は無さそう
wui使えてないからあんまり詰められてないけど
https://twitter.com/user_vkff5833/status/1689784288496238592
https://twitter.com/user_vkff5833/status/1689785974979788801?t=xTsR6w_-cW4dk30DPApJsQ&s=19
https://twitter.com/5chan_nel (5ch newer account)

2023/08/11(金) 22:11:13.49

>>56
>>42で教えてもらった WizardLM-70B-V1.0-GGML もなかなか良かったよ
申し訳回避は必要だけどかなりまともな日本語を吐いてくれた

2023/08/12(土) 00:06:51.04

Deepnightも試してみた

WizardLM-70B-V1.0-GGML
https://i.imgur.com/r40Zhre.png

Deepnight-Llama-2-70B-Inst-GGML
https://i.imgur.com/j0rGZWc.png

Deepnightいいね、こっちの方が表現力高いと思うぴょんぴょんは笑ったがw
マルチリンガルモデルでここまで書けるなら日本語特化モデルへの期待が高まるな

2023/08/12(土) 08:32:33.92

英語で出力させたあと、日本語に翻訳してって段階踏ませたら
精度上がるかな？

2023/08/12(土) 09:56:25.64

文章の精度を上げるならそれがいいのかもしれないが、それなら英語モデルで出力してdeepLで翻訳するのと変わらない気もする
またエロ小説を書かせる場合は、最初から日本語で書かせた方が日本人に刺さる文章になる予感がする
とりあえず実験してみる

2023/08/12(土) 10:16:48.66

翻訳体の日本語を形態素解析してエロい日本語に変換する、ってのは
LLM使わなくても可能性がある気がするのよな

2023/08/12(土) 10:20:58.03

https://huggingface.co/AIBunCho/japanese-novel-gpt-j-6b
なんかでた

2023/08/12(土) 10:28:55.87

これはwebサービスのAI文鳥のやつか？
よくのべりすとと比較されてるやつ

2023/08/12(土) 10:39:46.83

お硬そうだな

2023/08/12(土) 10:45:48.78

6bじゃ期待薄では

2023/08/12(土) 10:48:03.62

日本語系は7Bくらいが最新なんだから

2023/08/12(土) 11:00:11.15

日本語特化の13Bが欲しいのよね
できればもう一声で30Bぐらいも…

2023/08/12(土) 11:11:55.95

日本語特化の30Bは多分ChatGPT3.5とかとほとんど遜色ないやろな

2023/08/12(土) 12:08:46.53

>>61
真似して導入しようとしたら容量で白目剥いた
これ合計で何GBあるんだよ
100GB単位でストレージが溶けるぅ

2023/08/12(土) 12:49:01.34

全部落とさなくていいよw
4kmか5kmってついてるのががおすすめ

2023/08/12(土) 12:53:34.16

つよつよCPUにして生成速度上がったって奴はおるんかな

2023/08/12(土) 13:10:38.30

家族にも紹介して追加で5000円分×人数をゲット可能。
https://pbs.twimg.com/media/F3SfgdpbEAAfD3c.jpg
　

2023/08/12(土) 13:16:53.81

>>74
2600から5700Xにしたら2倍以上速くなって歓喜

2023/08/12(土) 13:18:01.96

>>75
グロ

2023/08/12(土) 13:21:01.75

>>76
Intelの最新のとかやってる奴おらんかな

2023/08/12(土) 13:21:24.23

あとダウンロードしたモデルはSSDに置くんだぞ
最初HDDに置いたら起動に20分とか掛かって発狂しかけたわ

2023/08/12(土) 13:46:27.16

>>75
もう240円分も増えてる

2023/08/12(土) 15:40:37.06

真似したかったけどスペック足りずに断念
GGMLがCPU(RAM)でGPTQがGPU(VRAM)と言う事だよな？
スレ民の多くはkoboldでGGML（高RAM）稼働なのか？

oobaboogaでGPTQだから肩身狭いわ
VRAM12GBだから13Bが限界ぽいし
仮にGGMLに乗り換えてもRAM32GBなんだよ
70Bとか流石に無理だよな？RAM64GBやクラウド民？

2023/08/12(土) 16:11:40.76

>>81
GGML70BをRAM64GBで動かしとるで
けど、動くってだけで遅すぎてなぁ
33Bがギリ実用的って感じや
koboldのGPUブーストがもっと効けば変わるんやろうけど

メモリ安いし増設しといても損ないんちゃうん？

2023/08/12(土) 16:31:01.25

70Bはまだまだ趣味よ
ただ最新CPUとか積んでいる奴なら「遅いけどいける」って
感じるのかなって

2023/08/12(土) 16:54:14.15

マジで速度犠牲にしてメモリごり押しでギリギリなんだな
8GBを4枚刺しだから、16GBに総入れ替えで今だと2万円ぐらいだった
画像生成の時といいAI界隈のハード事情やば過ぎない？

うーん、一般人だと劣化版の7B～13Bあたりで遊ぶのが限界か
>>61 みたいな芸当が出来たら夢が広がるんだけど無理そう

2023/08/12(土) 16:56:49.87

>>84
20万以上のグラボ買うことを考えたら2万のメモリって激安では

2023/08/12(土) 17:02:38.28

33Bなら別にメモリ32GBの3700Xで全然遊べる（速くはないけど）んやから
安い趣味

2023/08/12(土) 17:51:41.17

メモリ32GBあれば33Bモデルがいけるで
自分も70Bモデルは実験として弄ってるので普段使いは33Bだ
33Bか13Bの賢い日本語モデルが出てきて欲しいな

2023/08/12(土) 18:32:48.12

自分はpaperspaceのGROWTHでGPTQ動かしてるけど70Bも問題なく動く
でも70Bだから満足でオススメ出来るかと言うと今の時点ではまだ全然だし敢えてオススメするほどてはない

2023/08/12(土) 20:25:54.53

チャットしようとすると応答時間は決定的だけど、文書生成だと他のことやってる間に結果出てればいいやという感じでCPUメインで70B回してる　自分の用途だと現状だと70Bですら日本語力全然足りてないし

2023/08/12(土) 21:35:31.04

vicunaってのがマルチリンガルモデルらしいので、こいつを用いた33Bモデルも日本語で応答できるのか試してみた
https://huggingface.co/TheBloke/vicuna-33B-GGML/tree/main
結果、70B以上に日本語があやしくなるが出力できた
実用的ではまったく無いが興味ある人は弄ってみてくれ

2023/08/12(土) 22:08:45.39

ここ数日でJapanese StableLMとjapanese-novel-gpt-jが出てきてようやく日本語LLM界が始まった感じがするな
bitsandbytesもwindowsで動くようになったし

2023/08/13(日) 00:48:02.21

>bitsandbytesもwindowsで動くようになったし
マジ？

2023/08/13(日) 06:16:26.65

モデルの量子化ツールだっけ

2023/08/13(日) 10:55:31.63

>>74
5600G+128GB → 5950X+128GB

いままでGPUでRWKVとGPTQばかり触ってきたから
GGMLの扱いに慣れてない

2023/08/13(日) 10:57:24.10

んで速度的にどれくらい上がった？

2023/08/13(日) 10:57:37.50

GGMLは使ってなかったからわからんってことか

2023/08/13(日) 15:08:10.72

エロ小説書けてローカルで動くモデルってあるんか？

2023/08/13(日) 15:13:28.08

英語なら>>18の3つ目のやつとか

2023/08/13(日) 15:23:56.52

日本語だと>>61くらいが現状の限界だな

2023/08/13(日) 21:25:32.49

GPT4のAPIでエロやったら警告が届いたってマジ？
なんか一斉に来たらしいけど

2023/08/13(日) 21:29:42.45

poeにしとけと
poeも多分そのうちアウトになるやろけど

2023/08/13(日) 22:44:50.70

ChatGPTをBANされた後も料金引き落とされ続けてサポートに返金してもらうまで3週間かかったトラウマがあるからpoeも課金に踏み切れずにいる

2023/08/13(日) 23:34:35.93

契約してすぐキャンセルすればええんよ
そしたら1ヶ月つかえてその後にキャンセルされる

もしその次に引き落としがあったら消費者問題や

2023/08/14(月) 01:11:11.05

rinnaといい >>3 のB7とか一部モデルだと
読み込みは出来るけど正しく応答できないパターンがある
単純にモデル読み込み設定やwebuiが対応していないだけか？
ソース書き換えで無理矢理rinnaを使った事はあるけど

2023/08/14(月) 14:41:59.32

大企業のAIを使って仕事する未来が目前まで来てて
そのAIの検閲に引っかかると排除されるってディストピアだよな

2023/08/14(月) 15:19:26.97

>>104 バイリンガルじゃないほうのrinnaとか顕著（区切り文字<NL>）だけど、プロンプト書式があってなくて応答できないケースもあるかも
モデルにサンプルコードがついてたらそれを使って問題の切り分けはできるかも

2023/08/14(月) 15:39:14.40

>>105
しかもその企業がその元データを入手できたのはネットの自由を求めて戦った人たちのおかげという皮肉

2023/08/14(月) 15:50:12.61

https://twitter.com/ai_database/status/1690930079516536832
まったくどこのどいつだ
https://twitter.com/5chan_nel (5ch newer account)

2023/08/14(月) 15:54:55.52

https://huggingface.co/line-corporation/japanese-large-lm-3.6b
3.6Bかあー
このクラスはもうあんま試す気にならんな

言語モデルが学習量であるラインからいきなり賢くなるって
すでにわかっているわけだし

2023/08/14(月) 17:12:38.63

おお、mmngaさんって人が日本語モデルのGGMLを上げ捲ってくれてる

2023/08/14(月) 17:22:55.86

本当だ
ファイルサイズ小さいし片端から試してみよう

2023/08/14(月) 18:05:34.74

4種類いじってみたけどどれも指示と無関係の話題を羅列するばかり
指示のしかたが悪いのか？もう少し触ってみよう

2023/08/14(月) 18:09:26.53

同じく試したが、koboldと相性悪いのかな？文字化けする

2023/08/14(月) 18:11:19.05

koboldって日本語系だと文字化け結構するよねえ

2023/08/14(月) 21:27:11.93

うーんダメだな
koboldだけど最初の1-2行はそれっぽい回答するけどそれ以降は無関係の文章を垂れ流すわ
どれも同様だから共通した問題ぽい
なんだこれ？GGML化の時に何か間違ってるのか？

2023/08/15(火) 13:11:44.08

ここ数日日本語モデルを色々試したけど現状はまだ待ちだと再認識した
33Bの英語モデルで遊ぶ日々に戻るよ
ファンタジー系は英語モデル強いな

2023/08/15(火) 21:58:16.72

>>116
今はどのモデル使ってる？

2023/08/15(火) 23:55:39.00

安定のairochronosを使いながら他のモデルも色々試してるよ
https://huggingface.co/TheBloke/GodziLLa-30B-GGML/tree/main とか
https://huggingface.co/TheBloke/llama2-22B-daydreamer-v2-GGML/tree/main とか
悪くないんだけどairochronosは超えないかなぁ

2023/08/16(水) 08:37:53.12

ここのスレの人が好きそうなやつ(´・ω・`)
https://twitter.com/sotokisehiro/status/1691570995646329278
https://twitter.com/5chan_nel (5ch newer account)

2023/08/16(水) 09:03:30.40

>>118
サンキュ！

2023/08/16(水) 13:33:31.53

ここのスレの人が好きなGGML(´・ω・`)
https://huggingface.co/mmnga

2023/08/16(水) 13:36:06.59

それすぐ上で話題になってたやつ

2023/08/16(水) 20:14:09.04

v3が出てたhttps://huggingface.co/TheBloke/Llama2-22B-Daydreamer-v3-GGML/tree/main
説明によればLlama 2 13bを33bサイズまで拡張したりairborosからコーディング支援の部分を取り除いて、そこを会話やロールプレイのデータで埋めたとか面白そうなことが書いてある
まだ調整中らしく完成ではないらしい
触った感じv2より良くなってる印象はあったので今後も期待

2023/08/17(木) 17:38:11.12

orca_mini_v3_70b
これを試したんだが、セリフ周りはdeepnightを超えてると思う。
エロ小説書かせると、伏字使ってきたのも驚いた。

2023/08/17(木) 19:30:46.00

30GB超えとかのファイルを見るとその時点でｷﾞｬｰってなっちゃう
はやくPCの性能上げたいわ

2023/08/17(木) 19:50:54.36

stable diffusion用にGPU重視で自作PC作ろうと思ってるけど、言語モデルの方は市販GPUで動かすのは無理があり、CPUとRAMで動かす方が現実的なんですかね?イラストも言語モデルも動かせるPCだとかなり高額になりそう。

2023/08/17(木) 20:00:40.45

結局32GBってGPU界隈だと「お前やべーな」やけど
普通のPCだと別に珍しくもないって感じやからねえ

CPUについて最先端求めるならともかく、3060みたいな
5万円弱クラスのCPUを積んでメモリ64GBとか積むなら
言うほど高くもならんのでは？

2023/08/17(木) 20:01:35.78

最新のstable diffusionXLならVRAM12G以上あればいいし、ローカル言語モデルならメモリ64G以上積んどけばGGMLなら問題ない。
GGML以外ならVRAMは底なしだがｗ

2023/08/17(木) 20:01:53.59

4090買えるなら7B程度ならなんも考えずに動くし30Bクラスもオフロードなり8bit化なりでうごくべ

2023/08/17(木) 20:20:01.63

Windowsで8bitのときの壁だったbitsandbytesさんはもう大人しくなったんかな

2023/08/17(木) 20:21:45.74

今日それで悩んでたわ
LINEの3.2Bを4bitにしたとき現れた

2023/08/17(木) 20:40:36.47

>>126
ですね<CPUとRAMで動かす方が現実的
RAMは64GB積んでおけば70Bモデルも動く
CPUは出力速度に直結するから速いのが欲しいけど8コアのやつを選べば1-2代前のやつでも結構速いよ

2023/08/17(木) 20:49:37.16

モデルの大きさ別に出力速度の見本をつくってみた
CPU: RYZEN7 5700X
RAM: 64GB
GPU: RTX3060 12GB
13B
https://i.imgur.com/YhLNEeK.mp4
33B
https://i.imgur.com/W78bDZI.mp4
70B(遅いよ)
https://i.imgur.com/7PuYhTj.mp4

2023/08/17(木) 20:53:26.25

でも5700Xとかの世代になりゃ70Bでもとりあえずいけることはいけそうやな
結局RAM64GBが人権ってことや

32GBでも過剰みたいな説があったのにまさかこんなとこに64GB人権の場が
できるとはな

2023/08/17(木) 21:28:17.16

>>124
最低限って感じにはなるね
https://i.imgur.com/ZiJs7Yv.png

しかしGPTQでもかなり遅いな
70BのGPTQは他のでもいくつか試したことあったけどここまで遅いの初めてだ

2023/08/18(金) 02:13:19.55

>>130
ここからwindows向けビルドが落とせる

https://github.com/jllllll/bitsandbytes-windows-webui

2023/08/18(金) 09:17:36.40

こんなこと言っていいのかわからんけど、rinna 3.6bに脱獄プロンプト
与えたら色々できた。ありがとう。rinna。

2023/08/18(金) 10:03:29.90

web uiでrinna使ってみたけど支離滅裂になる
解決法知ってる人いたら教えてください

2023/08/18(金) 12:25:33.11

10Bモデルきたな

2023/08/18(金) 13:20:05.00

>>75
こういうのってありがたいね

2023/08/18(金) 13:41:03.54

>>137
りんなの知性だと脱獄しようがするまいが変わらないのでは・・・
そもそもりんなって規制少なめだし

2023/08/18(金) 13:46:59.47

10B試したけど、koboldでも大葉でも、文字化けひどくて使えん。なんか設定あるんかな？

2023/08/18(金) 13:50:46.48

Pythonの素で動かそうとしたらメモリ不足になってもうた

2023/08/18(金) 13:57:55.60

https://qiita.com/taka_yayoi/items/e80e9a307612ae1dce9f
128GBでOOMってマ？
なんかこの人のやり方がおかしいとかじゃなくて？

2023/08/18(金) 14:04:19.91

>>138
>>5-6の話じゃなく？

2023/08/18(金) 14:39:09.35

>>136の0.41.1を入れても

The installed version of bitsandbytes was compiled without GPU support. 8-bit optimizers, 8-bit multiplication, and GPU quantization are unavailable.
warn("The installed version of bitsandbytes was compiled without GPU support. "

が出る　なんでやー

2023/08/18(金) 17:24:09.15

>>142
これ含めてmmnga氏がGGML化したモデルはどれもまともに動かん…

2023/08/18(金) 17:27:45.13

https://huggingface.co/kujirahand/ggml-gpt-neox-japanese-llm/tree/main
こいつもモデル名に期待してるんだけど本体がアップロードされとらん

2023/08/18(金) 19:32:05.80

https://twitter.com/AiXsatoshi/status/1692473832098148686
これだ
oobaでいけたで　遅いけどｗ
https://twitter.com/5chan_nel (5ch newer account)

2023/08/18(金) 19:34:54.31

https://i.imgur.com/ViPJttc.png
うーんこの

2023/08/18(金) 19:35:22.95

Chat Settingsに何か入れる必要あるのかな

2023/08/18(金) 20:17:46.92

>>150
mmnga版じゃなく本家を大葉で動かしたら、その設定で動いたわ。
同じお題出したら、

富士山だよ。でも、今日の天気じゃ見えないね…。

って答えたぞ

**>>0138** (ﾜｯﾁｮｲ 8b54-DXLR) · 2023/08/18(金) 20:43:11.74

私も同じ環境で同じような状況になります。
こっちの質問と全く関係ない話をしだしたり…
なんかの広告プログラムでも入ってるのかと思ったり。

2023/08/18(金) 20:53:45.37

試したのは事前学習版だったんで、今度は事後学習版をためすわ
それにしても遅いね、これ。GGML の70Bの3倍くらい遅いｗ

>>153
>>5-6読んで

2023/08/18(金) 21:04:49.24

>>141
4Bは対策されてるのか塩対応。

**138** (ｱｳｱｳｴｰ Sa52-Qxh5) · 2023/08/18(金) 21:51:46.68

教えて頂きありがとうございます
ちゃんと動きました！

2023/08/18(金) 22:26:16.15

https://twitter.com/gclue_akira/status/1692527371575062893
やっぱGPUでちゃんと動かせると速いんやね
https://twitter.com/5chan_nel (5ch newer account)

2023/08/18(金) 22:45:15.04

peftをアップグレードしたら前作ったLORAが使えなくなった
なんで

**153** (ﾜｯﾁｮｲ 7154-greZ) · 2023/08/19(土) 02:49:42.96

>>154
私もできました。ありがとうございます♪
モデル名をrinnna_bilingual- から入れたら上手くいきました。

2023/08/19(土) 15:44:28.98

>>149
Parameters の Preset によってだいぶ文章変わるみたい。小説書くなら instruction じゃないモデルの方が良さそう。

速度は 4bit で 3080 12GB だと 10 tokens/sec 前後だけど、文が長くなるとメモリ足りなくて止まる。

2023/08/19(土) 15:52:58.94

3080 12GBなんてあるのか
AI系にとってはなんとも微妙な存在だな

2023/08/19(土) 18:19:52.64

4bit float16という庶民最後の希望

2023/08/19(土) 19:38:44.29

redditだとroleとstoryならmythomax l2 13bの評価が高いな

2023/08/19(土) 20:10:02.15

英語なら33Bからが人権ちゃうの
日本語はもうまともなの1つでも出てこーいな感じがあるけど

松尾研のはそれなりに可能性感じる

2023/08/20(日) 04:56:11.25

MythomaxはHermes並の理解力で冗長に出力してくれる印象
一定の表現力もある

2023/08/20(日) 06:41:21.89

hermesもいいよね
13Bを使ってた頃はhermes-chronosを愛用してた

2023/08/20(日) 13:37:22.61

oobaboogaのload-in-8bitで松尾研のかなり実用的になるな
十分とは言えないけどりんなとはレベルがちゃうわ

2023/08/20(日) 13:47:29.66

>>167
大葉の8bitだとVRAMどのくらい使う？

2023/08/20(日) 14:10:22.29

他のアプリもあるから正確にはわからんけどとりあえず3060で動いてる

2023/08/20(日) 14:25:47.90

小説書くなら instruction じゃないモデルの方が良さそう　っていうのは
何モードでどう命じるんや？

2023/08/20(日) 14:26:01.12

ありがとう
12GBは超えない感じか

2023/08/20(日) 14:40:10.62

GPT-4でもチャット形式だとすぐ制限回数消費しちゃうし
日本語だと能力低いしで、日本語のそれなりのローカルのがあると
意味はあるのよな

2023/08/20(日) 15:11:03.98

3060 12GBマシンにoobabooga入れて>>149の対策して
git cloneをoobaboogaのmodelsフォルダで実行してinstruct版を
ダウンロードして、oobaboogaのModelsタブでload-in-8bitに
チェック入れてからinsrtuct版のweblabモデルを選んでLoadボタン

Chat Settingsで互いの名前適当に決めてContextに日本語で
短く設定を入れて後は普通にChat

Regenerate、Replace Last Replyとかをつかいこなして誘導
基本はこれでいいかな？

2023/08/20(日) 15:11:27.65

>>149の対策はダウンロードした後だからもっと下か

2023/08/20(日) 15:42:32.12

情報ありがたい
ずっと動かなかったけど149通りにしたら動いたわ
instructでやる場合テンプレートはどう設定すれば正しく動作するんだろう

2023/08/20(日) 15:48:21.59

英語だけでも別にいいんだけどchat Gptやbing代わりにローカルで使いたいんだけど、今なら>>56のやつがllama2より良いのかな？

2023/08/20(日) 16:03:54.13

チャットモードだと、入力分の英語変換も、回答の英語変換もポンコツだからか
ここで会話の齟齬が出てくる。
和英併記の会話窓とか作れないもんかな。

2023/08/20(日) 16:05:12.14

>>176
日本語なら>>124もおすすめ

2023/08/20(日) 17:05:40.77

>>178
ありがとう
用途はプログラミングの内容とか聞くのに使いたいから別に英語でもいいんだ
bingさん最近これ違うよ？って言っても同じ回答オウム返しで誤魔化すようになって、ポンコツだな！って怒ったらすぐにコミュニケーション拒否してスネるから…

>>164
33Bも使いたいけどGPUは3090だけどメモリ32GBじゃ無理だよな…

2023/08/20(日) 19:48:41.71

GPTQのならいけたりしないんかなあ？

2023/08/20(日) 19:49:10.52

ってかプログラミングならbingさんじゃなくてChatGPTでいいのでは
エロでもないなら堂々と4つかえるし

2023/08/20(日) 20:00:19.78

>>181
gpt4無料で使える裏ワザあるの？

2023/08/20(日) 20:35:52.80

あるよ

2023/08/20(日) 21:26:44.16

おしえて

2023/08/21(月) 00:43:00.62

https://note.com/bakushu/n/nbe8d2813c76b
GGMLが

2023/08/21(月) 00:49:34.10

>>170
PC閉じちゃったからうろ覚えだけど、左端のタブでエンターキー押すと自分とAIの会話になっちゃうとこで、エンター押さずに入力欄の少し左下にあるボタン押すと、入力欄に文章の続きを入力してくれる。

matsuo研の Instructionモデルでそれすると『。』で止まって続き書いてくれなかった。

って感じです

2023/08/21(月) 01:24:10.42

>>183
いい年した大人がウソついてまで意地悪してるんだからそりゃあ世界一言われるわな恥ずかしいｗ

日本人「世界一礼儀正しい」が「世界一イジワル」…「自分の利益より他人の不幸を優先する度合い」実験「日本人ダントツ」の衝撃結果 ★9 [ぐれ★]
https://asahi.5ch.net/test/read.cgi/newsplus/1692534964/

2023/08/21(月) 06:10:02.39

ぽえ～

2023/08/21(月) 06:13:55.93

このスレでも散々poeの話出てるのに自分の無知棚に上げて嘘つき呼ばわりしてる奴だから国嫌いこじらせるんやろな

2023/08/21(月) 06:41:02.86

きっついな

2023/08/21(月) 09:39:31.61

ブローク先生上げ直し？まくってるけどどうしたんだろ？

2023/08/21(月) 10:29:00.81

>>191
>>185の件では？

2023/08/21(月) 12:50:40.21

たった3文字書けば感謝されて終わってたのに、図星突かれたら火病って逆ギレしだすところとか意地悪文化を地で行ってて当たってるｗ

2023/08/21(月) 13:47:37.79

>>192
再アップしてるのGPTQばかりだしこっちもアレに関係してんのかな？

2023/08/21(月) 18:04:26.33

おお！
モモンガ氏の再アップ版はkoboldでまともに動くようになってるぞ。

2023/08/21(月) 20:54:19.42

うーん、だが、文鳥はダメだった

2023/08/22(火) 01:02:03.47

japanese-stablelm-instruct-alpha-7b
そのままじゃtext-generation-webuiで動かなかったけど、モデルデータと同じフォルダにnovelai tolknizerV1のファイル適当に入れたら動いた。以上赤ちゃんより。
chat中にcontext1000こえると続きが生成できなくなったんだけど、この限界値はモデル側の仕様なん？

2023/08/22(火) 01:13:37.64

昨日からLLM始めてみたけどvicunaの検閲解除版凄まじいな
（地の文）とか駆使すればいくらでもエロチャットが生成されていく
もう俺英語の国の人になるわ

2023/08/22(火) 06:58:55.56

ローカルLLMによう来た
一緒に好き放題しようず

2023/08/22(火) 07:11:52.47

英語でエロスを感じるまで長そうだ
知らない単語が出てきたら萎えちまう
deeplのapi挟んでも丁寧語で萎える
そもそもエロい英会話を学ぶ機会がないわ