なんJLLM部

2023/03/16(木) 10:34:10.55

!extend::vvvvv:1000:512
!extend::vvvvv:1000:512
!extend::vvvvv:1000:512
はい

VIPQ2_EXTDAT: default:vvvvv:1000:512:: EXT was configured

2023/03/16(木) 10:36:55.70

建て乙

2023/03/16(木) 10:37:01.70

サンイチ

2023/03/16(木) 10:37:52.23

ほしゅ

NVAスレに貼ってくれてたLLaMa関連のリンクテンプレに入れたらどやろ？

2023/03/16(木) 10:40:13.05

折角なので例のスレの有益そうなレスを引用
>>494 まえワシがメモしてたやつ↓
LLaMA INT8 推論ガイド - https://rentry.org/llama-tard
↑に貼られてた新しいRentry文書↓
https://rentry.org/llama-tard-v2
Text gen WebUIなんてもうあるらしい
oobabooga/text-generation-webui: A gradio web UI for running Large Language Models like GPT-J 6B, OPT, GALACTICA, LLaMA, and Pygmalion. - https://github.com/oobabooga/text-generation-webui
NSFWの言語モデルもあるらしい
*-Erebus (NSFW)　https://huggingface.co/models?search=erebus
Pygmalion (NSFW)　https://huggingface.co/models?search=pygmalion
言語AIもなんか便利なAI(NVA)でこの板でやってもええんかな?
https://mevius.5ch.net/test/read.cgi/esite/1678697539/

2023/03/16(木) 10:41:56.17

最後の行混ざってもうたわ

関連スレ
【ChatGPT】AIチャット総合スレ【Bing】
https://mevius.5ch.net/test/read.cgi/esite/1678697539/

2023/03/16(木) 10:43:44.95

おつ

2023/03/16(木) 10:44:21.88

ここ数日の出来事をまとめようとしたけど
ワイの知識が足りん上多すぎというか早すぎて無理や

2023/03/16(木) 10:44:54.14

何のスレなのか日本語三行で教えてクレメンス

2023/03/16(木) 10:45:34.67

さんいち。3060で出来るか期待

2023/03/16(木) 10:46:29.75

サンイチ
llama.cppってのをビルドして7bってモデル使えばええんか

2023/03/16(木) 10:51:03.93

サンイチ

2023/03/16(木) 10:52:13.22

さんいちホシュ
とりあえずセットアップが難しいかわりに4bit(?)で動作させれば頑張ればVram 12GBでLLaMA-13Bが動かせるらしいな

2023/03/16(木) 10:56:42.24

>>9
ChatGPT, Bing(AI), 流出したLLaMaみたいな　
LLM(大規模言語モデル)で
あれやこれやするスレ

やろ

2023/03/16(木) 10:56:42.29

8Bとか13Bとか何が違うんや

2023/03/16(木) 10:56:52.21

>>9
ChatGPT的なのを
ローカルで動かして
すけべしようや……

↑のtext-generation-webui入れてStableDiffusionみたいにモデルいれりゃできるんじゃね感はある。なんもしらんけど
Anacondaインストールする必要あるらしい

2023/03/16(木) 10:57:57.45

さんいち
興味はめちゃあるので助かる

2023/03/16(木) 11:00:25.19

>>15
BはBillion（10億）の意味らしい。

パラメータ（？）が80億とか130億とかのことらしい。

2023/03/16(木) 11:00:38.15

https://www.jailbreakchat.com/
ChatGPTでエッできる脱獄テキスト集

2023/03/16(木) 11:00:46.31

今のLLMは誰もファインチューニングしてないlora無しSD1.4みたいなもんだから
盛り上がるのはチューニングしてからだな
個人情報の問題があるし、ワイらは当然ローカル派やろう

2023/03/16(木) 11:00:56.19

ワイのおすすめモデルはGPT-4chanや
次から次へと人種差別繰り広げるから最高や

2023/03/16(木) 11:04:21.33

出来ればloraのように、誰しもが追加学習出来るパッケージが流行って欲しいな
基本モデルに左右されるのは嫌やしリスクが高い
好みの性格loraと声優loraとをあてがうツールとか誰か作ってくれ

2023/03/16(木) 11:06:46.62

言語AIの需要って娯楽なのに去勢されたら興味ないんよな
求めてるのは調教できるオナペットＡＩや

2023/03/16(木) 11:08:03.40

>>18
そうなんかやっぱ大きい方が精度上がるんかなぁ

2023/03/16(木) 11:11:01.89

>>14 >>16
サンガツ

言語モデルもローカル化きたかぁ
エロ会話できてノルネみたいに声も出たら最高やな

2023/03/16(木) 11:11:50.46

GPT-3までは、パラメーター増やしたら急に超知性になるやん
→じゃあ100兆とかにしたろ！と思ったけどデカすぎて動かすの大変やん
→やっぱり小さくしても賢く出来るしスマホで動くやん
→モダリティ増やしたらもっと賢くなってきたやん
今この辺だな

2023/03/16(木) 11:12:55.76

ChatGPTはムッツリやけど演じさせたら日本語の大分マイナーな淫語とかもノリノリで使いこなしたり色んな性格演じてくれたし、LLMも追加学習無しでも充分エロ知識持ってる可能性にワイは期待しとる

2023/03/16(木) 11:13:46.88

AIのべりすとでエロ小説ぶちこんで訓練してたことあるけど
喘ぎ声を出すのが微妙にうまくいかんのよな
あぁぁぁみたいな同じ文字連続するやつやと推論うまくいかんのかすぐループしたりしてバグるんや

2023/03/16(木) 11:16:27.60

WEBUIでCharacterAIもどきをさせるのはそこそこいい感じだがいかんせん日本語がダメダメ

2023/03/16(木) 11:16:46.69

>>21
動かしたことあるん?
てかこれhuggingfaceでBANされてて草ですわ

2023/03/16(木) 11:17:48.18

朝鮮人キモいからさっさと死んでくんね？ｗつか歌舞伎町とかで顔面煽りしても何も言い返せないのマジ草＾＾

色々なスレにレス置いてるけどアク禁食らったら雑魚共逃げたってことだからな？ｗ

2023/03/16(木) 11:20:13.87

論文読んでみたが日本語のトレーニングセットは無いんじゃないか
メタからリークしたウェイトじゃ日本語喋れんから追加トレーニングが必要だな
まあそのうち誰かやるやろ

2023/03/16(木) 11:34:49.10

>>30
text-generation-webuiですぐ動かせる、モデルはhuggingface以外にも再アップロードされてるし
あと日本語の話やけど日本語で学習したLLMはすでにたくさんあるし、なんならLLaMaも日本語を多少は学習してるようでそこそこ自然な文章を生成できるで

2023/03/16(木) 11:36:12.38

GoogleのやばいやつもAPI公開するらしいな

LLaMAってやつは性能どんなもんなん？

2023/03/16(木) 11:36:31.90

日本語モデルRinnaとかバンナムとか最近やとLineがなんか出してるのは知ってるが
StableDiffusionみたいにDLしてポンで動くわけじゃないからよくわからん
あと多分ワイのPCじゃ無理…

2023/03/16(木) 13:07:13.99

LLaMAをR9 5950x RAM64GBで動かしてみたけどdallaiで4bit量子化するとやっぱり単語の読解力がかなり落ちるみたいやね
-t 32オプションつけると32スレッド全部が使用率100%で埋まるのは圧巻だった

2023/03/16(木) 13:10:58.15

あ、dalaiじゃなくてllama.cppやね

2023/03/16(木) 13:15:09.08

画像生成用PCのCPUケチったの仇となりそうや

2023/03/16(木) 13:20:55.80

503 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ﾜｯﾁｮｲ 717b-S+nL) 2023/03/16(木) 08:44:20.59 ID:FkRXNkMw0
>>494
まえワシがメモしてたやつ↓
LLaMA INT8 推論ガイド - https://rentry.org/llama-tard
↑に貼られてた新しいRentry文書↓
https://rentry.org/llama-tard-v2
Text gen WebUIなんてもうあるらしい
oobabooga/text-generation-webui: A gradio web UI for running Large Language Models like GPT-J 6B, OPT, GALACTICA, LLaMA, and Pygmalion. - https://github.com/oobabooga/text-generation-webui

2023/03/16(木) 13:21:09.48

>>38
メモリ使いすぎてRAMに展開せな現実的じゃない感じなんやと思うで
でもそのうちllama.cppもGPUに対応するかもって話がでとるみたいやし多分なんとかなると思うで

2023/03/16(木) 13:21:55.27

うまくはれん分かれた

NSFWの言語モデルもあるらしい
*-Erebus (NSFW)　https://huggingface.co/models?search=erebus
Pygmalion (NSFW)　https://huggingface.co/models?search=pygmalion
言語AIもなんか便利なAI(NVA)でこの板でやってもええんかな?

2023/03/16(木) 13:23:10.49

>>39
情報感謝や
今までツイで断片的な情報負うばかりやったかからこのスレは渡りに船や！

2023/03/16(木) 13:24:08.44

>>41
ええと思うで
活気が出てきたらそのうちにフォークしていくと思うわ

2023/03/16(木) 13:25:02.47

llama動いた！ダライ・ラマに感謝やわ
ちなRyzen9 3900X RAM32GBや
でも7Bやからか日本語やからか何言うてるかわからん
やっぱ日本語はあかんか

2023/03/16(木) 13:25:43.29

>>43
すまんそれコピペ元の人のレスや😅

2023/03/16(木) 13:29:51.81

日本語の言語モデルをまとめてくれてる人がおったで
直リンあかんかもしれんから一応魚拓挟んだで

フリーで使える日本語の主な大規模言語モデルまとめ
https://archive.is/pZZrt

OPT-175Bとroberta v2が気になっとるんやがローカルで動かしてみた人とかおりましたらぜひとも情報オナシャス

2023/03/16(木) 13:30:48.49

>>45
マ？マジレスすまんな😌

2023/03/16(木) 13:31:31.04

これもそういうモデルなんかな？よくわからん
https://engineering.linecorp.com/ja/blog/line-distilbert-high-performance-fast-lightweight-japanese-language-model

2023/03/16(木) 13:53:36.95

>>44
量子化で圧縮した影響かもしれないけど65Bでも日本語はあかん感じやね……
部分的に単語は理解してるみたいだけどやっぱりローカルじゃまだchatgptみたいにはいかないんやな
https://i.imgur.com/MtAzBQY.png

2023/03/16(木) 13:54:19.24

>>48
面白そう
試してみるで

2023/03/16(木) 14:05:57.46

Lineのやつ気にはなるけどスペックのせいかワイが悪いのか環境構築でつまずいたから試してくれるならありがたい
Twitterで検索してもあんまり話題になってない上にみんなGPT-4に首ったけや

2023/03/16(木) 14:28:05.30

tensorは返ってくるのにsentenceが帰ってこない謎の現象に見舞われたんやが
エラーも出とらんしrootで動かしたせいやろか
https://i.imgur.com/Zm5eq3X.png

2023/03/16(木) 14:35:29.85

わいもそんな感じや
でもな～んもわからんからどうしようもない有識者はおらんか
https://i.imgur.com/CqRjTi5.png

2023/03/16(木) 14:43:53.47

>>53ニキもかー
hugging faceのtoransformersを使ってるみたいやし手始めにそこから調べなあかんかもしれんね
これはもうワイらが有識者になるしかなさそうやね……

2023/03/16(木) 14:58:59.13

サンイチ
ワイもプログラミングとか全くできんけどGPT4にお願いしたらガチで作ってくれるんやなびっくりしたわ

2023/03/16(木) 15:22:50.50

動いたっぽい
https://i.imgur.com/Avlue5O.jpg

from transformers import pipeline
unmasker = pipeline('fill-mask', model='line-corporation/line-distilbert-base-japanese', trust_remote_code=True)
print(unmasker("LINE株式会社で[MASK]の研究・開発をしている。"))

2023/03/16(木) 16:18:17.43

それでわいも動いたけど
なんか単純にワイのLLMに対しての知識もTransformerというか🤗の知識もPythonも足りてへんわ
ちゃんと調べなあかんって思ったけど
ワイはえっち官能小説を量産したかっただけなのに…どうして…

2023/03/16(木) 16:23:19.08

いちおつ
このスレからSDみたいな誰でもすぐ使えて簡単に調教できるチャットAIパッケージが産まれたら最高やね

2023/03/16(木) 17:35:47.11

SD3.0もGPT-4とほぼ同じようなものっぽいし、それが出たら
画像の同じ流れで盛り上がるだろな
emadさんが叩かれるの怖がってるから中々出さん

2023/03/16(木) 19:16:36.10

思うんやが、会話用のLola作ればllamaで日本語無料でいけるんちゃうか？

2023/03/16(木) 19:18:13.07

それもchatgptに作ってもらえばいいのか

2023/03/16(木) 19:19:38.23

もうlora出来るようになったんか
https://github.com/tloen/alpaca-lora

2023/03/16(木) 19:22:06.17

早すぎて草

2023/03/16(木) 19:28:42.71

そこそこのPCでも使えてwebuiみたいに簡単に使えるようになるまでROMる予定

2023/03/16(木) 19:42:03.09

りんなのGPT2を名古屋大学のコーパスを元にRTX3090でファインチューンしてる人見つけたで
エロゲとか小説とかから自前でコーパス作れば好きな性格のチャットボットとか作れたりせんかな

GPT2をWindowsローカル環境でファインチューニングする方法手順を解説
https://megalodon.jp/2023-0316-1919-36/https://economylife.net:443/gpt2-windows-local-fine-tuning/

GPT-2を入力文に沿った雑談を行うようにファインチューニングしてみた
https://megalodon.jp/2023-0316-1919-26/https://economylife.net:443/gpt-talking-fine-tune/

2023/03/16(木) 19:53:34.03

>>65
あんままともな会話にならんで、chatgptレベルを求めてるなら

2023/03/16(木) 19:55:58.98

>>66
やっぱりか
chatgptまでいかなくてもとりあえずノルネレベルでもええんやがローカルじゃまだ無理やろか

2023/03/16(木) 19:58:52.13

>>67
うーんファインチューニング次第ではノルネレベルは行けそうやと思う、ただ素のGPT2触ってレベル感測ってみるとええと思うで

2023/03/16(木) 20:00:30.51

>>68
サンガツ
とりあえずイジってみるで

2023/03/16(木) 20:01:27.06

英語と日本語の壁はトークンの壁だからモデルサイズデカくなるのはしゃーない感ある

2023/03/16(木) 20:17:37.07

>>62
すごヨ
ワイ完全に周回遅れですやん

2023/03/16(木) 20:26:32.97

https://note.com/npaka/n/n1a0ab681dc70
Alpacaの日本語解説あったけど何言ってるかわからん
LLaMaをGPT-3でなんやかんやぐらいしかわからん

2023/03/16(木) 20:35:14.39

アルパカ何が元と変わったのかリポジトリ読んでもいまいちわからん

2023/03/16(木) 20:36:56.94

>>72
要するにchatgptを先生にしてllamaに教育したってことや

2023/03/16(木) 20:40:23.48

正直自信ないけど
LLaMA 7Bをtext-davinci-003と会話させることでtext-davinci-003に近い能力が7Ｂ動かすときくらいの比較的軽い環境でも動くようになったと考えればええんかな？

2023/03/16(木) 21:09:51.08

7Bの追加学習にA100が8台も必要なんか……

2023/03/16(木) 21:17:44.68

でもクラウド借りて1万円ちょいって考えたら安くね？割と現実的
まぁNVA部のお絵描きLoraとかと比べたらコストかかるけど

2023/03/16(木) 21:31:17.72

SDみたいにゲーミングPCで普通に遊べる、ってぐらいお手軽になればなぁ

2023/03/16(木) 21:51:32.97

そのdavinci003とかいうのを知らん
どのぐらいの性能なの？

2023/03/16(木) 21:56:30.24

とりあえず30MB分エッチ文章集めてきたからりんなちゃんFine tuningしてみる

2023/03/16(木) 21:57:30.84

>>79
昔のchatGPTやと思っていい…はずGPT-3やと思う
今は3.5とか4や

2023/03/16(木) 21:59:12.03

ファインチューニング回したら153時間とか出てきて草

2023/03/16(木) 22:12:48.92

>>81
3.5未満となると日本語はあかんな
なりきりチャHでワイをイカせるほどの力はない

2023/03/16(木) 22:23:16.20

>>83
いうて3.5は進化じゃなくて性能ちょっと削って爆速バージョンやから
精度だけ見るなら3のほうが上や

2023/03/16(木) 22:34:18.65

>>84
マ？希望湧いてきたな

2023/03/16(木) 22:38:53.73

>>82
いきなり30MBもブチ込まれたらりんなちゃん死んでまうやろ……
ワイはひとまずお気に入りのエロゲ同人ゲーからシナリオ文ぶっこ抜くところから始めるで
こんなことならもっと早く準備しとけばよかったわ

2023/03/16(木) 22:48:23.61

alpacaLolaしたほうが日本語無料作れるんちゃうか？

2023/03/16(木) 22:48:50.03

ワイは一応Lolaやってみる

2023/03/16(木) 22:51:05.27

>>88
そっちはニキに任せたで
エチエチりんなが失敗したときはニキにAlpacaLoRAを教わりに行くから優しくしてクレメンス

2023/03/16(木) 22:56:17.54

エチエチりんなは響きがええな
調教って感じがしてそれそのものが楽しそうや

2023/03/16(木) 23:02:49.43

wifi使ったからID変わったと思うけどエチエチりんな止めたわ
明日お古のパーツかき集めてサブPC組むからそっちで試してみる…
GTX1070+Ryzen5 1400Ram16GBとかいうオンボロやけど
学習だけでもクラウド系も視野に入れなあかんか…？

2023/03/16(木) 23:08:49.43

GARbroでエロゲのアセットファイルからテキストスクリプト丸ごとぶっこ抜けたんやが、ここから「」が付くセリフを抽出してさらに余計な男のセリフを削ぎ落としていくのは自動化せなあかんな……

2023/03/16(木) 23:09:55.08

>>90
せやせや
GPT4とかと比べて多少頭が悪くてもエチエチならきっとすべてを許せる気がするんや

2023/03/16(木) 23:15:45.04

>>91
ファイトやで
ワイもマイニングしてた頃の1070が3台くらいまだあったきがするけど学習は厳しそうな悪寒するで
メインは3080Tiやが値段つくうちに売っぱらって4090買ってそれでもあかんならクラウド1万円に賭けるつもりや

2023/03/16(木) 23:33:44.16

ふーむ赤ちゃんにはまだちょっと早いみたいやな
おまえらの調教済モデルが出荷されたら楽しんでみるわ
生娘調教おもしろそうやけどテクがないと無理やなぁ

2023/03/16(木) 23:39:06.43

Colaboの無料GPUにしたら5時間って出た
定期的にアクセスするスクリプト用意したら行けるかな？
定期的に見ないと止まるんだっけ？

2023/03/16(木) 23:39:59.94

https://colab.research.google.com/drive/1eWAmesrW99p7e1nah5bipn0zikMb8XYC

一応alpacalolaここで色々遊べるで

2023/03/16(木) 23:50:34.61

無料GPUってT4よな？3060のほうが強い？
もしかしてワイCPUで回してた？

2023/03/17(金) 00:36:14.95

ワイ実はcolab触ったことないから全くわからぬい
ググってみたら無料でもvram16GBも使えるんか、ええやん！

2023/03/17(金) 00:56:47.49

Text generation web UIのColabみたら裏で音楽流して接続切れんの回避させてる感じあったな
#@title 1. Keep this tab alive to prevent Colab from disconnecting you { display-mode: "form" }
#@markdown Press play on the music player that will appear below:
%%html
<audio src="https://oobabooga.github.io/silence.m4a"; controls>

2023/03/17(金) 04:13:38.07

JNVAから来たけどここは何のスレや？　無限に知らん単語が飛んでる

2023/03/17(金) 04:51:01.27

>>101
NLP(自然言語処理)のLarge Language Model(大規模言語モデル)スレやで
なんの規制もされてないまっさらで純真無垢なチャットAIをローカルで動かしてエロ調教しながらえちえちにしていくのが当面の目標みたいやで

2023/03/17(金) 05:03:33.45

>>102
なるほどたすかる。　最強に有意義なスレやな！

2023/03/17(金) 05:39:53.61

マ？ローカルで！？しゅごい！
ファ～もうウチのラデオンちゃんはもういらない子なんやな

2023/03/17(金) 08:54:20.35

ローカルでいい感じのできた人いたら出力例をみたいな
あんまモチベ上がらん

2023/03/17(金) 09:57:26.56

えちえちりんなちゃん出来てたわ
学習素材にワイがアイマス好きやったころPixivでブクマしたR-18ノベルまとめなせいでアイドル要素とかキャラの名前がアイマスに引きずられてるけど概ねいい感じ？
もっとちゃんとしたら簡単なのな出来そう
両方とも「私は、」で続きを生成させた

ノーマルりんなちゃん
https://i.imgur.com/YlpsznJ.png
https://i.imgur.com/Xn5FFYD.png

ファインチューニング後えちえちりんなちゃん
https://i.imgur.com/Bwj9UBL.png
https://i.imgur.com/cw0NBbv.png

2023/03/17(金) 09:59:33.33

関係ないけどtorch.cuda.is₋available()してfalseになってたわ
生成長いなーって思ってたらずっとCPUでやってたんやね
やっぱ昨日の150時間はcpuで学習回してたか

2023/03/17(金) 12:54:00.90

>>106
やりますねぇ！
途中で変な単語とか入らずにちゃんと中までしっかり喘いでるのすごヨ

2023/03/17(金) 12:59:00.60

>>107
cuDNNドライバが入ってないかcudaのバージョンが11.8以上とかやろか
linuxならnvidia-smiとnvcc -Vを叩いてみるんやで

2023/03/17(金) 13:09:50.18

イラストAIもやがエロかったら多少不自然でも全然いけるわ
連続生成したけどビンビンやわ
ちゃんとテキスト用意したらもっと良くなるやろかモチベが湧くわ

https://i.imgur.com/aurjIiC.png

>>109
cuDNNとか確認したらGPUで行けたわ
今までトイレ行ってコーヒー淹れるぐらいの時間あったのに数秒で終わって草

2023/03/17(金) 13:19:24.62

>>110
せやせや、エロは世界を救うんや！
ローカルでも数秒で学習終わるならワンチャンNVAみたいにこっちも流行るかもしれんな
みんなの欲望を乗せたエロチャットAIに会える日が楽しみや

2023/03/17(金) 13:26:31.40

ただやっぱりまだNLPは学習元に下ごしらえせなあかんのが鬼門やね
NVAなら画像ぱっと見でシコれるかシコれないかを判断できるけど文章やとそうもいかんしの

2023/03/17(金) 13:28:49.09

ワイはとりあえずエロゲからぶっこ抜いた複数のスクリプトファイルを1つのテキストファイルに纏めてから、セリフだけを抽出するGUIを作ってみてるけど、出来たらソースごと上げるから有識者にもっと便利に作り直して欲しいンゴね

2023/03/17(金) 13:58:08.07

スマン数秒なのは生成や
ファインチューンは設定詰めてないがわいの環境と入力テキストやと4～5時間程度や
でもCPUと比べて70倍か
GoogleColaboに千円払ったけど要らんかったな

2023/03/17(金) 13:58:33.94

ストーリー学ばせたら出会いからエロに至るまで最高のエロ描いてくれへんのかな
人間には思いつかなかったエロいシチュとか

2023/03/17(金) 14:15:41.61

>>114
早とちりすまんな😌
30MB分やっけ？やと日本語1文字3バイトとしてもだいたい900万文字近くを4～5時間でローカルでもファインチューニング出来ると考えたらかなり現実的やと思う

2023/03/17(金) 14:17:24.12

>>115
高品質なエロ文章をたくさん読ませれば人間の常識じゃ思いつかなかったような組み合わせのシチュとかもワンチャンあると思うで

2023/03/17(金) 14:53:27.49

ふと思ったけどNovelAI部ならこっちが本流では…？
Genji-jpとか

2023/03/17(金) 18:23:27.32

せやなNAI関連も元は自然言語処理から派出したものなんやろなとワイも思うで
Genji-jpもhugging faceにあるみたいやしファインチューニングでワンチャンありそうやね

2023/03/17(金) 18:26:00.69

chatgptでc#のlistviewに抽出したあとのファイル操作のヒント貰いに言ったら全部書かれてしまってネタバレ食らった気分になったゾ🥺

2023/03/17(金) 18:50:08.08

genji-jp 12GB超えや……
FlexGenってOPT以外でも使えるんかな

2023/03/17(金) 19:56:16.95

>>121
やり方あるかもしれんけど試した限りアカン

2023/03/17(金) 20:03:35.40

genjiもFloat16だったのでparams.jsonとファイル名を書き換えてllama.cpp同梱のquantize.shに通したら怒られた🥺
https://i.imgur.com/ar8w8IX.jpg
https://i.imgur.com/6uEQq7c.jpg

諦めて正攻法でそのまま行ったらout of memory😭
https://i.imgur.com/84owNUt.png

2023/03/17(金) 20:04:13.34

>>122
情報サンガツ！
やっぱりそう上手くはいかないんやね……

2023/03/17(金) 20:45:40.08

macでllama.cppやalpaca.cppが動くようになって、
最近AIに興味を持ち始めたんだけど、小説を書かせようとしたら、
数行ですぐ文章が切れてしまうんだが、実行時に何か引数が必要？

あとエロい文章を学習させようと思ったら、
やっぱりゲーミングPCやらCUDAが必要なん？
alpaca-lore ってのを使えばできるんかと思って入れてみたら、
GPUが無いのかうまく動かんかった。

2023/03/17(金) 20:52:46.75

>>125
llama.cppは-tがスレッド数で-nがトークン数かなんかやと思う
とりあえず-n を512にしたらかなり長く出力してくれるようになったで

2023/03/17(金) 21:00:10.29

LLaMAみたいにGPUつかわなくてCPUでtorchやtransformersを動かす方法もあるけど、エロ文書を学習させるならやっぱりcudaを使うのが現実的やと思うで

それかgoogle colaboratoryもええらしいけどワイはクラウドサービス全般苦手民やからなんとも言えんのや
すまんな

**125** (ﾜｯﾁｮｲ faf7-QYTW) · 2023/03/17(金) 21:16:30.36

サンガツ。

-n 1024 以上にしてみたけど、数行行数が増えた文章が出る率が上がったよ。
でも、時々同じ文章行を繰り返し出力しはじめて止まらなくなって発狂してしまうな。

GPUは、やっぱり要るか。。。
使えそうなの一式揃えるとMacの中盛りと同じくらいの値段になるし、金かかるもんだな。

2023/03/17(金) 22:33:07.15

このスレ的にはRTXA6000買った方が良いんやろか？
それともRTX4090で充分なんか

2023/03/17(金) 23:07:14.45

>>128
ワイもまだ勉強中やから合っとるか自信ないけど
4bit量子化でFP16 = ±65504 を 4bit = 2^4 = 16まで圧縮しとるみたいやからかなり精度が落ちてしまう感じやで

2023/03/17(金) 23:13:24.63

>>129
余裕があるならA6000とか6000adaとかh100とか買ってしまえばしばらくリソースには困らんと思うで

ワイは4090買うのが関の山やから足りなくなったらebayとかでデータセンタ落ちのtesla M10 32GBとかtesla P40 24GBとかを2～3万円でしこしこ買い集めて自宅ラックサーバ民になるつもりや

2023/03/17(金) 23:15:59.80

たぶんEC2とか使うの慣れた方がいい

2023/03/17(金) 23:23:35.57

>>132
せやな……
電気代上がり続けるやろしこのまま突き進んだら遠くない未来に破滅する気はしとるからせめてファインチューニングだけはクラウド上使えるように勉強してみるで

2023/03/17(金) 23:39:30.34

>>131,132
助言ニキ達サンガツやで。希少な先人の情報には頭が上がんわ
「stable diffusionだけならむしろ4090の方がA6000より2倍程早い」とか「4-bit LLaMA-65B使いたいならRAM40GB必須」って聞いて迷ってたんや
もうちょい考えてみる事にするで

2023/03/17(金) 23:42:33.77

書き間違えてもうたがRAMじゃなくてVRAMやったわ

2023/03/17(金) 23:48:05.73

RTX A6000 adaがVRAM 48GBの4090だっけか
まあ120万円だけど

2023/03/18(土) 00:34:25.90

>>134
llama.cppならCPUで実行しとるからRAMで合っとるで
65BやとたしかにRAM40GB以上は食われるから64GB積んどいたほうがええと思うで

https://i.imgur.com/2agJAOp.png
https://i.imgur.com/Wy37wWx.png

2023/03/18(土) 01:01:03.04

>>137
はぇ～情報サンガツや
https://rentry.org/llama-tard-v2
の4-bit Model Requirementsの所にLLaMA-65BのMinimum Total VRAM 40GBってあるけどこれは何かちゃうんか？
これからマシン買って0から学ぼうというくらいワイは無知やからアホな質問やったらすまんな

2023/03/18(土) 01:07:46.94

>>138
おそらくllama.cppを有志がcudaに対応させたものやと思うで

2023/03/18(土) 01:10:59.58

ちなみに未圧縮のfp16やと30BモデルでもRAM64GB全部食い散らかされたで
余計なバックグラウンド全部切ってデスクトップも切ってSSH接続すればワンチャンあるかもしれんけど試すの怖いンゴねぇ
https://i.imgur.com/KoMGNKo.png

2023/03/18(土) 01:24:16.52

>>139
おおっ、っちゅう事はどちらか好きな方式選んでええわけやな
勉強になったやで

2023/03/18(土) 01:29:19.50

>>141
イグザクトリーや😎
VRAM40GB用意するのとRAM64GB積むのとで考えたら現状ではまだRAMのほうが現実的やからワイはllama.cppをおすすめするで

2023/03/18(土) 04:18:41.04

>>106
ええやん
これGPT2(りんな)のファイチューンってことで合ってる?

2023/03/18(土) 05:56:29.76

先月FlexgenでRAM200GBあれば動くとか革命や！って言ってたのに凄い話や

2023/03/18(土) 08:45:28.74

オープンソースになると本当に最適化とか拡張とか早いよな
大企業に所属してない天才隠れすぎやろ

2023/03/18(土) 14:56:53.25

整形した5万行100万文字のエロゲをりんなちゃんに読ませてくる
https://i.imgur.com/cyA3h9x.png

2023/03/18(土) 15:00:39.81

GPT4のAPI申請通った奴おる？
これ早くに手にした奴がとんでもない利益あげそうだよな

2023/03/18(土) 15:46:38.02

Playストアは既にChatGPTアプリで溢れてるけど…

2023/03/18(土) 16:58:17.56

ラズパイで動く大規模言語モデルがGitHubで公開　性能は“GPT-3相当”、Metaの「LLaMA」派生

https://www.itmedia.co.jp/news/spv/2303/18/news059.html

もはやよく分からんな‥

2023/03/18(土) 17:02:31.44

1トークン10秒は動くと言っていいのかレベル。でもメモリサイズ要らないなら普通のpcで動かせば早いのか？

2023/03/18(土) 17:07:59.87

GPT3相当っていう売り文句があかんわ
みんなそれ聞いて何を想像するかわかったうえでの詐欺よなｗ

2023/03/18(土) 17:21:11.63

重い処理はクラウドに逃す方向に進むんじゃないの
本質はローカルで動く事より個別に自由にチューニング出来る事にあるだろうし

2023/03/18(土) 17:23:44.75

mediumモデルでout of memoryになったからsmallモデルにしたけど駄目駄目やったわ
エポックとバッチ数ふやさなあかんかったのか、学習元のテキスト少なかったのか、[SEP] [CLS]を書き加えなあかんかったのか、タグ付けせなあかんかったのかもう頭の中ぐるぐるや
https://i.imgur.com/6AAuVXR.png
https://i.imgur.com/8S1quiZ.png

2023/03/18(土) 17:42:02.78

>>152
クラウドで手軽に調教できてopen aiのapiみたいな従量課金制ボッタクリとかやないならもうローカルに拘ってout of memoryに怯えなくて済みそうやしその方向に進んでくれたら有り難いンゴね

2023/03/18(土) 18:12:53.41

クラウドはええがbingAIみたいな検閲というか操作みたいなのが嫌ンゴねぇ…

2023/03/18(土) 18:43:50.80

今日のパイオツくん
https://tadaup.jp/loda/0318182649544285.jpg
https://tadaup.jp/loda/0318182656814827.jpg
自分の発言を批判されたら人格否定だとすり替えて怒る
ここまでお手本のような弗で感動してる

勘違い非常に恐縮ですが
パイオツくんの人格なんか否定しなくても
・著作権法をまったく知らないこと
・事実に基づかない妄想の著作権法で絵師を侮辱していること
今日の発言だけでも余りあるんでよろしくな

2023/03/18(土) 18:44:10.38

誤爆してもうた
すまん

2023/03/18(土) 21:47:24.83

Alpacaのデータセットを翻訳するだけで結構まともに動くらしい
https://huggingface.co/22h/cabrita-lora-v0-1
まあポルトガル語は元々LLaMaがサポートしてたらしいが

2023/03/18(土) 22:52:55.26

コラボ用のやつがあるっていうからワンちゃん日本語行けるかと見てみたら404…
まぁトークナイザー的なあれで日本語きつい気がするけど

2023/03/18(土) 23:35:57.84

ほぇ～面白そうやな
8ドル払ってchatgptで翻訳したって書いてあって草生えたンゴね

2023/03/19(日) 12:40:42.22

Bingは桁が大きくなっただけで単純極まる計算でもミスしまくるんだな
つってもたかだか兆、京、垓なんだけど
プログラミングすら対応してくるとか聞いてシンプルな計算の組み合わせなら信頼できるだろうと思っていたがそうでもないようだ
5000億×50を2.5兆とかやめてくれよ

2023/03/19(日) 12:47:54.95

まぁ文章見てるだけで多分計算してないし
計算の方法を教えて→その方法で計算して
で精度は上がるらしいけどちゃんと計算させたかったらLangchainのagentみたいな仕組みがいるんちゃうかな

2023/03/19(日) 12:53:25.86

これから専用AIが複数産まれるし、それにタスクを振り分けるようになっていくだろうから、今年の後半は全てのジャンルで完璧になるだろうな

2023/03/19(日) 16:33:06.05

ローカルは分からんけど、Bingや3.5だったgptの頃は回答が途中で取り消されてもその内容は把握してるから、続きを普通に書いてくれたり前回の内容をコピーして出力と言えばたまに全部出してきたりする
連続で取り消しされまくっても内容自体は全部残ってるわけで、トピックの切り上げがされない限りその内容を推定して質問をしたらそれっぽいやり取りになるの楽しい

2023/03/19(日) 19:00:42.59

ワンクリでアルパカインストール出来るって言ってるけどほんまか？

https://cocktailpeanut.github.io/dalai/#/

2023/03/19(日) 21:20:26.34

>>165
dalaiなら要求パッケージのインストールとモデルのダウンロードからlama.cppで4bit量子化までを自動やってくれるかほぼワンクリやね

ただdalaiやと文章生成だけやった気がするからインタラクティブモードでchatgpt風に使いたいならllama.cppを直接使ったほうがええで

2023/03/19(日) 22:29:23.37

雑になろうのスクレイピングスクリプト書いたら一生終わらなくて草
こんなにやたらいっぱい集めて学習に耐えれるんかいな…

2023/03/20(月) 07:22:56.40

初心者やけど、llama.cpp や alpaca.cpp ってどうやってエチエチな文章を学習させるん？
alpaca-lora とか、llama-adapter とかいうの使えば、ワシのMacでもできるんか？

2023/03/20(月) 09:14:19.00

>>168
まだ試しとらんけどdalaiかtorrentかでLLaMAの7Bモデルを落として4bit量子化する前のFloat16モデルを>>65みたいにTransformersのrun_clm.pyに通せばワンチャンあると思うで

ただ問題点は日本語化とリソースの課題やね
・LLaMAは日本語が苦手
・Alpacaの翻訳FineTuningにA100 x 1台（>>158）
・LLaMA→AlpacaのFineTuningにA100 vram80GB x 8台（>>72）

2023/03/20(月) 09:38:53.52

直接7BイジれなくてもAlpacaLoRAならいけそうやね

Alpaca-loraを日本語タスクでファインチューニングする
https://megalodon.jp/2023-0320-0935-46/https://qiita.com:443/toshi_456/items/280efc31950ddb083286

2023/03/20(月) 09:54:15.79

Alpacaに日本語で色々やってるっぽい？人もいるな
https://twitter.com/manjiroukeigo/status/1636947131989921792
https://twitter.com/5chan_nel (5ch newer account)

2023/03/20(月) 09:59:56.20

>>171
日本語データセットの試みはとても有り難いンゴね
ワイも参加してくるで

2023/03/20(月) 10:02:46.70

>>169, 170

ほー。これまでの方法で学習させるにはそれなりにマシンパワーが必要なんね。
alapaca-loraでファインチューニングってのが「学習」って理解でええんやね。

でも、これって用意された入力を「学習」して、解答として出力してるだけで、
昔の人工無能と多少受け答えが柔軟になっただけでどう違うんや？
何かもっと創造的なものをイメージしてたんやが、
エロ小説を設定与えるだけで書いてくれんのか？

2023/03/20(月) 10:13:37.43

>>173
　残念ながら、材料がない0の状態から1を生み出すことは人間にも現状のAIにも出来ないのや。

　自然言語処理は入力文を「重みネットワーク」に通すことでに統計学的推論（ある単語の次になんの単語が来る確率が高いか）を予測して、一番適切な文章を出力してるんやで
　その組み合わせパターンがいわゆるパラメータなんや。

　今までの人工知能との違いは、そのパラメータ数をバチクソに増やすことで人間と同じように適切な言葉を繋げることができるとわかったことやと思うで

2023/03/20(月) 10:34:51.60

Bloomに日本語がないのが辛いわ
ほんまワイは悔しいわ

2023/03/20(月) 12:03:50.85

>>173
人工無能は決められた単語に決められた単語を返すルールを人間が作ってたけど
今は大量の会話データからルールを学習してるだけで本質的には何も変わってない

本質的に何も変わってないのに会話データが大量になると
自然な会話が出来るようになるってのが最近の発見

2023/03/20(月) 12:27:39.67

さっきの日本語データセットを取り込んだguanacoなるものがあるらしい

2023/03/20(月) 13:14:05.31

中国語の部屋もチューリングテストもAIの性能を計るんじゃなくて
人間の認識の限界を計るテストやった話だったみたいになっとるんやなぁ

2023/03/22(水) 10:39:18.16

GoogleのBardきたな
なおおま国イギリス・アメリカかららしい

2023/03/22(水) 10:41:07.65

あとAlpacaの日本語やってる人の結果なかなか凄い
https://twitter.com/kun1em0n/status/1638317531365785601
https://twitter.com/5chan_nel (5ch newer account)

2023/03/22(水) 17:15:50.81

日本語ラップの歴代再生回数ランキングです
https://youtube.com/playlist?list=PLZyK9FdorvcCe-sAMYiYuKIGeUNBoaMj8

2023/03/23(木) 11:06:19.26

そういやGPT4chanってのがあるねん
4chanから学んだやつが2ちゃんから学んだら何ができるんかな

2023/03/23(木) 15:12:53.69

>>182
架空のスレをまとめたアフィブログとかいう地獄を作れる

2023/03/23(木) 15:34:51.45

これもうプロンプトアタックでエロ吐出させたほうが早いんやない？
ローカルでエロ小説なんて処理能力足りんやろ

2023/03/24(金) 09:59:01.62

chatGPTにプラグインなるものが追加されたらしい
LangChainのAgent的なやつみたいな感じ？
あとChatRWKVなるものが新しく出たらしい
速くて軽くて日本語が通じるらしい

2023/03/24(金) 10:01:17.77

いや新しく出たわけじゃないんか
なんか話題になっとる

2023/03/24(金) 16:24:15.62

>>183
ほんとにワケワカラン世界やな

2023/03/24(金) 17:12:26.88

https://i.imgur.com/8SHwUzQ.png
いかなる時も手は洗わなければいけないらしい

2023/03/24(金) 20:18:50.89

Llamaの7B落として、WSL2インストールしてUbuntuインストールしてMinicondaインストールしてパイトーチインストールしてText gen WebUIインストールして……python server.py --model llama-7b-hf --load-in-8bit!!
→cudaエラーで草も生えん
bitsandbytes/libbitsandbytes_cpu.so: undefined symbol: cget_col_row_stats · Issue #156 · TimDettmers/bitsandbytes - https://github.com/TimDettmers/bitsandbytes/issues/156
undefined symbol: cget_col_row_stats / 8-bit not working / libsbitsandbytes_cpu.so not found · Issue #400 · oobabooga/text-generation-webui - https://github.com/oobabooga/text-generation-webui/issues/400

2023/03/26(日) 14:45:28.57

Bingたんにファンタジーもので有翼人の話書かせたら軍用機出てきて主人公にミサイルぶっ放してきて草
問い詰めたらファンタジーのつもりだったとサラッと言ってきてもうなんと言ってよいのやら

2023/03/26(日) 14:49:52.40

GPT3.5に卑猥な文書かせるの想像以上に楽しかった
ローカルで制限なしになったらマジでぶっ飛びやろなぁ

2023/03/26(日) 15:08:24.09

RWKVでエロやれるのか誰か試してよ

2023/03/26(日) 15:41:56.60

https://github.com/BlinkDL/RWKV-LM
RWKVっていう新しい？言語モデルGitでトレンドになっとったな
すでにwebuiらしきものもあがっとる

2023/03/26(日) 18:36:33.60

https://github.com/hizkifw/WebChatRWKVstic
これか、webui
だれぞ試してみて

2023/03/26(日) 18:48:05.53

自分で試した
ポンコツやんけ
https://i.imgur.com/BB6XJjX.png

2023/03/26(日) 18:49:54.30

ジャップ語で聞いてどうすんの

2023/03/26(日) 18:55:56.18

WebChatRWKVstic試したけどCudaメモリエラーやらなんやらで一生うごかんわ。たぶん動くと思うぜリリースやめろや　まぁWIPだから仕方ないけど

2023/03/26(日) 18:59:57.82

>>196
だって日本語通るって聞いたんだもん。。。

2023/03/26(日) 19:01:28.84

ワイも一昨日頃試したけどあんま情報ないしout of memoryとか言われるし辛い

2023/03/26(日) 22:01:24.09

>>195
化けては無いから日本語で問いかけて英語で回答させると何故か会話が成立するパターンじゃない?