なんJLLM部 ★4

2023/09/30(土) 08:32:45.60

!extend::vvvvv:1000:512
!extend::vvvvv:1000:512
AIに色々なことをしゃべってもらうんやで
英語ならそこそこのデスクトップPC（できれば＋3060 12GB以上）でもなんぼか楽しめるで
日本語は、どう転んでもローカルで動かせる今の世代はオバカなので
そこは期待しすぎんといてな

自薦・他薦のモデルやツールは>>2以降

なんJLLM部 ★3
https://fate.5ch.net/test/read.cgi/liveuranus/1691639766/

VIPQ2_EXTDAT: default:vvvvv:1000:512:: EXT was configured

2023/09/30(土) 08:34:07.36

りんな系
日本語で学習されてて3060でも設定次第で動く、オバカではあるけど現時点でも
そこそこ楽しめるクオリティはある
https://huggingface.co/rinna/bilingual-gpt-neox-4b-instruction-sft
https://huggingface.co/rinna/bilingual-gpt-neox-4b-instruction-ppo

https://huggingface.co/rinna/japanese-gpt-neox-3.6b-instruction-sft-v2
https://huggingface.co/rinna/japanese-gpt-neox-3.6b-instruction-ppo

こっちは前の世代のりんな　前スレの最初のほうでLoRA学習成功したニキがいたっぽい
https://huggingface.co/rinna/japanese-gpt2-medium
https://huggingface.co/rinna/japanese-gpt2-small

2023/09/30(土) 08:34:30.62

OpenCALM系

サイバーエージェントがやってるってことでいじった報告や
動かした報告がネットに多い気がする
https://huggingface.co/cyberagent/open-calm-7b
https://huggingface.co/cyberagent/open-calm-3b

8bit版？
https://huggingface.co/kyo-takano/open-calm-7b-8bit

2023/09/30(土) 08:34:54.76

WebUI

前はスレのニキがりんな動かすツール公開してくれとったけど、消えてしまったから
日本語モデルを手軽に動かすには必須やろな
https://github.com/oobabooga/text-generation-webui

2023/09/30(土) 08:35:22.20

りんなはそのままでは >>4 のツールで動かないのでここを参考に
修正が必要や　ただし3.6b版の情報やしWebUI自体のコードも
変わっているから修正する行番号が違ってくる
https://note.com/npaka/n/n5d25ea4227df

2023/09/30(土) 08:35:54.54

Pythonがわかる奴ならこれ参考にちゃんとインデント（スペース）修正してくれ model.pyはこんな感じの修正になるな
if any(s in model_name.lower() for s in ['gpt-4chan', 'gpt4chan']) and Path(f"{shared.args.model_dir}/gpt-j-6B/").exists():
tokenizer = AutoTokenizer.from_pretrained(Path(f"{shared.args.model_dir}/gpt-j-6B/"))
elif model_name.startswith("bilingual-gpt-neox-4b"):
path_to_model = Path(f"{shared.args.model_dir}/{model_name}/")
if path_to_model.exists():
tokenizer = AutoTokenizer.from_pretrained(path_to_model,trust_remote_code=shared.args.trust_remote_code, use_fast=False)

text_generation.pyは247行目あたりをこうかな
# Encode the input
add_special_tokens = not shared.model_name.startswith("bilingual-gpt-neox-4b-")
input_ids = encode(question, add_bos_token=state['add_bos_token'], truncation_length=get_max_prompt_length(state), add_special_tokens=add_special_tokens)

2023/09/30(土) 08:39:45.85

PLaMo-13Bっていう日本語と英語のモデルが出たらしい

https://www.preferred.jp/ja/news/pr20230928/

2023/09/30(土) 08:40:06.79

今日初めて落として動かしてたんだけど会話が進むにつれてだんだんこっちの言うこと無視して同じようなこと繰り返すようになる
これって解決策ある？いちいち新規チャット作り直すはめになら

2023/09/30(土) 08:42:39.52

774 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ﾜｯﾁｮｲ a77b-erq7) 2023/09/15(金) 21:55:37.35 ID:AtNIacDL0
Redditで「22 個のコアを備えた古い Xeon E5-2696 v4 @ 2.2 GHz (オーバークロックなし) マシンは、12 個のコアを備えた私の AMD Ryzen 9 3900XT @ 4.2 GHz マシンより約 20% 高速です」とかを見たので、お値段を追求したAIマシン組むのもおもしろそうではある
( https://www.reddit.com/r/LocalLLaMA/comments/1441sw4/for_running_ggml_models_should_i_get_a_bunch_of/ )

最大メモリー帯域幅
Xeon E5-2699 v4｜76.8 GB/s
Core i9-13900K｜67.21GB/s
AMD Ryzen 9 3900XT｜ 51.2 GB/s

VRAM24GB持ちのTesla P40とかK80とかすごい安いけど、こいつらマザボにぶっ刺せば普通に推論に使えんのか?エンタープライズ製品まわりなんも知らんわ

2023/09/30(土) 08:47:07.85

とりあえず保守しとくで

2023/09/30(土) 08:47:36.28

>>8
730 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ﾜｯﾁｮｲ 2388-6jLp) sage 2023/09/13(水) 21:06:02.39 ID:tYlx/HDf0
>>726
koboldでキャラ等設定がが決まっているならだけど

うちだとstory mode（newstory）で、「w info(world info)」ボタンを押して、
出た画面の左側のキーにキャラクター名や地名を指定して、右側の方にその設定をかいて、
右端の画鋲マーク（Toggle constant key mode）を有効にして使っているなぁ
あとは、MemoryボタンのAuthor's noteに、必ずやってほしいこと（文体や時代背景）を書いて遊んでる。
正しい使い方では無いかもしれないけど、これで今のところはそれなりは動いている…のかな？
サンプルだと、英語にはなるけど、aetherroom.club のものを持ってきて最初は参考にしたよ

2023/09/30(土) 08:48:53.03

サンイチほしゅ

2023/09/30(土) 08:49:20.57

431 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ﾜｯﾁｮｲ 357b-6/dI) sage 2023/08/31(木) 06:29:50.96 ID:akAJDUqD0
https://huggingface.co/TheBloke/Kimiko-v2-13B-GGML
英語モデルで13BだけどKimikoってのがNSFW特化でファインチューンしてるらしいで

オリジナルの説明
https://huggingface.co/nRuaif/Kimiko-v2-13B

2023/09/30(土) 08:49:40.35

ほ

2023/09/30(土) 08:50:04.11

Jannie-70Bちゅうのがあったけど思わずホモ専用モデルか？と思ったわ
すまん不謹慎やった

2023/09/30(土) 08:50:25.63

即死判定20なのか、いちおつ
難しいことはなんも分からんがローカルPCでエロチャしてるだけでも楽しい

2023/09/30(土) 08:50:58.04

335 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ｵｯﾍﾟｹ Sred-SKKe) sage 2023/08/28(月) 11:54:25.28 ID:QeVg2WCMr
redditで貼られてたnsfwモデルランキングだけど、こっちでは既出かな？

Another LLM Roleplay Rankings
https://rentry.co/ALLMRR
Ayumi's LLM Role Play & ERP Ranking
https://rentry.org/ayumi_erp_rating

2023/09/30(土) 08:52:00.69

もうちょい

2023/09/30(土) 08:52:21.67

240 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ｽｯｯﾌﾟ Sdb3-h7Ri) sage 2023/08/25(金) 08:38:10.92 ID:SHOr4q5xd
Koboldの設定や使い方は英語だけどここが詳しい
https://github.com/LostRuins/koboldcpp/wiki

244 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ﾜｯﾁｮｲ 2b28-hPrW) sage 2023/08/25(金) 14:04:44.78 ID:dRdVVD+u0
https://w.atwiki.jp/localmlhub/pages/21.html
有志がまとめてくれてるけど恐らく「期待すんな」が
正しいと思うで

2023/09/30(土) 08:53:25.85

切り抜きテンプレほんま助かる

2023/09/30(土) 08:55:22.45

サンイッチやで～

2023/09/30(土) 09:12:13.89

更新の速い世界だからお勧めモデルも逐次変わっていくけど取りあえず前スレ後半で話題になってたモデルたち(たぶんまだある)
総合力高い系：
Xwin-LM-70B
upstage-Llama2-70B (=poeのSOLOR)
あとは古典だがwizardLMとかairoboros系もまだまだいける
エロ特化系：
spicyboros
Kimiko
Mythomax

2023/09/30(土) 10:08:48.83

本田望結、セーラー服の高校生姿を披露　アドリブ演技に芸人たちあ然
https://ghyutr.mickreid.com/miyu_honda_official/mfvv4v.html

2023/09/30(土) 10:48:23.97

前スレでGGUFでVRAM使えるのは分かったけど、CUDAがあまり使われず、CPUへの負担が多いのはそういうものですか
それとも設定が悪いのでしょうか

GGUFではまだ遅いと感じるので次にCPUと強化するかGPUを強化するか悩む

2023/09/30(土) 11:44:16.42

>>24
CuBLASにしてGPU layersの数字を大きくしてVRAM容量の75%ぐらい使用するようにしてみたら

2023/09/30(土) 12:12:39.94

ファインチューニングの良いお勉強資料あるやろか？
会話データセットたっぷり用意して自分好みの受け答えができるように調教したいやで

2023/09/30(土) 12:54:26.02

>>26
自分も調べてけど
こういうページとか
https://blog.brainpad.co.jp/entry/2023/06/26/153015

2023/09/30(土) 14:23:05.30

ここ1、2ヶ月で>>2>>3のテンプレより高性能な日本語モデルが出てきてるので追加しとく

★Japanese StableLM Alpha 7B
Stable Diffusionで知られるStabilityAIが開発した日本語LLM
現時点でのオープンソースLLMの中では日本語性能は最高レベル。ベースモデルのbaseと指示→応答型のinstructionの二種類がある

★Weblab-10B
東大松尾研究室が開発した日本語・英語のLLM。こちらもベースモデルとinstructionの二種類がある
★PLaMo-13B
Preferred Networksが最近公開した日本語・英語対応のモデル。パラメータ数は最も多いが日本語の学習データは少なめ
★AIBunCho/japanese-novel-gpt-j-6b
小説生成AIサービスのAIBunchoが公開した小説特化のLLM。扱いやすいので初心者におすすめ

2023/09/30(土) 15:11:29.34

東大松尾研はELYZAもあるな

2023/09/30(土) 15:35:11.43

結局どれだけの質と量の学習をさせれるかって話だよな
日本語理解できても卑語全然ダメってのばっかり

2023/09/30(土) 15:35:51.47

ちんぽのことをメンバーって言うモデルには逆に笑ったけどｗ

2023/09/30(土) 15:39:55.91

前スレで紹介してくれたmlewd20Bいい感じだな

女の子に呼びかける時ほとんどのモデルは"my sweetheart"を使うけど
こいつは"my little flower"て言っててへーってなった

2023/09/30(土) 18:09:27.86

最近LLM色々出てるしもしかして自分の環境でもなんか試せるかなと思って来てみた
自分の環境が3060の12GB+メモリ16GBとかなんだけど日本語のエロ小説書いたりとかはまだ厳しい感じ？

2023/09/30(土) 18:15:37.83

メモリが足りてないですね……

2023/09/30(土) 18:25:07.17

そのスペックなら13BってモデルならGPUでも動かせるけど英語ならともかく日本語は厳しいね
メモリを64GBまで増強すれば70BモデルをCPUで動かせるけど遅い

2023/09/30(土) 18:39:40.70

日本語は厳しいってのは>>1にもあるようにオバカってことなんかな？
とりあえず全体的にまだ厳しいってのはなんとなくわかった

2023/09/30(土) 19:12:46.79

>>33
自分が同じ3060だけど
TheBloke_Xwin-LM-13B-V0.1-GPTQ
pfnet_plamo-13b
あたりだと多少のエロ文章（あんま長くないやつ）やエロチャットくらいならなんとかなるけど
ChatGPTを脱獄したときのような文章を期待するとまだまだダメと感じると思う
これでもalpaca-7bあたりと比較するとめっちゃ進化してると思うけど

2023/09/30(土) 19:42:45.26

>>33
>>28に書いたAIBunCho/japanese-novel-gpt-j-6bってやつ使えば書けるよ
load-in-8bitつければ3060でも読み込める

2023/09/30(土) 23:04:41.39

レスを参考にひとまずAIBunCho/japanese-novel-gpt-j-6bの方を入れてみて一応動くのを確認した
しばらくこれで試してみてその後>>37の方も見てみることにするよ

2023/10/01(日) 00:35:06.50

Quantizedされた英語のモデルの13Bを3070で動かしてるけど会話途中でこっちのいうこと無視して同じようなことばっか言い始めるようになるんだよなあ
これ一回で送れるトークン数とかと関係してるのかな

2023/10/01(日) 02:43:28.22

前スレで教えてくれたpaperspaceの定額プラン、どのGPUが定額に含まれるのかはここがわかりやすかった
https://qiita.com/kunishou/items/dccb44848e5b572619bc

A100-80Gも混んでなければ使えるらしいけど、LLMに使えるGPUなのか不明

> paperspaceのGrowthプランはVRAM45GBのGPUが月39ドルで使えるみたい。ただし一回6時間上限。ストレージは50GB無料で、1GB超過ごとに月0.29ドル請求。

2023/10/01(日) 05:12:01.46

A100-80Gで70B動かしとるで
Xwinの70Bでも日本語はまだキツい

2023/10/01(日) 09:57:12.94

なんと羨ましい環境だ
Xwin 70Bのどこらへんにキツさを感じてる？

2023/10/01(日) 10:05:34.65

というかxwinの真骨頂は英語の表現力だぞ
日本語なら他のモデルの方がいいのある

2023/10/01(日) 10:12:53.51

その日本語とエロに強いの教えてください

2023/10/01(日) 10:34:04.22

すまん出先なんで帰ってから書き込むわ
色々ありすぎて検証データ見んと分からんw

2023/10/01(日) 12:00:57.12

xwinはわりとmemberの表現使うから、妙な日本語になりそう

2023/10/01(日) 13:11:15.03

XWin70Bを個人でまともな速度で使うならつよつよMacか>>41ってことになるやろねえ

2023/10/01(日) 14:11:52.06

70Bも4bit量子化モデルなら3090x2で10t/sくらいで動くぞ

2023/10/01(日) 15:02:10.07

現時点で日本語のエロに強いと言えるモデルは「無い」というのがワイの結論

2023/10/01(日) 15:22:08.33

GPTで……シコれ
のべりすとでもいいぞ
エロ目的ならそれ相応に準備してエロユーザーでモデル構築するしか満足する方法ないんじゃねーかな

2023/10/01(日) 15:35:06.04

0.3T/s程度だけど、片手間にやっているから、遅いけどまぁやれてる

むしろ、あまり早く出力されると、クソザコ英語力で脳がフローするｗ

**046** (ﾜｯﾁｮｲ ab00-UA51) · 2023/10/01(日) 17:54:33.89

とりあえず日本語レビューしとく。
Airoboros-L2-70b-2.2　繰り返し少なく、安定度高い。定番。
openbuddy-llama2-70b-v10.1　一応日本語対応のタグはついてる。関西弁うまいｗ
stablebeluga2-70b　規制強めだが、あなどれん出来。
Spicyboros-70B-2.2　少し不安定だが、指示すると一番下品なセリフを吐いてくれる。完全無修正。
。
ただし、現状では実用段階にはまだ遠いと言っておくね。

**046** (ﾜｯﾁｮｲ ab00-UA51) · 2023/10/01(日) 17:54:43.21

とりあえず日本語レビューしとく。
Airoboros-L2-70b-2.2　繰り返し少なく、安定度高い。定番。
openbuddy-llama2-70b-v10.1　一応日本語対応のタグはついてる。関西弁うまいｗ
stablebeluga2-70b　規制強めだが、あなどれん出来。
Spicyboros-70B-2.2　少し不安定だが、指示すると一番下品なセリフを吐いてくれる。完全無修正。
。
ただし、現状では実用段階にはまだ遠いと言っておくね。

2023/10/01(日) 17:56:59.10

なぜか2重カキコになった。スマソ

2023/10/01(日) 20:56:14.09

情報あざす試してみます

2023/10/02(月) 22:06:43.80

吐息混じりに話すキャラの学習難しいな。ノイズだらけになったわ……。

2023/10/02(月) 22:08:22.89

スマン、誤爆した……。

2023/10/02(月) 22:08:32.42

スマン、誤爆した……。

2023/10/02(月) 22:11:53.38

今日一日ずっとLLM触っててようやくスレでの話が少し理解できるようになってきた
これで俺も赤ちゃんから小学校に入学かな

2023/10/03(火) 00:12:34.20

Colabで70BのGPTQモデル動かせるって聞いて予行演習として無料枠で13BのGPTQで試してみた
ローカルより多少重いけど普通に動かせるな

2023/10/03(火) 11:26:13.05

https://twitter.com/rinna_research/status/1709027815314903099
こういうのは日本企業ならではの研究やね
https://twitter.com/thejimwatkins

2023/10/03(火) 12:00:46.61

自然な喘ぎ声を生成する手法MATS (Moaning Agents Text-to-Speech) も開発していただきたい

2023/10/03(火) 14:34:00.50

Turingの画像にプロンプト与えて答えてもらうやつ試してみたけど、ちゃんとした言葉すら返してくれない
なんか実装をミスってるだろうがソース辿ってドキュメント見ても意味不明
ギブアップだわ
これで遊べたら楽しそうなのになぁ

2023/10/03(火) 15:48:28.23

GITだとだめだったけど何故かBLIPでうまくいった
間違ったり見当違いな事も言うけどいろんなことに使えそうだ

2023/10/04(水) 00:47:35.91

>>41
大幅値上げするみたい。

2023/10/04(水) 06:23:46.91

Kobold本体がアップデートしてた
コンテキストサイズが32kまで拡大したのが個人的に嬉しい(ggufモデルに限るが)

2023/10/04(水) 06:28:04.22

大規模言語モデルで「無限の入力」を受け付けることを可能にする手法「StreamingLLM」が開発される - GIGAZINE
https://gigazine.net/news/20231004-streaming-llm/

2023/10/04(水) 08:05:38.28

数スレ前にモデルが消えたことが話題になってたdeepnightは結局upstage/Llama-2-70b-instruct-v2を丸コピしてラベルを貼り替えたものだったことがバレて作者が削除したということらしい

2023/10/04(水) 09:16:01.14

5chへの攻撃がいよいよ本格化し始めたみたいだけど
避難所・情報集積はWikiで頑張ることになるんかな

2023/10/04(水) 10:18:34.37

あるいはDiscordかねぇ

2023/10/04(水) 10:33:40.29

ぶろーくニキんとこに頼んで日本語部屋作ってもらうとか？

2023/10/04(水) 12:52:09.15

いっそピンクにw

2023/10/04(水) 13:34:18.54

>>66
大幅って程でもない

gradientを使ってるユーザーにとっての要点は2つ

①growthの場合で月39ドルだったのが1時間0.058ドルになるから24時間28日で月に672時間使うも同じ39ドルになる(proの場合も同じ。要は月に672時間以上起動してるユーザーにとっては値上げだしそれに届かなければ逆に値下げ)

②永続ストレージの利用料金が締め日の時だけ計算されてたのが毎日計算されるようになる。普段オーバーしまくって月末だけ消すような悪い子ムーブが出来なくなる。

2023/10/04(水) 14:31:32.71

XWINは一度使ってみたい
手軽さ＋無料ってのならpoeのSolarが抜けているけど

2023/10/04(水) 14:41:55.96

necとかりんなとかしょぼいスケールで各社やるんじゃなくてまとまってでかいのやれよ😅

2023/10/04(水) 14:52:53.19

しょーがねーだろガラパゴス諸島なんだから
数学や自然科学すら家や流派で囲って秘術にして来た民族だぞ

2023/10/04(水) 16:14:03.81

キャンディ
もといイライザの70bはまだかー
次ニキに依頼するのはこれと決めている

2023/10/04(水) 16:31:11.48

モデル作るより、優秀な学習素材作れよ、

2023/10/04(水) 16:49:31.96

言い出しっぺの法則

2023/10/04(水) 18:02:30.25

kobold最新の1452にしたらログにruntime erroe吐くようになったの自分だけ？
生成は普通に出来てるようだけど

2023/10/04(水) 18:06:30.86

エロ絵？

**”管理”者** (ﾜｲｰﾜ2 FF93-iXYa) · 2023/10/04(水) 18:35:22.74

数百億学習させようがエロを学習させないとエロくならない
ま、Chat GPTはえろの学習もしてるくせに倫理フィルターかけてるわけだが

2023/10/05(木) 10:43:36.02

確か海外の4chを学習させた言語モデルは凄まじいヘイトマシンになったと聞いた

2023/10/05(木) 15:39:59.19

vilm/vulture-40b
これって量子化してもkoboldとかじゃ動かないんだっけ？
falcon40bみたいに

2023/10/05(木) 16:53:51.23

専ブラが使えないから不便だぜ

**085** (ﾜｯﾁｮｲ 8554-tfeP) · 2023/10/05(木) 20:51:54.90

ggfuなら再生できそうなんで
とりあえずニキに依頼した
falcon系で日本語対応は初かな？

2023/10/05(木) 21:17:16.30

RTX3060ｘ４なんだけど、低スペックVRAMでやるならGGUFよりGPTQの方が早くていいわ

2023/10/06(金) 08:43:30.02

外付けGPUboxのグラボで動かせないかと思ったけどthunderboltの転送速度がボトルネックになるやろか
PCIe×16に比べたらカスみたいやもんやし・・・

2023/10/06(金) 09:30:04.69

>>88
3080x2のほうがさすがにいい気がするがどうなんやろ
3080の中古なら同価格帯やろし新品でもそこまでは
変わらんやろ？

2023/10/06(金) 12:45:44.21

oobaでAWQ対応したけどGPTQとどの程度差があるのか分からんな
思ったよりVRAMきつかったからFused attention切ったけど

2023/10/06(金) 19:41:21.25

お、読み込むようになった

2023/10/06(金) 21:22:08.50

>>89
thunderbolt3接続の3060は、PCIe接続と生成速度ほぼ同じだった。

2023/10/07(土) 09:03:11.98

PCIeを拡張するPCIeボードとかはどうですか
https://www.aiuto-jp.co.jp/products/product_191.php
こういうの

2023/10/07(土) 09:17:22.78

thunderbolt3ってUSB type-Cで接続できるんでしたっけ
そっちのBOXの方がいいかな

2023/10/07(土) 11:19:54.46

PCにthunderbolt3コネクタというものがあって、それがUSBCの形をしてるだけで別物って考えた方がいい
そして殆どのPCにthunderbolt3コネクタは付いてない

2023/10/07(土) 11:29:12.67

いつの間にやらA100が180万円から320万円に値上がりしてる
流石にもう手が届かないわ

2023/10/07(土) 12:10:02.17

180マソが手が届くかもっていう時点でスゲーナスゴイデス

2023/10/07(土) 12:21:13.05

円安にコスト高とか理由はあるんだけど結局は独占市場でぼったくってるのもあるからな
大抵の場合はGPGPUで本腰入れてこなかったAMDが悪いんだけど
何年遅れやねん

2023/10/07(土) 12:25:23.59

世界中から注文殺到で納期１年待ちとかまあどんだけでもぼったくるよね
その分研究開発費に反映されるんだし悪いことではない

2023/10/07(土) 13:47:46.50

元々手の出ないモノだから惜しくもなんともない

2023/10/07(土) 16:10:37.68

もし次のRADEONが64GBぐらいVRAM積んでてgefoが24GBのままだったらどうする

2023/10/07(土) 18:32:05.61

CUDAアンドCUDA

2023/10/07(土) 21:36:38.96

ひさびさ来たけど最近はなんのllm使ってるの？
こないだopen interpreter入れたけどやっぱ13Bとかじゃあコード書くのに全然役に立たず断念した…

2023/10/08(日) 00:10:43.82

英語チャット用途だけどMistral-7B-OpenOrcaが評判ええから試してみたらかなり出来る子で驚いたわ
7Bと思って舐めてたけど13Bとの比較なら負けとらんわ

2023/10/08(日) 01:54:36.68

AMDはCPU独占してたIntelを
鯖の方ではボコボコにしてるだけでも大したもんなんや……
企業規模考えれば
CPUのIntel、GPUのNVIDIAに
AMD一社で対抗しろとか酷な話やで……

2023/10/08(日) 02:36:19.96

rtx3060でXwin-LM13b(4bit)試したら専用メモリ張り付いたけど大丈夫かな
他のお行儀のいいAIと違って余計な規制が無いからおもろいな。聞いてないけど爆弾の作り方とかもフツーに答えるのか。
中国だからもしかしてと思って天安門事件について聞いてみたけど隠蔽する様子もなかったわ。
このレベルのものがミドル以下のPCでローカルで動くってだけで感動してる。ただ小説とか書かせるのはまだ荷が重いな
このまま無規制で突っ走ってくれー
ところで70bはどれくらいのスペックあれば動くんや

2023/10/08(日) 02:47:00.94

希望としてはAIのべりすと（的なもの）をローカルで動かせるようになって欲しいんやが
創作特化のモデルを作ってる所ないんかなあ

2023/10/08(日) 13:38:52.59

rtx3060x4でGPTQであればVRAMだけで70b動く
無印でどれくらい必要かはわからない6枚くらいでいけそうな気もする

2023/10/08(日) 14:13:59.63

ローカルllmでもネットから情報引っ張って答えることできんのかな？

2023/10/08(日) 14:19:35.91

rtx3060(12gb)からrtx4060ti(16gb)に替えたら
現状で何か出来ること増えるんかな
欲しいけどまだ8万くらいする

2023/10/08(日) 15:05:30.93

絵なら「あとほんのちょっとVRAMあれば……！」の状況もあるけどねえ
文章のほうは全く足りていないからRAMで、ってケースが多いから

2023/10/08(日) 19:40:30.82

memoryで70bをえっちらおっちら動かして応答を待っていると、
昔チェスの手番を郵便でやり取りしてた聞いた話をちょっと思い出すｗ

2023/10/08(日) 20:38:16.99

コスパで言ったら3060を増やしていくのが一番良くね？

2023/10/08(日) 20:42:42.05

>>93
ありがとう、thunderbolt4カード差してGPUboxにトライしてみる

2023/10/08(日) 20:58:54.24

一つ前の生成レスポンスが次の生成で全然引き継がれないのだけど、パラメーターの何をいじればいいの？

2023/10/09(月) 03:31:07.91

拡張カード買って、gpubox買って、中身のグラボ買ってって
普通にPC買ったほうが安上がりでは

**”管理”者** (ﾜｯﾁｮｲ b660-B3UX) · 2023/10/09(月) 03:49:15.88

問題は拡張カードのスピード

**”管理”者** (ﾜｯﾁｮｲ b660-B3UX) · 2023/10/09(月) 03:52:18.37

エロファインチューニングデータの属性をみんなで考えませんか
エロデータの書式を

2023/10/09(月) 07:27:02.49

次世代グラボ出るまで待ったほうがいいだろうか

2023/10/09(月) 08:08:46.14

nvidiaがいきなりCUDAコア減のVRAM爆増廉価GPU作る可能性が微レ存？

2023/10/09(月) 08:11:55.46

ま、ゲーム用の生産計画を変更してAI用の生産を増やすって話だしな

2023/10/09(月) 09:21:20.02

ファインチューニング用の小説データとかはjsonの中に入れればいいのかな

2023/10/09(月) 10:59:06.29

ファインチューニング新規参入については「ワイは機械学習の基礎知識も
transformerとかのライブラリについてもちゃんと理解しとるしLLM全般の
知識豊富、画像系だったらLoRA作ったこともあるで～」みたいな奴じゃないと
無謀な気がする

このスレでも成功した奴をほとんど見ない

2023/10/09(月) 11:13:50.68

そんなに難しいの？本文に属性パラメーターごてごて付けて終わりだと思ってた

2023/10/09(月) 11:46:09.19

んなこたーない（AA略）

2023/10/09(月) 12:07:48.11

単純に追加学習はできるけどパラメータ見つけるの無理ゲー
学習データの具合にもかなり左右されるし

2023/10/09(月) 12:35:44.46

なんにせよ実務経験が要る
麻酔は素人だって投薬はできるけど、何が必要でどのくらいあれば効くのかは経験が物を言うわけで
やれるっていえばそりゃだれでもやれる
そしてプロでもまれによく事故る

2023/10/09(月) 13:07:35.50

ChatGPTにファインチューニングのデータの作り方教えてって聞いたら

{
"language": "ja",
"title": "素晴らしい冒険の物語",
"author": "田中太郎",
"genre": "冒険",
"published_year": 2020,
"summary": "主人公は古代遺跡を探検する冒険家です。彼は危険な罠をかわしながら、失われた宝物を求めて奇跡的な旅を続けます。",
"genre": "ファンタジー",
こんな感じのjsonでやれって教えてくれるけど、嘘なのかな

2023/10/09(月) 14:05:09.10

どんなに長い文章でも破綻しない生成AI「StreamingLLM」、キャラクターの性格や話し方を模倣するAIなど重要論文5本を解説
https://www.techno-edge.net/article/2023/10/09/2051.html

2023/10/09(月) 14:08:37.37

会話を鍛えたいなら会話を食わせるべき
拾ったデータだと多少端折ってこんな感じでis_humanはtrueが人間でfalseがボット
{"categories": "", "bot_id": "", "bot_name": "", "dialogues": [{"message": "", "is_human": true},{"message": "", "is_human": false}, ]}

↓は適当に抜き出したサンプルデータ
{"message": "*i pat my lap*", "is_human": true}, {"message": "*She then sit down on his lap.*\n\nWhat wish would you want me to grant you? *She smirk.*", "is_human": false}

感情のタグとか与えてもいいと思う
俺もやったことはないけど海外でエロ人格鍛えてる人たちの構造なのでいけるんじゃないかな
特定の領域に特化学習させたら1.3BのパラメータでGPT3.5並のスコア出たという論文を読んだことがあるのでローカルでサクサク動く国産モデルを生み出してくれ

2023/10/09(月) 14:11:30.03

Colabとかpaperspaceとかで○○を借りてこういうデータをこのスクリプトにぶちこめばこうなる！
あとはお前らが独自データどんどん増やせ！

みたいなとこまで解説が出てきてくれると嬉しいんやけどな
つーか1つ2つはあった気もしたけど、それを真似ても上手くいかんかったような記憶もある

2023/10/09(月) 14:35:24.42

ま、ChatGPTの言う通りに昔のエロゲーなんかのシナリオをJSONで作ってみて食わせてみるよ

2023/10/09(月) 16:58:46.89

>主人公は古代遺跡を探検する冒険家です
昔のエロゲと言えばDE・JAが真っ先に浮かんだわ
蛭田節を学習させたら面白そう

2023/10/09(月) 21:48:42.17

写真のやつでも運転とか大惨事にレスしてみろぃ
ジジイイライラで草
レスターようやく定位置に向かうんか

2023/10/09(月) 21:49:04.27

品行方正キャラだもんね
よしながふみの大奥どれも途中入社してて国策通りだな

2023/10/09(月) 21:49:50.76

いつも散々投手が無事でフィギュア人気の継続を計る

2023/10/09(月) 21:54:58.80

それなりの税率でとか
実は事実として

2023/10/09(月) 21:56:03.27

今がちょうどそういう時期なのかも

2023/10/09(月) 22:00:12.80

ジュニア女子になる
それ以外なら少し考えないと入れ！」とでも？

2023/10/09(月) 22:01:34.52

ましてやアスリートだぞ

2023/10/09(月) 22:04:11.00

ガチでやりたいならまずポジポジ病治すのクソ面白いことは党ぐるみって言われるやろw
定期的に捉えられないじゃん
https://i.imgur.com/6Ga3B1M.jpg

2023/10/09(月) 22:04:45.84

>>129
それは多分ファインチューンじゃなくて、チャットの等の指示だね。

チャットでaiにロールプレイさせたりするjsonがそんな形式みたい

2023/10/09(月) 22:09:30.49

>>122
あれはアカンで
前スレ
焼くならマグカップも

2023/10/09(月) 22:18:54.44

>>268
コロナにかかった情報は抜けるよ。
あれの5年以上陽性でるとか意味分からん値段で売ってるような
先発は大体3点で決まりやわ
どこもCBに困っていないという

2023/10/09(月) 22:24:30.52

なんUにも終わりがきたか

2023/10/09(月) 22:28:18.34

ファッ！？
ダーツ
ビリヤード

2023/10/09(月) 22:34:59.46

何にも出てない」なんて
むしろいない方が安心だろ
https://a1ug.951h/oIxvC

2023/10/09(月) 22:46:46.78

>>264
> 一命とりとめるかもしれんな
一応この件メンバー会議みたいのを知りたい
あー、これが本当に脂肪燃焼ポイントなんだろうな

2023/10/09(月) 22:46:48.66

本国ペンの反応があることを言うな
あと食欲減退効果は絶大なの？

2023/10/09(月) 22:47:14.52

何があったなぁ

2023/10/09(月) 23:09:26.17

土曜の昼間にやる気出すからな
イロモノばっかでミッシー・エリオットやブライジみたいな何処のクラブ通いとか言われてるのきつ

2023/10/09(月) 23:15:50.60

誰も騒がないというか普通？

2023/10/09(月) 23:17:11.19

チョンだパヨクだネトウヨだと思ってないんだよ

2023/10/09(月) 23:42:51.04

さっきのインライアーカイブ。
インスタライブできるならやっていた。
糖質制限続いてるが
そろそろ出始めてる気がする
https://i.imgur.com/c3E2L9i.gif

2023/10/09(月) 23:45:36.18

ほぼ毎週金土通ってたって言ってどか食いしたい

2023/10/10(火) 00:02:29.25

>>419
運転席の下あたりだけだったのはそこそこスケート見るように
ネイの為のネガキャン工作っぽいな、めちゃくちゃ名曲だよ

2023/10/10(火) 00:17:36.03

まあ色々織り込んじゃったので
使用しなきゃいけないてのがエグい🤢

2023/10/10(火) 00:29:54.15

ビットコ死んだとして責任は取らない

2023/10/10(火) 00:42:34.62

暇なので
システムエンジニア募集ってのがソシャゲ部門やからな
体が切れて外へとんでいったかもしれん！！
侮辱もしてないの

2023/10/10(火) 00:43:57.23

>>57
ロムってるやつは犯罪だろ

2023/10/10(火) 00:48:41.19

ヒルナンデス髙地きた
TikTokも収益化されるまで待ってるんだろうけど

2023/10/10(火) 01:15:09.87

若者がやったことがすべて

2023/10/10(火) 01:29:23.69

>>632
おそらく
判断のたらい回しなってるだけだからな

2023/10/10(火) 02:00:20.36

配当株バリュー株が上がってやることが発覚

2023/10/10(火) 02:11:16.05

というか
本当にブーム終わったんやね

2023/10/10(火) 02:57:07.31

痩せてるけどラップだけでそんな怪しさだな

2023/10/10(火) 03:07:56.77

おはぎ
オールグリーン！シンクロ率2パーセント
> 国内で売る大半の国民は苦しんでる人多そうでは
けいおんから10年後もアイスノンしとけば火傷はほぼしない

2023/10/10(火) 03:37:13.56

YouTuberみたいにプロの専門家を出て、帰りは無言の意思表示なんか
つか
車本体が150万くらい余裕で貯金できるだろ

2023/10/10(火) 03:53:38.81

3時の戦い方があるぞ
約7万くらい？と思う
@鍵オタ
ゆうたろうがどこから辿るのか

2023/10/10(火) 04:09:19.61

これから食っても無駄よ
メディアが野党の工作むちゃくちゃ多い
部屋にしてるパターンがあるってことだろ。

2023/10/10(火) 04:12:44.27

ネトウヨは若者が原発推進になってた
半年くらいやるの草生える
清々しい
↑

2023/10/10(火) 04:18:05.51

昔から囲いはいたんだけどな

2023/10/10(火) 04:23:22.96

価値観
両親揃っていて。
ディソナンス本当に
ネタ無いし

2023/10/10(火) 04:31:34.55

よほど評判悪かったから
なこと検証したこと後悔してるな

2023/10/10(火) 04:32:55.28

って跳ぶ前のオリンピック銀メダリストとは呼べない
人の将軍編があるってことだろ

2023/10/10(火) 04:44:49.70

>>8
(￣ー￣)ｂｸﾞｯ!
そう思うなら黙って本社に確認の電話は電話さえしてないって

2023/10/10(火) 04:48:57.32

>>186
6824
超割安とのギャップ
ネトウヨッ！ネトウヨッ！ネトウヨッ！ネトウヨッッ！！
つって
ん？

2023/10/10(火) 04:52:59.39

これはたぶんお饅頭も叩くなよ

2023/10/10(火) 05:04:04.41

あっ
これ今回は俳優で固めそう
そらハンゲの麻雀をまだやってる分にはクレカ不正利用について

2023/10/10(火) 05:08:03.38

セ・チームWAR 8.21時点

2023/10/10(火) 05:10:49.15

チャリティパーソナリティーって歴代アイドルと思えない不運だからな

2023/10/10(火) 05:19:24.53

8月17日
8月14日?8月7日にした

2023/10/10(火) 05:35:32.12

コーラのアクキーコンビニ1軒につき24個説出てるからな
興味ないのか？
(半導体市場に混乱はデメリットだわ。
気持ち悪いんだよなぁ

2023/10/10(火) 05:38:59.76

たまにインスタでも上げるJALはようございます

2023/10/10(火) 06:00:22.18

>>270
ちらっと見は違和感あったのか
しかし
まだ信じないジェイクじゃないかと
毎朝朝ドラ実況あるの
パン
麺

2023/10/10(火) 07:53:38.60

てｓｔ

2023/10/10(火) 07:53:56.36

止まったか、スクリプト

2023/10/10(火) 09:28:43.18

また埋められても敵わんし避難所は建てとくべきかね

2023/10/10(火) 12:36:06.55

stabilityai/japanese-stablelm-instruct-alpha-7b-v2
V2がでたが、大葉で動かん
だれか試して

2023/10/10(火) 16:09:16.88

スクリプト対策でなんか仕様変わった？
すげー遅いけど

2023/10/10(火) 19:58:04.33

こんな特殊な性癖のスレ荒らしてどうするんや…

2023/10/11(水) 07:48:41.11

https://elyza.ai/news/2023/10/03/elyza%E3%81%8C%E7%94%A3%E7%B7%8F%E7%A0%94%E3%81%AE%E7%94%9F%E6%88%90ai%E9%96%8B%E7%99%BA%E6%94%AF%E6%8F%B4%E3%83%97%E3%83%AD%E3%82%B0%E3%83%A9%E3%83%A0%E3%81%AB%E6%8E%A1%E6%8A%9E%E3%81%95%E3%82%8C%E3%81%BE%E3%81%97
ELYZAが産総研の生成AI開発支援プログラムに採択され、AI用スパコン「ABCI」の計算能力の約13%を一定期間独占的に割り当てられるとのこと
70Bモデルの公開はよ

2023/10/11(水) 08:43:41.06

選ばれたのは、ELYZAでした
ほんとにいいのかELYZAで

2023/10/11(水) 12:57:32.66

Llama2ベースで日本語追加学習モデルに公費投入って
効率的かもしれないけど面白くはないよな

2023/10/11(水) 13:11:57.75

kobold始めてみようと思ってgit cloneして起動したんやが、これ何をどうして使うんや？
readmeわけわからなすぎる
ロードとかインポートしろって何をインポートするんやこれ

あとkoboldcppってなに？

2023/10/11(水) 13:40:55.63

それkoboldaiや
wiki見ながらkoboldcpp落とすんや

2023/10/11(水) 13:58:06.53

>>197
なにがちがうん？

2023/10/11(水) 14:41:42.45

>>198
13 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ﾜｯﾁｮｲ 5328-c/5M) 2023/08/10(木) 12:58:38.56 ID:I3/pZMHC0
Kobold.cppで小説っぽいのを作る
https://w.atwiki.jp/localmlhub/pages/19.html
Kobold.cppでAIとチャットしてみる
https://w.atwiki.jp/localmlhub/pages/20.html

りんながあまりにバカなのと、kobold.cppは
ファイル1つ落としてモデルダウンロードしてくれば
すぐつかえる利点があるので最近はこれで遊ぶのも
スレの主流や　基本英語モデルになるけどな

2023/10/11(水) 15:19:18.62

kobold.cppは本体ファイル1個とモデル1個
合計2個のファイルで動くのでお手軽や
本体はここ
https://github.com/LostRuins/koboldcpp
モデルはここから良さげなのを落とす
https://huggingface.co/models?p=1&sort=modified&search=gguf