twinkle for iOS 正規表現専用4
twinkleの正規表現のテストや正規表現に関する質問など
前スレ
twinkle for iOS 正規表現専用3
http://fate.5ch.net/test/read.cgi/ios/1494717956/ NG - 正規表現
(250文字NG)(?s).{250}
(16行NG)(.*\n){16}
(小型AA)(?m)[\´∧∨]
(大型AA)(?m)[|:;, ]{2}[|!:;.,]
(1文字ずつ改行NG)(.\n){3}
(1文字ずつ改行NG)(..\n){3}
(数字-1行以上NG)(\n[ ]*){3}
(1文字改行5連続)(?m)(.\s){5,}
(1文字改行4連続)[()/|ヽ()/\|])(?= *[_  ̄_]{3})[ _ _ ̄]+\1
(縦書き 4文字)(?:^|<br>)[ ]*[^ < ](?:(?:[ ]*<br>)+[ ]*[^ < ]){2}(?=[ ]*(?:<br>|$))
(巨大AA 記号の線対称)/[ _ _ ̄]+\|\[ _ _ ̄]+/|[((](?! *[))])[ _ _ ̄]+[))]
(巨大AA 記号の並列)(?:^|<br>)[ ]*[^ < ](?:(?:[ ]*<br>)+[ ]*[^ < ]){3}(?=[ ]*(?:<br>|$))
(4文字以下のレス)^(?:[ ]*<br>)*[ ]*[^<]{1,4}(?:[ ]*<br>)*[ ]*$
(区切り文字)(?:[ w w]+[ぁ-龠]){4}(?=[ <w w]|$)
(アンカー5連投)(?:^|<br>)(?:[^<]*?(?:<a [^<]+</a>|(?:>|>){1,2}\d+)){5}
(1行文連投)(?:^|<br>)(?![ ]*<br>)((?:[^<]|<a [^<]+</a>)+)<br>\1(?=(?:<br>|$))
(1行文の2連投)(?:^|<br>)(?![ ]*<br>)((?:[^<]|<a [^<]+</a>)+)<br>\1(?=(?:<br>|$)) NG設定で使われそうな正規表現一覧
' 'で括られた部分は任意で変更可能
NGにしたい文字列の中にメタ文字($や+など)が含まれる場合は頭に\をつける(\$や\+など)
●任意の文字や位置を指定
. 何か1文字 \n 改行 ^ レスの始め $ レスの終わり
\d 数字 \D 数字以外の1文字 \t タブ
[[:blank:]] スペース(半角/全角)とタブ
[\s\S] 改行等を含めた何か1文字
[^\x01-\x7E] 全角文字(半角カタカナ含む)
[\xA1-\xDF] 半角カタカナ
\3 正規表現中の'3'個目の()内と同一
●直前の文字(または文字列)の数を指定
? 0〜1個 + 1個以上 * 0個以上
{5} '5'個 {,5} '5'個以下 {1,5} '1'〜'5'個
●複数の文字(または文字列)を指定
[あいう] 'あ' 'い' 'う'のどれか1文字
[^あいう] 'あ' 'い' 'う'を除く1文字
[あ-お] Unicodeで'あ'〜'お'までの1文字
(あいう) 'あいう'という文字列
(あいう|かきく|さしす) 'あいう' 'かきく' 'さしす'という文字列のどれかひとつ
●後ろや前に特定の文字(または文字列)があるかないかを指定
(?=あいう) 後ろに'あいう'がある
(?!あいう) 後ろに'あいう'がない
(?<あいう) 前に'あいう'がある
(?<!あいう) 前に'あいう'がない
●正規表現の性質を指定
(?i) 以降のアルファベットの大文字小文字が区別されない
(?i:abc) ()内のアルファベット'abc'の大文字小文字が区別されない
(?:あいう) この()は上記の\3には数えられない
(?#あいう) 'あいう'がコメントとして無視される ●本文以外
(空白age)^$
(sage以外)^(?!sage$)
(末尾P).{8}P
●本文が◯◯のみ
(1文字のみ)^.$
(安価のみ)^>>[\d,-]+$
(URLのみ)^[htpsf]{,5}://[!-z]+$
(画像のみ)^[htpsf]{,5}://[!-z]+\.(?i:(jpe?g|png|gif|bmp|tiff?"))$
●本文に◯◯が×個(×回)連続で含まれる
(改行が10回連続)\n{10}
(空白文字含む改行が10回連続)([[:blank:]]*\n){10}
(1文字の行が10回連続)((^|\n).){10}
(wが10個連続)w{10}
(同じ文字や文字列が5回連続)(.+?)\1{4}
●本文に特定の文字列が含まれる、含まれない
(1行にA,Bが含まれる)(?=.*A)(?=.*B)
(複数行にA,Bが含まれる)(?=[\s\S]*A)(?=[\s\S]*B)
(1行にAが含まれBが含まれない)(?=.*A)(?!.*B)
(複数行にAが含まれBが含まれない)^(?=.*A)(?!.*B).*$ ○UnicodeでのNG設定方法
1,NGにしたい文字をコピーする(例: ೢ)
2,Unicodeスカラ値を調べる
2-1,サイトにいく
ttp://www.shurey.com/js/works/unicode.html
2-2,テキストボックスに貼り付けて、検査を押す
2-3,下に出た結果からNGにしたい文字の下にある16進数を確認する(例:0CE2)
2-4,「表示選択メニュー」で2-3で確認した16進数が含まれる範囲を選ぶ(例:[U+0C80-0CFF] カンナダ文字)
2-5,出てきた表にNGにしたくない文字がなければ上記の16進数をメモする(例:0C80-0CFF)
あればNGにしたい範囲の始めの文字と終わりの文字の16進数をメモする(例:0CE0-0CE3,0CEA-0CED)
3,正規表現を組み立てる
・16進数を各々\x{}で囲う
・ひとつの範囲はハイフンでつなぎ、別の範囲は続けて書く
・全体を[]で囲う
完成例:
[\x{0CE0}-\x{0CE3}\x{0CEA}-\x{0CED}] 乙
ちんくるの正規スレってあったの?検索かけてもヒットしなかったんだが 総レス数20以下のスレは一定期間書き込みがないとdat落ちしちゃうからな
正規表現スレは基本的に過疎スレだから保守しないとすぐ消える 本文が150文字以上の場合
(?s).{150}
これでいいの?
某スレで長文コピペ貼られてもNGならねーわ 【車】 カースピーカーを語るスレ40
http://medaka.5ch.net/test/read.cgi/car/1558923303/
このスレの652から3レスが長文なんだけどさっきのじゃNGならない 文字数はロケール依存じゃないかな?
UTF-8だけどカウントはバイトになっていたりすると
文字数とバイト数は一致しないとか
あと
(?s)の解説は必要ないのかな? 広範囲安価をNGするのってあったよね?
誰が教えてくださいませ
>>1-9
とか あれ、ここではテンプレのやつで広範囲NGなるな
VIPだと正規表現違うのか? これテンプレに入れてくれや
>>4の奴は効かない
889iOS2019/10/27(日) 20:35:05.71ID:afCSa1h8
●本文に特定の文字列が含まれる、含まれない
(?#同一行内でA,Bが含まれる)(?m:^(?=.*A)(?=.*B))
(?#文章全体でA,Bが含まれる)(?s:^(?=.*A)(?=.*B))
(?#同一行内でAが含まれBが含まれない)(?m:^(?=.*A)(?!.*B))
(?#文章全体でAが含まれBが含まれない)(?s:^(?=.*A)(?!.*B)) >>33
難しくて混乱してしまう
本文中に空白と改行しかないスレをNGにしたいんだけど
これで誤魔化した
(?#[[:blank:]])^.$
([[:blank:]]*\n){10} ^ と .* は要らないだろ
無駄なコストかけすぎ >>34
お前がやりたい事と>>33の記述は全く無関係だろ
なんとかしか含まないは、なんとか以外を含むになって、
平仮名漢字片仮名数字半角英数字とか全部書かないと出来ないよ IDワッチョイ強制スレでのIDもワッチョイも非表示のレスを正規表現「(?<!\))$」でNGにしたけど、今度はワッチョイは非表示なもののIDは表示するレスまで消えてしまった
そのスレでの荒らしは両方非表示の奴だけで片方だけ表示の者は荒らしではない
IDかワッチョイの片方だけ非表示のレスはNGにせず、両方非表示のレスだけNGにする方法を教えてください
どなたかお願いします ある特定の文字列を含まないレスをNGにしたいのですが、どう書いたら良いでしょうか
自分で書くと、特定の文字列を含まない行が一つでもあるとNGになってしまいました
逆に言えば、書き込み全体で1箇所でも特定の文字列が含まれていればNGにならないようにしたいです 正規表現してるとニュース系のスレだと1がNGになってしまうんだけど
>>1は除外の設定ってできるのかな レス中にスペースが2つ以上含まれていてかつそのレスが6文字以下のものをNGするにはどうしたらいいでしょうか https://youtu.be/qGiBdd45JoQ
エグいw
↑こんな風にYouTubeのURLと一言を貼るレスをNGしたいです
どうしたらいいですか?
一言は全角か半角のwで終わります 昔sedとかで正規表現結構使ったつもりだったけど、
テンプレ見ると知らないのが多いよん。
ぼちぼち試してみるかね。 >>53
のような意味のないレスする人ホント性格悪い
普通>>41
みたいな返答を求めてるだろ >>54
のような意味のないレスする人ホント知能低い
そんな喧嘩腰でなんの利益が期待できんだかw
素直に わたしばかだからテンプレのどれか分からないのでレス番教えて でいいよ 1 以下、5ちゃんねるからVIPがお送りします[] 2020/07/24(金) 02:20:42.314 ID:o9A0ktP20
まず、PCで書き込んだ時の送信内容とiPhoneで書き込んだ時の時の送信内容をキャプチャして調べた結果、PCで書き込んだ方のお絵かきデータでiPhoneの送信データを置き換えただけで「空白絵禁止」エラーは出なくなることが判明した
お絵かきの画像はpngに変換された後にそのバイナリデータをbase64という変換方式で文字列に変換して送ってるわけだが、今試したらしたら同じ画像をbase64変換してもPCとiPhoneではbase64変化後の文字列が違う、つまりpngへの変換後のバイナリが違うと判明した
どちらのバイナリデータもPCでPNG拡張子で保存すればピクセルデータは全く同一のものが得られるのは確認した
要するに5chの空白絵判定プログラムがバグってiPhoneから送られる画像データの形式をうまく処理できてないってことや
というわけで誰か運営を説得してくれないか
俺が言っても「iPhoneなんか知るか」ってなって終わりそうや 特定のワードを含むスレッド以外をまとめてNGできる正規表現ってありますか? >>58
^(?!.*◯◯).*$
正規表現無しで上位にくればいいだけなら分類キーワードを設定するのもありかな 特定のワードを含まないスレッドをNGにする正規表現ってありますか? >>59
おっ、虫か?
癶( 癶;:゚;益;゚;)癶 サキオタ
って文字列中に改行やカンマとか入れてくるクソレスをNGにしたい
サ[¥s¥S]*キ[¥s¥S]*オ[¥s¥S]*タ
じゃ消えないんだが何故だ サ
,キ オ タ
サ キ、。オ、。タ
サ キ,.オ,.タ
サ[\s\S、。,.、。,\.]*キ[\s\S、。,.、。,\.]*オ[\s\S、。,.、。,\.]*[夕タ]
とくにもんだいなさげ >>64
おお!消えました!
ありがとう!愛してるぞ! サ([^キ]+?)?キ([^オ]+?)?オ([^タ]+?)?タ >>67
失礼
こうか
サトウキビ オイシイ タノシイ >>69
>>64を改変すると誤爆しない
サ[\s\n、。,.、。,\.]*キ[\s\n、。,.、。,\.]*オ[\s\n、。,.、。,\.]*[夕タ] 教えてください。
下記内容のあるスレを正規表現で見えなくしたい。
(〇〇〇〇感)
〇〇の字数は色々
(*感)だと消えない。 >>73
ありがとう。やっぱりダメだ
こんなんです。
抵当なフレーズの後に()でタレント名のようなものが入り感で終わる
ドドシコシコシコ (らくしんご感) >>74
再投稿
このスレッドでは消えた。
地域版の関東
このスレッドからは消えない
【みずほ台 鶴瀬】埼玉県富士見市★24【ふじみ野】 試しに投稿
貼り付けた
やさしい なんて うそだぜ い つ も (ランニングショット感) >>74
後出しやめろ
てめえがカッコを全角で書いたんだろ
最初からちゃんと引用しろ池沼
[(|(].*感[)|)] []に|は要らない
()は場所によっては要エスケープ([]内では一般に不要)
つまり
[(\(].*感[)/)]
(ここでは[]へのエスケープは不要だが付ける癖を付けた方がよいという考え)
ただ元のままでもほぼ同様のマッチは得られるのでNG目的には適う
(ドドシコシコシコ (らくしんご感) だけでなく ドドシコシコシコ |らくしんご感| までマッチするが実用には大過ない)
より対NG避け耐性をあげるなら(空白挿入対策)
[(\(][:blank:]*.*感[:blank:]*[)/)]
誤爆確率を下げるなら(行文末限定)
[(\(][:blank:]*.*感[:blank:]*[)/)][:blank:]*(?:\n|$)
さらに下げるなら(さらに行文頭限定)
(?<=(?:^|\n))[:blank:]*.+[:blank:]*[(\(][:blank:]*.+[:blank:]*感[:blank:]*[)/)][:blank:]*(?=(?:\n|$))
(行文頭末マッチは前者の方がコストが安いが例として)
最後のであれば>>74,76のみがマッチして>>72はマッチしない 教えてください。
09月18日 金 .
08:30-09:00 ほげほげ
09:00-10:00 外勤
10:00-12:00 在宅 製作委員会 @zoom
09月19日 土 .
08:30-09:00 ほげほげ
09月20日 日 .
08:30-09:00 ほげ
09:00-10:00 外勤 ほげ
10:00-12:00 在宅 おしりたんてい製作委員会 @zoom
みたいなスケジュールが平文で五日くらい並んでて、一日目の
09月18日 金 .
08:30-09:00 ほげほげ
09:00-10:00 外勤
10:00-12:00 在宅 製作委員会 @zoom
だけ切り取りたいのです。
ご教示いただけたら嬉しいです! また質問です。
全部ひらがなのコメントを投げる人がいるのですが、これを正規表現でNGにする方法はありますか? >>88
実用面で言えば「ありがとう」だけのレスもNGしてしまうので
^\p{Hira}{最低文字数,最大文字数}$
で適切な文字数を設定すべきかもしれないけどね
>>86の条件にはなかったのであとの調整はご自分でどうぞ まだ画像貼ってんのか
機内モードにしてNGすりゃ済む話 またまたお助けを
下記連投
最下行はいろいろ恵理子
こ
の
ス
レ
は
安
倍
独
裁
政
権
の
ネ
ッ
ト
工
作
部
隊
が
工
作
し
て
い
る
の
で
処
分
し
ま
す
らははほままはさ >>93
テンプレ読んでないのか?
縦書き文化を守りつつ今回のNGワード的内容でNGしたい
安\n倍|独\n裁|工\n作
縦書き文化などしったことか(一文字改行三連続)
(?:.\n){3,} >>94
ありがとう。他力本願ですいません。正規表現は難しい。 アプデしたらまた邪魔な広告が出るようになっちまった ワッチョイ 0dbe-LA9
ワッチョイ 5fbe-YQ4O
このワッチョイ be- をNGにしたいのですがどうしたら良いのでしょうか