正規表現

PDFファイルからコピー&ペーストした文字が文字化けする|PDFが無用の改行をする点を修正するための正規表現|改行ができる正規表現エンジンを使って〔Onigmoは不可〕

PDFファイルからコピー&ペーストした文字が文字化けする

半角でも、疑問符でも感嘆符でも句点でもないものが行末にあるとき

([^( -~)(? )(! )。?!])\n
あるいは
([^( -~)(? )(! )。?!])$

その次の行の行末に、疑問符または感嘆符または句点があるとき

(.*?)([。!?])\n
あるいは
(.*?)([。!?])$

Vivliostyle Viewer

Vivliostyle

Vivliostyleのプロジェクトは、まったく支持されていないようだ。 敗北が確定しているのだから、やめればいいと思う。

独自のJavaScriptをつくって頑張ってはいるけれども、技術者たちの時間・手間を奪い取るだけで、まったく無駄なことをしていると思う。

理由は簡単で、CSS組版というのは、結局、EPUBの[stylesheet.css]を拡張したものであるからだ。

サクラエディターの正規表現エンジンであるOnigmoは[置換前文字列の指定]に改行を含む表現が使えない|改行を別文字に置換したうえで改行を取り去って置換操作を終えた後に別記号を改行記号に戻す操作が必要となる

サクラエディターの正規表現エンジンであるOnigmoは[置換前文字列の指定]に改行を含む表現が使えない|改行を別文字に置換したうえで改行を取り去って置換操作を終えた後に別記号を改行記号に戻す操作が必要となる

C:\Users\%USERNAME%\AppData\Roaming\sakura

以上は、サクラエディターのマクロを保存しておくディレクトリのパスです。

※以下に記載したコード〔定義文〕を、文字コード[Shift-JIS]、改行コード[CR+LF]で、[YOUR-FAVORITE-NAME.mac]というファイル名で[C:\Users%USERNAME%\AppData\Roaming\sakura]に保存し、サクラエディターの上部の操作メニューで[ツール(T)]>[名前を指定してマクロ実行(E)]の中で該当ファイルを[左クリック]〔ダブル〕して実行します。

サクラエディターのマクロファイルは文字コードはSJIS〔シフトジス〕で保存しないと日本語を文字置換できない

サクラエディターのマクロファイルは文字コードはSJIS〔シフトジス〕で保存しないと日本語を文字置換できない

FileCode Checkerでマクロファイルの文字コードをまとめてチェックすることもできます

FileCode Checkerの詳細情報 : Vector ソフトを探す!

文字コードの変更

文字コードの変更がサクラエディターそれ自体で行なえます|ダウンロードするのはインストーラーでいいと思います[sakura-tag-v2.4.1-build2849-ee8234f-Win32-Release-Installer.zip]

Releases · sakura-editor/sakura · GitHub

文字コードの変更がTeraPadで行なえます

TeraPad 公式ダウンロードサイト

サクラエディター|マクロ|Onigmo|正規表現|すべての文字を小文字に置換する〔(.)を¥l$1に〕|すべての文字を大文字に置換する〔(.)を¥U$1に〕|行頭の1文字を大文字に置換する〔(^.)を¥U$1に〕

[サクラエディタで正規表現を使用し、大文字・小文字変換]に一部動作しない表現があったので、この記事で修正しているのです

サクラエディタで正規表現を使用し、大文字・小文字変換 - Qiita

サクラエディターのOnigmoですべての文字を小文字に置換する

C:\Users\%USERNAME%\AppData\Roaming\sakura

以上は、サクラエディターのマクロを保存しておくディレクトリのパスです。

※以下に記載したコード〔定義文〕を、文字コード[Shift-JIS]、改行コード[CR+LF]で、[YOUR-FAVORITE-NAME.mac]というファイル名で[C:\Users%USERNAME%\AppData\Roaming\sakura]に保存し、サクラエディターの上部の操作メニューで[ツール(T)]>[名前を指定してマクロ実行(E)]の中で該当ファイルを[左クリック]〔ダブル〕して実行します。

Onigmoの正規表現|[(?:式)]〔記号を半角にしてください〕で非捕獲式集合 (グループ化のみ)|必要上カッコを使っても置換用パラメータが浪費されない書き方

Onigmoの正規表現|[\(\?\:式\)]で非捕獲式集合 (グループ化のみ)|必要上カッコを使っても置換用パラメータが浪費されない書き方

(?:.*?)(.*?)(?:.*?)(.*?)(?:.*?)(.*?)
偶数番目のカッコ内しか置換用パラメータが効力を発揮しない
置換用に参照できるのは偶数番目である3つだけで、表記としては[$1$2$3]

Googleカレンダーでゴミ収集日をメールと通知で知らせる〔ダウンロード付き〕

必要なファイルのダウンロード〔オリジナルに制作した作品の著作権は放棄していません〕

LibreOfficeのダウンロードとインストール

download | LibreOffice - オフィススイートのルネサンス

サクラエディタのダウンロードとインストール

Releases · sakura-editor/sakura · GitHub

[sakura-tag-v2.4.2-build4203-a3e63915b-Win32-Release-Installer.zip]に類するファイル名をクリックしてダウンロードし、そのファイル名の上で[右クリック]→[すべて展開]を行ない、展開されたインストーラー〔実行ファイル=.exe〕を実行してサクラエディタをインストールする。

厳選されたテキストエディタ

Grepやマクロで文字置換を頻繁に行なうテキストエディタ

サクラエディタ:【無料】【Windows専用】

【Mac】サクラエディタに似ている無料のテキストエディタはこれです。 | EarthEcoTech

サクラエディタは、【無料】のおにぐも〔Onigmo(Oniguruma-mod)〕〔内容:bregonig.dll 〕と呼ばれる正規表現エンジンを搭載しています。 鬼雲とサクラエディタのマクロとを合わせることにより、正規表現を使った、強力な文字検索、文字置換が可能です。

鬼雲は[検索対象/被置換対象]を記述するオペランドに、改行を含む記述ができない、という難点を抱えています。 鬼雲がもつ[どんなに一行が長くても置換できる]という長所を獲得するためには、その難点をかんじゅしなければならない事情があるのでしょう。

文末に句読点/カギ括弧とじがない行だけにヒットする正規表現

^\(\?!\^.\*、\$\|\^.\*。\$\|\^.\*」\$\|\^.\*!\$\|\^.\*?\$\)

^(?!^.*、$|^.*。$|^.*」$|^.*!$|^.*?$)

^\(\?!\^.\*。\$\|\^.\*」\$\|\^.\*!\$\|\^.\*?\$\)

読点を除いたもの。

^(?!^.*。$|^.*」$|^.*!$|^.*?$)
★☆★☆★\1

文末が句読点、カギ括弧とじで終わらない行の[次の行]が文末が句読点、カギ括弧とじで終わるとき、行を結合する

★☆★☆★(.*)\n(.*)(、|。|?|!|」|。)\n
\1\2\3\n

漢字の使いすぎ防止|日本語可読性向上評議会|用言={動詞、形容詞、形容動詞}

[感じ切る] → [感じきる]|(い|き|ぎ|し|じ|ち|ぢ|に|ひ|び|ぴ|み|い|り|い)切([っらりるれろ])

S_ReplaceAll('	(い|き|ぎ|し|じ|ち|ぢ|に|ひ|び|ぴ|み|い|り|い)切([っらりるれろ])	', '	$1き$2	', 44); 

副詞|サクラエディタ|マクロ

日本語の形容詞・形容動詞は、be動詞に相当する[あり]を内蔵していますので、日本語の形容詞・形容動詞は、外国語基準でいうと、[動詞]に含まれます。

日本語|正規表現|基本的な正規表現フレーズ

サクラエディタ|正規表現|[Saa]または[サアラ]を含まない行を削除|^(?!.*(Saa|サアラ)).*$

^(?!.*さえずり).*$
^(?!.*(Saa|サアラ)).*$

正規表現で、ある文字列を含まない行を抽出する方法 - Qiita

(あ|か|が|さ|ざ|た|だ|な|は|ば|ぱ|ま|や|ら|わ)

([あかがさざただなはばぱまやらわ])

(あ|か|が|さ|ざ|た|だ|な|は|ば|ぱ|ま|や|ら|わ)

(い|き|ぎ|し|じ|ち|ぢ|に|ひ|び|ぴ|み|い|り|い)

([いきぎしじちぢにひびぴみいりい])

(い|き|ぎ|し|じ|ち|ぢ|に|ひ|び|ぴ|み|い|り|い)

(う|く|ぐ|す|ず|つ|づ|ぬ|ふ|ぶ|ぷ|む|ゆ|る|う)

([うくぐすずつづぬふぶぷむゆるう])

(う|く|ぐ|す|ず|つ|づ|ぬ|ふ|ぶ|ぷ|む|ゆ|る|う)

(え|け|げ|せ|ぜ|て|で|ね|へ|べ|ぺ|め|え|れ|え)

([えけげせぜてでねへべぺめえれえ])

(え|け|げ|せ|ぜ|て|で|ね|へ|べ|ぺ|め|え|れ|え)

(お|こ|ご|そ|ぞ|と|ど|の|ほ|ぼ|ぽ|も|よ|ろ|お)

([おこごそぞとどのほぼぽもよろお])

(お|こ|ご|そ|ぞ|と|ど|の|ほ|ぼ|ぽ|も|よ|ろ|お)

(あ|い|う|え|お|っ)

([あいうえおっ])

(あ|い|う|え|お|っ)

(か|き|く|け|こ|っ)

([かきくけこっ])

(か|き|く|け|こ|っ)

(が|ぎ|ぐ|げ|ご|っ)

([がぎぐげごっ])

(が|ぎ|ぐ|げ|ご|っ)

(さ|し|す|せ|そ|っ)

([さしすせそっ])

(さ|し|す|せ|そ|っ)

(ざ|じ|ず|ぜ|ぞ|っ)

([ざじずぜぞっ])

(ざ|じ|ず|ぜ|ぞ|っ)

(た|ち|つ|て|と|っ)

([たちつてとっ])

(た|ち|つ|て|と|っ)

(だ|ぢ|づ|で|ど|っ)

([だぢづでどっ])

(だ|ぢ|づ|で|ど|っ)

(な|に|ぬ|ね|の|っ)

([なにぬねのっ])

(な|に|ぬ|ね|の|っ)

(は|ひ|ふ|へ|ほ|っ)

([はひふへほっ])

(は|ひ|ふ|へ|ほ|っ)

(ば|び|ぶ|べ|ぼ|っ)

([ばびぶべぼっ])

(ば|び|ぶ|べ|ぼ|っ)

(ぱ|ぴ|ぷ|ぺ|ぽ|っ)

([ぱぴぷぺぽっ])

(ぱ|ぴ|ぷ|ぺ|ぽ|っ)

(ま|み|む|め|も|っ)

([まみむめもっ])

(ま|み|む|め|も|っ)

(や|い|ゆ|え|よ|っ)

([やいゆえよっ])

(や|い|ゆ|え|よ|っ)

(ら|り|る|れ|ろ|っ)

([らりるれろっ])

(ら|り|る|れ|ろ|っ)

(わ|い|う|え|お|っ)

([わいうえおっ])

(わ|い|う|え|お|っ)

漢字の使いすぎ防止|日本語可読性向上評議会|音声による文字入力ソフトの句読点を正規表現でおぎなう

[ですます調]|調整中

S_ReplaceAll('[\r\n]+', '\n', 148);
S_ReplaceAll(' ', '、\n', 44);
S_ReplaceAll('([でま])す(か|かね|よね|よ|ね|)', '$1す$2?●●●', 44);
S_ReplaceAll('([でま])す(よ? )', '$1す$2。●●●', 44);
S_ReplaceAll('(でしょう|でしょ)', '$1? ●●●', 44);
S_ReplaceAll('(でしょう)(? )', '$1。●●●', 44);


S_ReplaceAll('[\n]+', '\r\n', 44); 

S_ReDraw(0);

サクラエディタは複数行にわたる置換ができない|[鬼雲\r\n鬼雲]がヒットしない

この記事の[正規表現]とはサクラエディタに付いている正規表現エンジン〔bregonig.dll with Onigmo〕の正規表現です

K.Takata’s software: bregonig.dll

Onigmo文字コードプロパティ

Onigmo/UnicodeProps.txt at master · k-takata/Onigmo · GitHub

文字コードプロパティ


サクラエディタ|正規表現|約物|[\p{P}]

[\p{P}]

サクラエディタ|正規表現|カタカナ|[\p{Katakana}ー]

[\p{Katakana}ー]
[\x{30A1}-\x{30FA}]

漢字、ひらがな、カタカナにマッチさせる方法 | 正規表現

サクラエディタ|正規表現|ひらがな|[\p{Hiragana}ー]

[\p{Hiragana}ー]
[\x{3041}-\x{3096}]

漢字、ひらがな、カタカナにマッチさせる方法 | 正規表現

サクラエディタ|正規表現|サロゲートペアの漢字|[\x{2000B}-\x{2A6B2}]

[\x{2000B}-\x{2A6B2}]

サロゲートペア - 闘うITエンジニアの覚え書き
Pre-Practice Blog: 文字列の中から漢字を抽出する正規表現を考えてみる /[々〆〇〻㐂-頻]+/g
Unicodeで「漢字」の正規表現 – ものかの

行なう|行なって|行って

行なう

行(い|う|え|お|っ|わ)●●●おこな$1
S_ReplaceAll('行(い|う|え|お|っ|わ)', 'おこな●●●$1', 44);

行なう

行(か|き|く|け|こ|っ)●●●往$1
S_ReplaceAll('行(か|き|く|け|こ|っ)', '往●●●$1', 44);

[行って]は[行なって]と[いって]の両方に読める

言う → いう

言(う|え|お|っ|わ)●●●い$1
S_ReplaceAll('言(う|え|お|っ|わ)', 'い$1', 44);

正規表現を使用して漢字をひらがなに変換する|Converting Kanji to Hiragana using regular expression

漢字の開く・閉じる

漢字 → ひらがな化すること|開く(ひらく)

漢字をひらがなに直すことを「開く」という。 しかし「開く」という一般動詞を「漢字をひらがなに直す」意味として使うのは、新聞社や出版業界ぐらいであった。 だから「開く」という言葉を使うごとに「漢字をひらがなに直すこと」という注釈を入れる必要がしょうじる。 一般人である私たちが新聞社や出版業界の業界人に迎合する必要はない。 「開く」というジャーゴンを使わずに「ひらがな化する」という「読んで字のごとし」の用語を新たに打ち立てるのがよいであろう。

Firefoxのブックマークをサクラエディタのマクロで整形する

サクラエディタ

サクラエディタ - Google 検索

サクラエディタ|正規表現

サクラエディタで使える正規表現のメモ - Qiita
連続改行を一回改行にするには? | サクラエディタ過去ログ

サクラエディタで使える正規表現 - Google 検索

DADADADA.mac

※以下に記載したコード〔定義文〕を、文字コード[Shift-JIS]、改行コード[CR+LF]で、[YOUR-FAVORITE-NAME.mac]というファイル名で[C:\Users%USERNAME%\AppData\Roaming\sakura]に保存し、サクラエディターの上部の操作メニューで[ツール(T)]>[名前を指定してマクロ実行(E)]の中で該当ファイルを[左クリック]〔ダブル〕して実行します。