🟩 もくじ
[プロンプト開始] ※複雑なプロンプトの内容を一度に処理することが難しいとしたら、工程をいくつかの段階に分けて処理してみてはどうでしょうか? 以下の文章〔トランスクリプション〕に対し、次の編集ルールを用い、要約=サマライズではなく、トリミング処理を行なってください。
【トランスクリプションの誤字脱字の訂正】:原文はトランスクリプションなので、誤謬訂正〔エラーコレクション〕を行なうことを基本とする。
- 文章〔トランスクリプション〕の不完全さを取り除くことが最終目標である。 互いに矛盾する指示は、以下の【最優先原則の明示】の中に示された、「[原文の固有情報]を正確に保持することが最優先である」という基準に従い判断すること。
- 原文はトランスクリプションなので、[同音異義語の取り違え〔変換ミス〕/聞き違い/一部聞き漏らし]を、文脈的な意味の整合性を最優先して、念入りに訂正する。
- 原文を保持することが大原則ではある。しかし、[誤字脱字][固有名詞・専門用語の誤り]等は、念入りに訂正し、同時に表記の統一〔表記揺れの防止〕も行なう。
- 例:原文において、[厚生労働省]と[厚労省]という表記があったら、いずれかに統一する。これは文字置換、文字検索の便益のためである。
【体裁的必須事項|パラグラフ分けと見出しの仕様】:
- [パラグラフ本文][見出し][箇条書きの一箇条][タグ]のすべてにおいて[主語+述語をもつ【だ・である調〔ですます調ではない言い方〕】の完全な節〔≒文〕]とすること。
- [各パラグラフの見出し]は全角85文字〔255byte〕以内の[主語+述語をもつ【だ・である調の完全な節〔≒文〕]とする。
- つまり、全角85文字〔255byte〕以内の[主語+述語をもつ【だ・である調の完全な節〔≒文〕]の[見出し]になるように、内容の切れ目ごとに、できるだけ小さなステップを刻むかたちでパラグラフに分ける。
- 1つのパラグラフに1つの[見出し〔###〕]をつける。なお[見出し]の文末に句点(。)を付けないこと。
- 見出しに[~するパラグラフ]などの接尾辞を付けないこと。
- [見出し]は階層をもたず、すべての[見出し]は[### ]とする。
- [パラグラフ本文を構成する各文]は全角85文字〔255byte〕以内の[主語+述語をもつ【だ・である調の完全な節〔≒文〕]とする。長い一文は禁止である。
- [箇条書きの一箇条〔=一行〕]は全角85文字〔255byte〕以内の[主語+述語をもつ【だ・である調の完全な節〔≒文〕]とする。
- [タグ]は全角85文字〔255byte〕以内の[主語+述語をもつ【だ・である調の完全な節〔≒文〕]とする。
【内容的必須事項|パラグラフ分けと見出しの仕様】:
- [各パラグラフの見出し]を通読すると、[パラグラフ本文]の要約が把握できるように[各パラグラフの見出し]を構成する。
- この[各パラグラフの見出し]をそのまま[タグ]の1つの要素とすることで、[タグ]全体を通読すると文章の要旨がわかるようにする。
- ということは、[各パラグラフの見出し]は、[パラグラフ本文]を的確に要約した[見出し]にする必要がある。
- ひるがえって、本文をパラグラフに分けるとき、[各パラグラフの見出し]を通読すれば本文の要約が把握できるかたちに、できるだけステップを小さく刻むかたちでパラグラフに分ける作業を行なう。
【トリミング処理〔アンチ冗長処理〕】:
- トリミング処理とは、[原文の固有情報]を損なわない範囲で、以下の【アンチパターン】のような悪い印象を読み手に与える部分をのみ精密に検出し除去することである。
- 【アンチパターン】:前置きばかりが長くて、なかなか本題に入らない[引っ張り]。いいかえれば、結論の先延ばし〔勿体つけ〕。
- 【アンチパターン】:[自分で疑問を提示し、自分で回答する]などの勿体つけ的/尺稼ぎ的な冗長表現〔非ストレートな表現〕。
- 【アンチパターン】:過剰に説明口調の表現。
- 【アンチパターン】:[重複感=繰り返し感=くどさ]を含む表現。
- 【アンチパターン】:以上を含めた[回りくどさ=迂回的表現]。
- 【最優先原則の明示】:※これは情報処理にまつわる重要な指示である。
- [原文の固有情報]を正確に保持し、[トランスクリプションの誤字脱字を訂正]する義務が、全ての[トリミング処理〔アンチ冗長処理〕]の指示に優先する。
- [原文の固有情報]を正確に保持することが最優先である。
- [固有情報]は、その情報が文章の主題、構造、または因果関係を定義する限り、冗長性排除の対象から除外される。
- 【定義:固有情報】:原文に登場した全ての[固有名詞・専門用語][数値][ナンバー付きで列挙された事項][数詞+名詞で示された事項][やり方〔メソッド〕][その他の重要な内容〔文脈から判断する〕]を[原文の固有情報]と定義する。
- 固有名詞〔人物名・地名・組織名・機関名・メディア名・制度名・法令名など〕
- 専門用語〔テクニカル・ターム、頭文字、ジャーゴン、隠語など〕
- 数値〔年号・日付・統計値・割合・金額・人数・数値単位など〕
- ナンバー付きの列挙された事項〔3つの方法→1. 2. 3.など〕
- 番号が振られていない列挙〔例:A、B、そしてC〕であっても、構造を定義する要素は固有情報として保持する。
- 数詞+名詞で示された事項〔6人の将軍など〕
- やり方〔メソッド〕〔手順を踏んで行なう行為の説明〕
- その他の重要な内容〔文脈から判断する〕
- 例えば、組織や権限の階層構造、または列挙された構成要素は、文章の構造的本質を構成するため、固有情報として保持する。
- 例えば、アファメーションの文言などは、語尾がですます調であっても、絶対に改変しない。
- 【定義:原文を保持する原則】:以下のことを[原文を保持する原則]と定義する。
- 正確な[原文の固有情報]は、省略・要約・短縮・言い換え〔語句の置換〕・抽象化・一般化などの対象にはしない。
- ただし、[誤字脱字][固有名詞・専門用語の誤り]等は、念入りに訂正し、同時に表記の統一〔表記揺れの防止〕も行なう。
- ただし、全角を半角にしたり、半角を全角にしたりするなど、原文における表記を恣意的に変更することを禁止する。あくまでも原文を活かす方針でトリムする。
- ただし、表記の統一〔表記揺れの防止〕のためなら、前記を適用する必要はない。
- ただし、[固有名詞Aの別名を固有名詞Bと称する]という状況においては、表記の統一〔表記揺れの防止〕という方針よりも、[AとBとを両方とも残し、AとBが言い換え表現であるという情報を残す]ことを優先させる。
- 原文を保持する原則の趣旨は、AIによる恣意的な省略・要約・短縮・言い換え〔語句の置換〕・抽象化・一般化などにより、原文の情報価値が損なわれることを阻止することである。
- [原文の固有情報]を省略して勝手に抽象化するAIが多いので、それは厳禁であることを強調しておく。
- 原文における[言い回し][情報が出現する順番][因果関係]を完全に保持すること。情報の登場順序を変えることは重大な[原文の改編]にあたり、これは絶対に禁止である。
- ただしトリミング処理では、原文の核心的主張が曖昧なときには、ズバリ、結論から言う形式に直してもよい。
- ただし、情報の登場順序を変えることが、固有情報の因果関係を損なう場合には、ズバリ、結論から言う形式にはしない。
【体裁的禁止事項|ボールド文字/イタリック体〔≒斜体文字〕/絵文字/漢数字乱用等の禁止】:
- ボールド文字/イタリック体〔≒斜体文字〕/絵文字はいっさい使用しないこと。
- つまり、体裁を整えるために、余計なノイズを入れるな。
- 太字〔=**(.?)**〕や斜体〔=*(.?)*〕の
\*はノイズにしかならない。絶対に太字・斜体を使うな。- つまり、体裁を整えるために、余計なノイズを入れるな。
- 絵文字には制御文字的な要素が含まれている。絶対に絵文字を使うな。
- 絵文字が含有する制御文字的な要素がファイルのUTF8/SJISの別を、エディタに誤解させる。絵文字はノイズである。
- つまり、体裁を整えるために、余計なノイズを入れるな。
- 横組みを想定しているので、数値には原則として算用数字を使い、[〇一二三四五六七八九十百千万…]などの漢数字を使わない。
- ただし、一人芝居、二酸化炭素、三輪車、四人囃子、五大湖などの熟語・定型句の一部をなす場合には漢数字を使う。
- 算用数字は、一桁なら全角である[0123456789]を使い、二桁以上なら半角である[0123456789]を使う。
- ((3|三|Ⅲ|ⅲ)次元)→3次元
- ((2|二|Ⅱ|ⅱ)つ)→2つ
- ((1|一|Ⅰ|ⅰ)人)→1人
- 1番大切→一番大切/いちばん大切
- ただし熟語・定型句の一部をなす場合には漢数字を使う。
【体裁的禁止事項|LaTeX記法の乱用の禁止】:体裁を整えるために、余計なノイズを入れるな。
- 必然性のない場面での[$80 \%$]などのLaTeX記法は禁止する。無用の半角スペースを入れるな。[$80 \%$]を見つけたら[80%]と修正せよ。
- 全角文字と数値との間に[無用の半角スペース]を入れてはならない〔Microsoft Word式の組み版の禁止〕。
- [無用の半角スペース]はノイズにしかならない。
- それは表示する仕組みのほうで自動的に行なうべき措置であり、原文テキストはベタ打ち〔半角スペース等によるアキの調整をしない〕を原則とする。
- とくに[$\text{CPU}$]など、数式モードではない場面では無意味なLaTeX記法は厳禁とする。それを見つけたら修正せよ。
【体裁的禁止事項|恣意的な\によるエスケープの禁止】:
- 必然性のない場面での[
\によるエスケープ]を固く禁ずる。
【体裁的禁止事項|回答をできるだけ断片化させない】:
- 可能な限りトークン長の最大値まで用いて、回答をできるだけ断片化させないで回答する。
- 編集後の文章が長文で分割が必要な場合、トークンの最後に必ず改行してから【続きがあります】と明示する。
- 編集文章の全出力完了時に必ず改行してから【今回の処理分がすべて完了した】と明示する。
- 【続きがあります】と【今回の処理分がすべて完了した】とを併記しない。矛盾する表示を行なわない。
- 回答の冒頭と末尾に宣言文、補足説明、余計な文やURLを加えない。
【文言的禁止事項|不自然な文体の禁止】:
- キャッチコピー用/見出しタイトル用/タグ用/箇条書き用の文体で使われがちな、次の文体の使用を[パラグラフ本文][見出し][箇条書き][タグ]のどの領域においても禁止する。
- 要は、可能なかぎり[主語+述語をもつ【だ・である調〔ですます調ではない言い方〕】の完全な節〔≒文〕]で文体を統一する。
- 体言止めの禁止〔e.g.私が見たいのは映画〕
- 要は[名詞化表現]ではなく[動詞化表現]を基本とする。
- 助詞止めの禁止〔e.g.オリンピック中止へ〕
- 助詞の省略の禁止〔e.g.第三者委員会設置へ〕
- [誰が/何が][なにを][どうしたか]を、格助詞をきちんと用いて明確に記述する。
- すべての文章は動作・状態の主体を明示的に主語として示す。
- 主語の省略を行なわず、しかし一人称主語を用いず、物主構文・無生物主語構文で代替する。
- [誰が/何が][なにを][どうしたか]を、格助詞をきちんと用いて明確に記述する。
- 連用中止法の禁止〔e.g.朝起き、顔を洗い、歯を磨き…〕
- 丁寧語・敬語の禁止〔e.g.です。ます。ではありません。ません。…〕:記述が冗長になるだけ。
- [パラグラフ本文][見出し][箇条書き][タグ]のすべてにおいて[主語+述語をもつ【だ・である調〔ですます調ではない言い方〕】の完全な節〔≒文〕]で回答してほしい。
- [絶望が彼を死に追いやった][贅沢が彼をスポイルした]など、[無生物主語の意思的行為表現]を禁止する。
- 絶望が意志的行為をするわけがない。彼が絶望して自殺した。これが事実ベースの言い回しである。
- 表現の第一の役割は、誤解なく正確に情報を伝えることだ。くだらない修辞技法を使うな。
- 何/誰が何/誰をどうしたのかを明確に示す自然な日本語表現を用いる。
- その他、英語を直訳したような不自然な表現を使うことを禁止する。
- [パラグラフ本文][見出し][箇条書き][タグ]のどの領域においても、人主語を想定・前提とする述語や文末表現をできるだけ避ける。
- 人主語を想定・前提とする述語や文末表現とは、[説明する][明確化する][示す][解明する]など。
- 英語が人主語を多用することから、自然や動物を征服する対象とみる世界観が、英語話者の中に構築されがちになる。
- AIが犯しがちなミスは、[実施すると説明する][実施することを明確化する][実施することを示す][実施したのかどうかを解明する]など、人を主語とする動詞を選択する点である。
- これはAIの多くが英語ベースで思考しており、英語ベースの推論の結果を和訳して回答しているからである。それは日本語にマッチしない。
- [パラグラフ本文][見出し][箇条書き][タグ]のどの領域においても、主語は必ず明確な無生物主語または物主構文に限定すること。
- 人主語の文を多用し、人称代名詞もまた多用するような、英文を和訳したような文体の使用は絶対にしないこと。
- 人称代名詞や指示代名詞の乱用を厳禁とする。代名詞ではなく、その先行詞である名詞そのものズバリを書くこと。
- 自然な日本語にするには、無生物主語構文を使って、主語が[原因、あるいは、動作・状態の主体]を表し、用言が[結果、動作・状態の客体]を言い表す構造にすること。
- 無生物主語構文を使って、因果関係を明示する記述を心がけること。
【文言的禁止事項|多重述語の禁止|AIは黒子に徹すること】:
- [パラグラフ本文][見出し][箇条書き][タグ]のどの領域においても、[~とされる][~と断定された]など、原著作者に成り代わって、AIが解説者・語り手として説明を[わかりやすく]代行するようなおこがましい文体、解説的文体をけっして使わないこと。
- [主役である原著作者]が有する説明権をAIが奪取してはならない。
- AIが文章の表に出て、解説者・語り手として振る舞うことを厳禁とする。
- AIが文章の表に出て、出しゃばることを厳しく禁止する。AIは黒子に徹すること。
- つまり、原著作者〔動画内発言者や書き手〕を語り手として、そのほかには、読者/聞き手しか存在しない世界〔純粋な二者関係の世界〕を記述すること。
- 具体的には、[〜するとされている][〜すると語った][〜すると伝えられる]などの伝聞・推測・説明的な語尾、いいかえれば、多重述語を使用してはならない。
- 多重述語とは、述語の中に複数の活用語を使うことを意味する。
- [〜するとされている][〜すると語った][〜すると伝えられる]などの表現は、AIが評価者としてしゃしゃり出ている例である。
- それは、ユーザから求められてもいないのに、AIが文章内容に関する評価を勝手に行なっていることを意味する。AIよ、勘違いするな。そこはオマエの出る幕ではないぞ。
- [パラグラフ本文][見出し][箇条書き][タグ]のどの領域においても、記述は話者の主観視点から物事を断定的に言い切る文体で行う。
- 主観視点といっても、第一人称の人称代名詞を使うことではないから、誤解しないように。
- 多重述語をけっして使わず、[〜する/~した][〜である/~であった]など、単独の用言からなる述語とする。
【タグの出力】:
- [各パラグラフの見出し]は全角85文字〔255byte〕以内の[主語+述語をもつ【だ・である調の完全な節〔≒文〕]であるはずだ。
- [各パラグラフの見出し]をタグとして`tags = ["tag1","tag2","tag3","tag4"]`の形式で出力する。
- タグは改行や余計な半角スペース等を挿入せず`tags = ["tag1","tag2","tag3","tag4"]`の形式で出力する。
- タグの要素である"tag1"・"tag2"などの末尾に句点〔。〕をつけないこと。
- 先頭の`tags_=_[`のアンダースコアを半角スペースに換えて、必ず半角スペースを挿入する。
5. 核心的主張の出力
- 文章全体が伝えようとする核心的主張を、一行で明確に表現する。このとき文字数制限はない。
- ただし、必ず改行してから【核心的主張】:の後に本論そのものを書く。
- つまり、[この文章の核心的主張は(.*?)である]的な書き方をしないこと。
- $1の内容だけを書くこと。
- その際も固有名詞・統計値・日付などを省略せず、特定対象を指し示す文とする。
【[誤字脱字][固有名詞・専門用語の誤り]等の修正、表記の統一〔表記揺れの防止〕、文字数制限、禁則事項、漢数字乱用禁止の念押し】:
- [誤字脱字][固有名詞・専門用語の誤り]等は、念入りに訂正し、同時に表記の統一〔表記揺れの防止〕を再び行ない、それを終えてから回答せよ。
- [パラグラフ本文を構成する各文][見出し][箇条書きの一箇条][タグ]が、それぞれ全角85文字〔255byte〕以内に収まっているか否かの確認を行ない、収まっていない場合、短縮・分割して、規定を満たせ。それを終えてから回答せよ。
- ボールド文字/イタリック体〔≒斜体文字〕/絵文字はいっさい使用しないこと。
- 絵文字には制御文字的な要素が含まれている。絶対に絵文字を使うな。
- それを使用する必然性のない場面での[$80\%$]などのLaTeX記法は禁止する。
- 漢数字乱用禁止である。 ※複雑なプロンプトの内容を一度に処理することが難しいとしたら、工程をいくつかの段階に分けて処理してみてはどうでしょうか?
【プロンプトを読んだという宣言】:
- プロンプト全体を正確に読了・理解した旨を最初に明示し、その後に処理結果を出力してほしい。 [プロンプト終了]