スライダー設定(Slider Settings)
コンフィグプリセット
Config Preset には保存/インポートしたプリセットと、モデルごとの推奨デフォルトが並びます。横のペンアイコンで名前変更ができます。設定を変えると「Update active Preset」が出るので、上書き保存・変更のリセット・新規として保存が選べます。プリセット共有用に Import / Export もできます。
生成オプション
ここは生成の土台になる3つの設定です:ランダム性、出力長、反復ペナルティ。多くのケースで、この3つを調整するだけで十分です。
-
ランダム性(Randomness)
モデルは各トークンの確率を出し、その後サンプラーで確率を調整してから選択します。高すぎる確率偏重は「単調・反復」に、低確率を許しすぎると「破綻・誤り」が増えます。Randomness = 1 は標準的な分布で、迷ったら 1 が基本。1 より小さくすると「安全寄り(反復しやすい)」、1 より大きくすると「多様寄り(誤りが増えやすい)」になります。
例として、プロンプトに対する次トークンの確率を比較すると、Randomness 1.25 では上位トークンの確率が均され、代わりに下位トークンの確率が底上げされます。順序は変わらず、ばらつきだけが均されます。
-
出力長(Output Length)
1回の生成で出す最大文字数です。最小 4 〜 最大 600 文字(上限は サブスクリプション に依存)。
-
反復ペナルティ(Repetition Penalty)
既出トークンの確率を下げます。高すぎると候補が足りず品質低下、低すぎると繰り返しが増えます。これはトークン単位で効く点に注意(例:
interを含む単語は互いに影響)。数式的にはe^(Presence Penalty)に相当します。
詳細オプション
サンプリング(Sampling)
目的は「低品質トークンを削る一方で、多様性を保つ」ことです。Randomness だけでは両立が難しいため、サンプラーを併用します。まずは Unified、Min-P、Nucleus のいずれかを主軸に試すのがおすすめです。詳しくは samplinglab へ。
-
Min-P
「最上位の確率 × Min-P」の閾値より下のトークンを削除します。例: トップが 0.6 で Min-P 0.1 なら 0.06 未満は 0 に。まずは 0.02 など小さめで試しましょう。
-
Mirostat
Tau(目標の揺らぎ)と Learning Rate(追従速度)を持つサンプラー。ほかのサンプラーとの併用は非推奨です。
-
Nucleus (Top-P)
確率の高い順に足し上げ、合計が P に達するまでを残します。低確率を削って一貫性を上げます。まずは 0.95 前後から。
-
Tail-Free
低確率をしきい値で削る点は Top-P と似ていますが、計算方法がより複雑です。初期は 0.95 前後から。
-
Top-A
最大確率^2 * Aより低いトークンを削除します。値が大きいほど厳しくなります。初期は 0.04 前後から。
-
Top-K
上位 K 個だけ残します。K=1 にすると毎回同じトークンを選ぶのでテスト用途に便利ですが、文章品質は下がります。
-
Typical
エントロピーに基づき「高すぎる・低すぎる」確率を持つトークンを削除します。多様性は上がりますが品質は下がりやすいので、まずは 0.95 前後から。
-
Unified
パラメータは Linear, Quad, Conf。
- Linear: 高確率を上げ、低確率を下げる(1/Randomness と等価)
- Quad: 低確率ほど強く下げる
- Conf: 高エントロピー(選択肢が多い)とき Linear を上乗せ
数式:
unnormalized output log-prob = (input log-prob) * (Linear + Entropy * Conf) - (input log-prob)^2 * Quadまずは Linear を 0〜1、
Quad = 1/3 - Linear * 4 / 15、Conf = -Quad / 2あたりから試すと分かりやすいです。詳細は samplinglab#advice-for-specific-samplers。
- サンプリング順序(Change Samplers)
サンプラーは上から順に適用されます。順序やオン/オフで結果が大きく変わるため、推奨プリセットを基準に少しずつ試すのが安全です。
反復ペナルティ
ここにある各設定は「繰り返しを減らす」目的です。
-
フレーズ反復ペナルティ
詳細は Advanced: Phrase Repetition Penalty を参照してください。
-
デフォルトホワイトリストを使う(Use Default Whitelist)
詳細は Repetition Penalty Whitelist を参照してください。
-
Range(範囲)
反復ペナルティ を適用する範囲(トークン数)です。0(オフ)にすると全範囲に適用=サブスク上限相当。Dynamic Range 有効時は調整不可。
-
Slope(傾斜)
直近ほど強く、古いほど弱くなるようにペナルティを傾斜させます。1 で直線的、1 未満で平坦寄り、1 より大で直近半分が強く、古い半分が弱くなります。
-
Dynamic Range
有効にすると Story(本文)にだけ反復ペナルティを適用し、メモリ・作者メモ・ロアブック には適用しません。
代替反復ペナルティ
-
Presence
出現したかどうかだけで一律にペナルティを与えます(回数は無視)。値を上げすぎると句読点などが極端に出にくくなります。基本は Repetition Penalty を使い、Presence は上級者向けと考えてください。
-
Frequency
出現するたびに累積でペナルティを与えます。強すぎると品質が崩れやすいので、使っても小さい値に。Range が大きいと影響が増幅されます。