論文:EmoNAVI v3.6 における自律的最適化の理論的裏付け 〜高次モーメント近似と動的距離推定による Regret Bound の改善〜 1. 緒言 ディープラーニングの最適化において、学習率の動的調整は収束性能を決定づける最重要課題である。 従来の Adam や AMSGrad は勾配の 1次・2次モーメントを利用するが、局所的な損失地形の急峻さ (曲率) や最適解までの距離 D を直接推定する機能は限定的であった。 本稿では、EmoNAVI v3.6 が導入した「感情スカラー σt​」および「emoDrive」機構が、数学的には高次モーメントの近似と D-adaptation (および COCOB 理論) のオンライン実装 (Defazio & Mishchenko, 2023) として機能し、極めて低いハイパーパラメータ感度と頑健な収束性を両立することを証明する。 2. 実装の数学的再定義と高次モーメント近似 2.1 Multi-EMA による proxy 指標の生成 EmoNAVI は 3 段階の指数移動平均 (short, medium, long) を保持する。 EMAshort,t​=(1−αs​)EMAshort,t−1​+αs​Lt​ ここで、異なる平滑化係数 α を持つ EMA の差分 ΔEMA=EMAlong​−EMAshort​ を取る操作は、損失関数 L の時間軸における高次微分の近似に相当する。 3次・4次モーメントの近似: ΔEMA は勾配の変動率 (曲率の変化) を捉える。 5次モーメントの履歴化: 感情スカラー σt​=tanh(ΔEMA/scale) は、これらの高次の情報を [−1,1] に非線形圧縮した統計量であり、これを更新式に再帰的に含めることで、長長期的な地形の「滑らかさ」をパラメータ更新に反映させている。 3. emoDrive による動的距離推定 (D-adaptation) 3.1 D-推定のオンライン近似 D-adaptation 系アルゴリズムは、初期点からの最適距離 D を推定し、学習率を D に比例させる。EmoNAVI において、この D の役割を果たすのが emoDrive である。 加速ゾーン (信頼度高) : σt​ が安定している領域では、現在の探索方向が正しい (最適解 w∗ への直線経路上にある) と判断し、有効ステップサイズを最大 8 倍以上にブーストする。これは推定距離 D^ を指数的に増大させる操作と等価である。 抑制ゾーン (信頼度低) : ∣σt​∣>0.75 となる急変時には、O(1−∣σt​∣) のオーダーで更新を抑制する。これは局所リプシッツ定数 Lt​ の急増に対する安全装置であり、COCOB における「負け越した際の Betting 額のリセット」(Orabona & Tommasi, 2017)に相当する。 ここでいう高次momentは、3次:歪度 (skewness) 、4次:尖度 (kurtosis) 、5次:時間方向の“変動の変動” ※ 高次モーメントは単一のステップによってではなく「時間的積分」によって形成される。 4. 収束性の証明と Regret 解析 4.1 仮定と性質 L-smooth 性: 損失関数 f は局所リプシッツ定数 Lt​ を持ち、∥∇f(w)∥≤G である。 emoDrive の有界性: 00.75 この領域では emoDrive = coeff となり、coeff = 1.0 - abs(scalar) と定義される。 ∣σt​∣∈(0.75,1.0) より、この領域の最小値 Blow​ は以下を満たす。 0