當(dāng)前位置：首頁(yè) > news >正文

wordpress下載主題demo北京網(wǎng)站優(yōu)化培訓(xùn)

news 2025/7/5 3:18:42

wordpress下載主題demo,北京網(wǎng)站優(yōu)化培訓(xùn),傻瓜做網(wǎng)站用什么軟件,網(wǎng)站開(kāi)發(fā)詳細(xì)流程機(jī)器學(xué)習(xí)筆記之優(yōu)化算法——梯度下降法在凸函數(shù)上的收斂性引言回顧：收斂速度：次線性收斂二次上界引理梯度下降法在凸函數(shù)上的收斂性收斂性定理介紹證明過(guò)程引言本節(jié)將介紹梯度下降法在凸函數(shù)上的收斂性。回顧： 收斂速度：次…

機(jī)器學(xué)習(xí)筆記之優(yōu)化算法——梯度下降法在凸函數(shù)上的收斂性

引言
- 回顧：
- - 收斂速度：次線性收斂
  - 二次上界引理
- 梯度下降法在凸函數(shù)上的收斂性
- - 收斂性定理介紹
  - 證明過(guò)程

引言

本節(jié)將介紹梯度下降法在凸函數(shù)上的收斂性。

回顧：

收斂速度：次線性收斂

關(guān)于次線性收斂，分為兩種判別類型： $\mathcal R$ -次線性收斂與 $\mathcal Q$ -次線性收斂。而次線性收斂的特點(diǎn)是：隨著迭代次數(shù)的增加，相鄰迭代步驟產(chǎn)生的目標(biāo)函數(shù)結(jié)果 $f(x_k),f(x_{k+1})$ ，其差異性幾乎完全相同：
$\mathop{\lim}\limits_{k \Rightarrow \infty}\frac{||x_{k+1} - x^*||}{||x_k - x^*||} = 1$
例如：如果數(shù)值解 $x_k$ 的目標(biāo)函數(shù)結(jié)果 $f(x_k)$ 與目標(biāo)函數(shù)最優(yōu)解 $f^*$ 之間的差異性 $f(x_k) - f^*||$ 與迭代次數(shù) $k$ 存在如下函數(shù)關(guān)系 $\mathcal G(k)$ ：
$||f(x_k) - f^*|| \leq \mathcal G(k) = \frac{1}{k}$
當(dāng) $k$ 充分大時(shí)， $f(x_k),f(x_{k+1})$ 與 $f^*$ 之間差異性的比值表示如下：
$\mathop{\lim}\limits_{k \Rightarrow \infty} \frac{||f(x_{k+1}) - f^*||}{||f(x_k) - f^*||} = \mathop{\lim}\limits_{k \Rightarrow \infty} \frac{k}{k+1} = 1$
也就是說(shuō)：雖然隨著 $k$ 的增加， $f(x_k)$ 在減小;但相鄰迭代結(jié)果 $f(x_k),f(x_{k+1})$ 之間的差異性幾乎可以忽略不計(jì)。那么稱這種收斂速度為次線性收斂。
準(zhǔn)確的說(shuō)，是 $\Rightarrow 0$ 的次線性收斂：
$\mathop{\lim}\limits_{k \Rightarrow \infty} \{f(x_k)\} \Rightarrow \mathop{\lim}\limits_{k \Rightarrow \infty} \mathcal G(k) = 0$

二次上界引理

關(guān)于二次上界引理的描述表示如下：如果函數(shù) $f(\cdot)$ 可微，并對(duì)應(yīng)梯度函數(shù) $\nabla f(\cdot)$ 滿足利普希茲連續(xù)，則函數(shù) $f(\cdot)$ 存在二次上界。即：
$\forall x,y \in \mathbb R^n \Rightarrow f(y) \leq f(x) + [\nabla f(x)]^T (y - x) + \frac{\mathcal L}{2}||y - x||^2$
而二次上界引理的作用是：可以通過(guò)該引理，得到最優(yōu)步長(zhǎng)上界的最小值：

假設(shè) $x$ 固定，令 $\begin{aligned}\phi(y) = f(x) + [\nabla f(x)]^T (y - x) + \frac{\mathcal L}{2}||y - x||^2 \end{aligned}$ ，通過(guò)選擇合適的 $y_{min}$ ，使 $\phi(y)$ 達(dá)到最小值：
$y_{min} = \mathop{\arg\min}\limits_{y \in \mathbb R^n} \phi(y)$
令 $\nabla \phi(y) \triangleq 0$ ，有：
$y_{min} = x + \frac{1}{\mathcal L} \cdot [- \nabla f(x)]$
其中 $\nabla f(x)$ 即 $\mathcal P_k$ ，也就是最速下降方向；而 $\begin{aligned}\frac{1}{\mathcal L}\end{aligned}$ 則是最優(yōu)步長(zhǎng)的上確界：
$\leq \phi(y_{min}) = \mathop{\min}\limits_{y \in \mathbb R^n} \phi(y)$
也就是說(shuō)：
- 在沒(méi)有二次上界引理的約束下，步長(zhǎng) $\alpha_k$ 的選擇在其定義域內(nèi)沒(méi)有約束： $+\infty)$ ；
- 經(jīng)過(guò)二次上界引理的約束后，步長(zhǎng) $\alpha_k$ 的選擇從原始的 $(0,+\infty)$ 約束至 $\begin{aligned}\left(0,\frac{1}{\mathcal L}\right]\end{aligned}$ 。

延伸：關(guān)于區(qū)間 $\begin{aligned}\left(0,\frac{1}{\mathcal L}\right]\end{aligned}$ 可以模糊地認(rèn)為滿足 $\text{Armijo}$ 準(zhǔn)則。關(guān)于步長(zhǎng)變量 $\alpha$ 的函數(shù) $\phi(\alpha) = f(x_{k+1})$ 中，當(dāng) $\alpha \in \begin{aligned}\left(0,\frac{1}{\mathcal L}\right]\end{aligned}$ 時(shí)，等價(jià)于：存在一條直線 $\mathcal L(\alpha)$ ，以該直線作為劃分邊界對(duì)應(yīng) $\alpha$ 的范圍正好是 $\begin{aligned}\left(0,\frac{1}{\mathcal L}\right]\end{aligned}$ ：
吐槽：實(shí)際上用這張圖是不太合理的，因?yàn)橄旅娴膱D對(duì)應(yīng)的 $f(\cdot)$ 更加復(fù)雜，二次上界約束的范圍僅僅在下面 $\alpha$ 軸的綠色實(shí)線部分，但很明顯，在該函數(shù)中，存在更優(yōu)質(zhì)的 $\alpha$ 結(jié)果。
Armijo準(zhǔn)則與二次上界

梯度下降法在凸函數(shù)上的收斂性

收斂性定理介紹

梯度下降法在凸函數(shù)上的收斂性定理表示如下：

條件：
- 函數(shù) $f(\cdot)$ 向下有界，在定義域內(nèi)可微，并且 $f(\cdot)$ 是凸函數(shù)；
- 關(guān)于 $f(\cdot)$ 的梯度函數(shù) $\nabla f(\cdot)$ 滿足利普希茲連續(xù)；
- 梯度下降法迭代過(guò)程中步長(zhǎng) $\alpha_k(k=1,2,3,\cdots)$ 有明確的約束范圍： $\begin{aligned}\alpha_k \in \left(0,\frac{1}{\mathcal L} \right]\end{aligned}$ ；
結(jié)論：數(shù)值解序列 $\{x_{k}\}_{k=0}^{\infty}$ 對(duì)應(yīng)的目標(biāo)函數(shù)結(jié)果 $\{f(x_k)\}_{k=0}^{\infty}$ 以 $\begin{aligned}\mathcal O \left(\frac{1}{k}\right)\end{aligned}$ 收斂于目標(biāo)函數(shù)最優(yōu)解 $f^*$ 。
其中 $\begin{aligned}\mathcal O \left(\frac{1}{k}\right)\end{aligned}$ 表示以 $\begin{aligned}\mathcal G(k) = \mathcal C \cdot \frac{1}{k}\end{aligned}$ 的次線性收斂級(jí)別的收斂速度( $\mathcal C$ 為常數(shù))。

證明過(guò)程

根據(jù)二次上界引理，依然將 $x$ 設(shè)為上一次迭代的數(shù)值解 $x_{i-1}$ ，對(duì)應(yīng)的 $y$ 為當(dāng)前迭代步驟的數(shù)值解 $x_i$ 。由于是梯度下降法，因而在線搜索方法的基礎(chǔ)上，將方向 $\mathcal P_i$ 表示為最速下降方向 $\nabla f(x_{i-1})$ 步長(zhǎng)依然使用步長(zhǎng)變量 $\alpha$ 進(jìn)行表示：
$x_i - x_{i - 1} = -\nabla f(x_{i-1}) \cdot \alpha$
將二次上界不等式進(jìn)行相應(yīng)替換：
將上式代入~
$f(x_i) \leq f(x_{i-1}) + [\nabla f(x_{i-1})]^T [-\nabla f(x_{i-1}) \cdot \alpha] + \frac{\mathcal L}{2} ||-\nabla f(x_{i-1}) \cdot \alpha||^2$
觀察不等式右側(cè)，可以繼續(xù)化簡(jiǎn)：

將內(nèi)積寫(xiě)作 $||\cdot||^2$ 的形式。
$\nabla f(x_{i-1}) \cdot \alpha||^2 = ||\nabla f(x_{i-1}) \cdot \alpha||^2$ ,這里消掉一個(gè)負(fù)號(hào);
由于 $\begin{aligned}\alpha \in \left(0,\frac{1}{\mathcal L}\right]\end{aligned}$ ,是一個(gè)標(biāo)量，直接將其提到范數(shù)外側(cè)。
$\mathcal I_{right} = f(x_{i-1}) - \alpha \cdot ||\nabla f(x_{i-1})||^2 + \frac{\mathcal L}{2} \cdot \alpha^2 \cdot ||\nabla f(x_{i-1})||^2$

由 $\begin{aligned}\alpha \leq \frac{1}{\mathcal L}\end{aligned}$ 可知： $\begin{aligned}\mathcal L \leq \frac{1}{\alpha} \end{aligned}$ 。將該式代入到上式中：
消掉分母中的 $\alpha$ ，并于前面的項(xiàng)結(jié)合。
$\begin{aligned} \mathcal I_{right} & \leq f(x_{i-1}) - \alpha \cdot ||\nabla f(x_{i-1})||^2 + \frac{1}{2 \alpha} \cdot \alpha^2 \cdot ||\nabla f(x_{i-1})||^2 \\ & = f(x_{i-1}) - \frac{\alpha}{2} \cdot ||\nabla f(x_{i-1})||^2 \end{aligned}$
基于梯度下降法，使用二次上界引理，可以得到 $f(x_{i-1})$ 與 $f(x_i)$ 之間存在如下關(guān)聯(lián)關(guān)系：
$f(x_i) \leq f(x_{i-1}) - \frac{\alpha}{2} \cdot ||\nabla f(x_{i-1})||^2\quad i=1,2,3,\cdots$
根據(jù)凸函數(shù)的性質(zhì)，必然有：函數(shù) $f(\cdot)$ 任一位置的切線， $f(\cdot)$ 均在該切線上方。見(jiàn)下圖：
由于條件: $f(\cdot)$ 向下有界,因此，該函數(shù)必然’開(kāi)口向上‘。

其中紅色點(diǎn) $x^*,f^*)$ 表示最優(yōu)點(diǎn)，以上一次迭代產(chǎn)生的 $x_{i-1}$ 為切點(diǎn)做一條切線，必然有 $x^*$ 在該切線函數(shù)上的函數(shù)值 $\leq f^*$ 。 $f^{'}$ 表示如下：
$f(x_{i-1}) - [\nabla f(x_{i-1})]^T (x_{i-1} - x^*) \leq f^*$
移項(xiàng)，從而有：
$f(x_{i-1}) \leq f^* + [\nabla f(x_{i-1})]^T (x_{i-1} - x^*)$
將上式代入，有：
$\mathcal I_{right} \leq \underbrace{f^* + [\nabla f(x_{i-1})]^T (x_{i-1} - x^*)}_{替換f(x_{i-1})}- \frac{\alpha}{2} \cdot ||\nabla f(x_{i-1})||^2$
為了湊平方項(xiàng)，將上式調(diào)整至如下形式：
將 $\begin{aligned}-\frac{\alpha}{2}\end{aligned}$ 湊出 $\alpha^2$ ,其他項(xiàng)跟隨變化。
$\mathcal I_{right} \leq -\frac{1}{2 \alpha} \left\{\alpha^2 ||\nabla f(x_{i-1})||^2 - 2\alpha \cdot [\nabla f(x_{i-1})]^T(x_{i-1} - x^*)\right\}$
對(duì)大括號(hào)內(nèi)的項(xiàng)進(jìn)行配方：
$\begin{aligned} \mathcal I_{right} & \leq f^* - \frac{1}{2 \alpha} \left\{\underbrace{\alpha^2 ||\nabla f(x_{i-1})||^2 - 2\alpha \cdot [\nabla f(x_{i-1})]^T(x_{i-1} - x^*) + ||x_{i-1} - x^*||^2 }_{平方項(xiàng)}- ||x_{i-1} - x^*||^2\right\} \\ & = f^* - \frac{1}{2\alpha} \left [||\alpha \cdot \nabla f(x_{i-1}) - (x_{i-1} - x^*)||^2 - ||x_{i-1} - x^*||^2\right] \end{aligned}$
觀察中括號(hào)內(nèi)第一項(xiàng)： $||\alpha \cdot \nabla f(x_{i-1}) - (x_{i-1} - x^*)||^2$ ，由于是范數(shù)的平方項(xiàng)，因而在范數(shù)內(nèi)部添加一個(gè)負(fù)號(hào)不會(huì)影響其值的變化：
$||\alpha \cdot \nabla f(x_{i-1}) - (x_{i-1} - x^*)||^2 = ||x_{i-1} - \alpha \cdot \nabla f(x_{i-1}) - x^*||^2$
從迭代角度觀察： $x_{i-1} - \alpha \cdot \nabla f(x_{i-1}) = x_{i}$ ，從而上式可繼續(xù)化簡(jiǎn)為：
提一個(gè)負(fù)號(hào)，調(diào)換一下位置。
$\begin{cases} ||\alpha \cdot \nabla f(x_{i-1}) - (x_{i-1} - x^*)||^2 = ||x_i - x^*||^2 \\ \quad \\ \begin{aligned} \mathcal I_{right} & \leq f^* - \frac{1}{2\alpha} \left[||x_i - x^*||^2 - ||x_{i-1} - x^*||^2\right] \\ & = f^* + \frac{1}{2\alpha} \left[||x_{i-1} - x^*||^2 - ||x_i - x^*||^2\right] \end{aligned} \end{cases}$

至此，可以得到如下不等式結(jié)果：
$f(x_i) - f^* \leq \frac{1}{2\alpha}(||x_{i-1} - x^*||^2 - ||x_i - x^*||^2)$
觀察：不等式左側(cè)描述的意義是：當(dāng)前迭代步驟的目標(biāo)函數(shù)結(jié)果 $f(x_i)$ 與最優(yōu)解 $f^*$ 之間的偏差。從初始化數(shù)值解 $x_0$ 開(kāi)始，我們會(huì)得到一系列的不等式結(jié)果：
$\begin{cases} \begin{aligned} f(x_1) - f^* & \leq \frac{1}{2\alpha} (||x_0 - x^*||^2 - ||x_1 - x^*||^2) \\ f(x_2) - f^* & \leq \frac{1}{2\alpha} (||x_1 - x^*||^2 - ||x_2 - x^*||^2) \\ & \vdots \\ f(x_k) - f^* & \leq \frac{1}{2\alpha} (||x_{k-1} - x^*||^2 - ||x_k - x^*||^2) \end{aligned} \end{cases}$
將這些不等式對(duì)應(yīng)位置相加，有：

等式右側(cè)的中間項(xiàng)都被消掉了~
因?yàn)?/code> $||x_k - x^*||^2 \geq 0$ 恒成立，從而消掉含變量的項(xiàng)。 $\sum_{i=1}^k [f(x_i) - f^*] \leq \frac{1}{2\alpha}(|||x_0 - x^*||^2 - ||x_k - x^*||^2) \leq \frac{1}{2 \alpha} ||x_0 - x^*||^2$

 
關(guān)于我們要證的 $f(x_k) - f^*||$ ，可以表示為如下形式： 
由于優(yōu)化問(wèn)題的收斂性，必然有： $f(x_{k}) \leq f(x_{k-1})\leq \cdots\leq f(x_1)$ ,從而每一項(xiàng): $||f(x_k) - f^*|| \leq ||f(x_{k-1}) - f^*|| \leq \cdots \leq ||f(x_1) - f^*||$ ,從而有: $\begin{aligned}\sum_{i=1}^k[f(x_k) - f^*] \leq \sum_{i=1}^{k} [f(x_i) - f^*]\end{aligned}$ 。
將上式結(jié)果帶入~ 
 $f(x_k) - f^* = \frac{1}{k} \sum_{i=1}^{k}[f(x_k) - f^*] \leq \frac{1}{k} \sum_{i=1}^{k}[f(x_i) - f^*] \leq \frac{1}{k} \left[\frac{1}{2\alpha}||x_0 - x^*||^2\right]$  
觀察： $\begin{aligned}\left[\frac{1}{2\alpha}||x_0 - x^*||^2\right]\end{aligned}$ 中 $\begin{aligned}\alpha \in \left(0,\frac{1}{\mathcal L} \right] \end{aligned}$ ， $x_0,x^*$ 都是確定的常數(shù)，因而該項(xiàng)可視作常數(shù) $\mathcal C$ 。最終有：
  $f(x_k) - f^* \leq \frac{1}{k} \cdot \mathcal C$ 
 我們可以令 $\begin{aligned}\mathcal G(k) = \frac{1}{k} \cdot \mathcal C\end{aligned}$ ，可以看出：它就是一個(gè)級(jí)別為 $\begin{aligned}\frac{1}{k}\end{aligned}$ 的次線性收斂。 
相關(guān)參考：
 【優(yōu)化算法】梯度下降法-凸函數(shù)的收斂性


查看全文


http://www.risenshineclean.com/news/39232.html



相關(guān)文章：

網(wǎng)站建設(shè)培訓(xùn)業(yè)務(wù)心得社群運(yùn)營(yíng)


常州做網(wǎng)站多少錢(qián)網(wǎng)站推廣的作用在哪里


做淘寶網(wǎng)站用什么軟件小升初最好的補(bǔ)課機(jī)構(gòu)排行榜


網(wǎng)站開(kāi)發(fā)教程免費(fèi)知識(shí)付費(fèi)小程序搭建


網(wǎng)站設(shè)計(jì)網(wǎng)站維護(hù)電子商務(wù)網(wǎng)店運(yùn)營(yíng)推廣


河源網(wǎng)站建設(shè)武漢百度推廣公司


用代碼做網(wǎng)站鄭州百度seo


調(diào)查網(wǎng)站賺錢(qián)市場(chǎng)營(yíng)銷(xiāo)圖片高清


phpcms v9做網(wǎng)站電商運(yùn)營(yíng)基本知識(shí)


網(wǎng)站頭像有啥做會(huì)清晰網(wǎng)站維護(hù)合同


分類信息網(wǎng)站系統(tǒng)cms口碑營(yíng)銷(xiāo)的優(yōu)缺點(diǎn)


鲅魚(yú)圈做網(wǎng)站網(wǎng)工資頁(yè)多少錢(qián)一個(gè)月百度官方下載安裝


wordpress 做wiki手機(jī)優(yōu)化軟件排行


網(wǎng)站開(kāi)發(fā)流程書(shū)籍上海百網(wǎng)優(yōu)seo優(yōu)化公司


武漢南亞建設(shè)監(jiān)理有限公司網(wǎng)站seo優(yōu)化的內(nèi)容有哪些


蘭州做高端網(wǎng)站禁止搜索引擎收錄的方法


網(wǎng)站怎么做dwcs6自己做網(wǎng)站的軟件


網(wǎng)站怎樣設(shè)計(jì)網(wǎng)址深圳英文網(wǎng)站推廣


杭州富陽(yáng)網(wǎng)站建設(shè)公司現(xiàn)在如何進(jìn)行網(wǎng)上推廣


昆明網(wǎng)站搭建公司百度客服24小時(shí)電話人工服務(wù)


郴州網(wǎng)上報(bào)名小學(xué)系統(tǒng)登錄某一網(wǎng)站seo策劃方案


ps網(wǎng)站輪播圖怎么做app軟件推廣平臺(tái)


php網(wǎng)站系統(tǒng)培訓(xùn)機(jī)構(gòu)最新消息


西寧做網(wǎng)站是什么網(wǎng)店如何推廣


智能建站平臺(tái)z微信如何投放廣告


個(gè)人網(wǎng)站開(kāi)發(fā)總結(jié)文檔百度推廣最近怎么了


網(wǎng)站如何發(fā)布和推廣百度推廣效果不好怎么辦


專門(mén)做店面裝修設(shè)計(jì)的網(wǎng)站關(guān)鍵詞優(yōu)化最好的方法


網(wǎng)站怎么做搜索欄seo怎么學(xué)


做網(wǎng)站一般哪里找長(zhǎng)春網(wǎng)站建設(shè)解決方案

中文亚洲精品无码_熟女乱子伦免费_人人超碰人人爱国产_亚洲熟妇女综合网