什么是神經網絡?用代碼示例解析其工作原理|每日播報
發稿時間:2023-06-23 17:24:36 來源: 博客園
【資料圖】
本文由gpt4輔助撰寫(gptschools.cn)神經網絡是一種模仿人腦神經元工作原理的計算模型,用于實現機器學習和人工智能系統。它由一系列相互連接的神經元(也稱為節點或單元)組成,這些神經元組織成不同的層。神經網絡通常包括輸入層、一個或多個隱藏層和輸出層。每個節點根據其輸入數據和相應的權重計算輸出值,并通過激活函數進行非線性轉換。 神經網絡可以通過學習和調整權重實現自適應,從而在處理復雜問題(如圖像識別、自然語言處理和游戲策略等)時具有很高的靈活性。訓練神經網絡的過程通常包括使用大量輸入數據和期望輸出,計算損失函數(用于衡量網絡輸出與期望輸出之間的差距),并使用優化算法(如梯度下降法)調整權重以最小化損失。 神經網絡是深度學習的核心組成部分,深度學習模型通常包含多個隱藏層,從而能夠學習更復雜數學表示和抽象概念。?下面以一個簡單的神經網絡(用于解決 XOR 問題)為例,說明神經網絡中的各個概念。該神經網絡示例中,包含一個輸入層(2個節點),一個隱藏層(2個節點)和一個輸出層(1個節點)。輸入輸出層之間以及隱藏層與輸出層之間的所有節點均相互連接。激活函數為 Sigmoid 函數。上述神經網絡的python實現如下:
import numpy as np# Sigmoid 激活函數def sigmoid(x): return 1 / (1 + np.exp(-x))# 使用 sigmoid 導數進行非線性變換以及反向傳播計算梯度def sigmoid_derivative(x): return x * (1 - x)def mse_loss(y_true, y_pred): return np.mean(np.square(y_true - y_pred))class NeuralNetwork: def __init__(self, input_nodes, hidden_nodes, output_nodes): self.input_nodes = input_nodes self.hidden_nodes = hidden_nodes self.output_nodes = output_nodes self.weights_ih = np.random.rand(self.input_nodes, self.hidden_nodes) - 0.5 self.weights_ho = np.random.rand(self.hidden_nodes, self.output_nodes) - 0.5 self.bias_h = np.random.rand(1, self.hidden_nodes) - 0.5 self.bias_o = np.random.rand(1, self.output_nodes) - 0.5 def feedforward(self, input_data): hidden = sigmoid(np.dot(input_data, self.weights_ih) + self.bias_h) output = sigmoid(np.dot(hidden, self.weights_ho) + self.bias_o) return hidden, output def backward(self, input_data, hidden, output, target_data, learning_rate=0.1): # 計算損失函數的梯度 output_error = target_data - output output_delta = output_error * sigmoid_derivative(output) hidden_error = np.dot(output_delta, self.weights_ho.T) hidden_delta = hidden_error * sigmoid_derivative(hidden) self.weights_ho += learning_rate * np.dot(hidden.T, output_delta) self.weights_ih += learning_rate * np.dot(input_data.T, hidden_delta) self.bias_o += learning_rate * np.sum(output_delta, axis=0) self.bias_h += learning_rate * np.sum(hidden_delta, axis=0) # 根據輸入輸出數據,訓練多輪,更新神經網絡的權重和偏置,最終得到正確的神經網絡參數 def train(self, input_data, target_data, epochs, learning_rate=0.5): for _ in range(epochs): hidden, output = self.feedforward(input_data) self.backward(input_data, hidden, output, target_data, learning_rate)if __name__ == "__main__": # 示例 X = np.array([[0, 0], [0, 1], [1, 0], [1, 1]]) Y = np.array([[0], [1], [1], [0]]) nn = NeuralNetwork(input_nodes=2, hidden_nodes=2, output_nodes=1) print("Before training:") _, output = nn.feedforward(X) print(output) nn.train(X, Y, epochs=2000, learning_rate=0.8) print("After training:") _, output = nn.feedforward(X) print(output) # 計算損失 loss = mse_loss(Y, output) print("Loss:", loss)首先,創建 XOR 問題的輸入和輸出數據集,分別存儲在 NumPy 數組中初始化權重與偏置然后,根據輸入輸出數據,訓練2000輪每輪訓練都會通過反向傳播更新各層的權重和偏置,最終得到正確的神經網絡參數上述簡單示例中,涉及到如下神經網絡基本概念:前向傳播:利用若干個權重系數矩陣W,偏倚向量b來和輸入值向量x進行一系列線性運算和激活運算,從輸入層開始,一層層的向后計算,一直到運算到輸出層,得到輸出結果為值激活函數:(Activation Function)是一種在神經網絡中使用的非線性函數,用于將神經元的累積輸入值轉換為輸出值。激活函數的主要目的是引入非線性特性,使得神經網絡能夠學習并表示復雜的數據模式。如果沒有激活函數,神經網絡將僅僅是一個線性回歸模型,無法處理復雜的問題。反向傳播:核心思想是通過優化權重與偏置,從而逐漸減小預測輸出與真實值之間的差距,提高神經網絡的性能。反向傳播過程開始于計算輸出層的誤差,即預測輸出與實際目標之間的差值。然后,這個誤差將從輸出層向后傳播到隱藏層。為了更新神經網絡中的權重,我們需要計算損失函數相對于每個權重的梯度。我們使用鏈式法則(chain rule)將這些梯度分解為前一層的輸出、當前層的梯度和后一層的梯度。通過這種方式,我們可以得到每個權重的梯度,并用它們更新權重以最小化損失。損失函數:損失函數值在訓練過程中起到的作用是衡量模型預測結果與實際目標值之間的差距。在反向傳播過程中,我們實際上是通過損失函數的梯度來調整神經網絡的權重和偏置,從而使得損失值最小化。在上面的代碼示例中,我們計算了輸出層的誤差(output_error),這個誤差實際上就是損失函數的梯度。這里的損失函數是均方誤差(MSE),計算梯度的公式為:output_error = target_data - output在反向傳播過程中,我們通過該梯度來更新權重和偏置,以使得損失值最小化。因此,損失值在訓練過程中起到了關鍵作用。其中,Sigmoid 函數是一種常用的激活函數,用于神經網絡中對節點輸出進行非線性轉換。Sigmoid 函數的數學表達式如下:
sigmoid(x) = 1 / (1 + e^(-x))其中,x 是輸入值,e 是自然常數(約等于 2.71828)。Sigmoid 函數的輸出值范圍在 0 和 1 之間,具有平滑的 S 形曲線。當輸入值 x 趨向于正無窮大時,函數值接近 1;當輸入值 x 趨向于負無窮大時,函數值接近 0。因此,Sigmoid 函數可以將任意實數輸入映射到 (0, 1) 區間內,使得網絡輸出具有更好的解釋性。此外,Sigmoid 函數的導數也可以方便地用其函數值表示,便于進行梯度下降優化算法。然而,Sigmoid 函數也存在一些問題,例如梯度消失問題。當輸入值過大或過小時,Sigmoid 函數的梯度(導數)接近于 0,導致權重更新非常緩慢,從而影響訓練速度和效果。因此,在深度學習中,有時會選擇其他激活函數,如 ReLU(線性整流單元)等。另外,偏置(bias)的引入是為了增加模型的表達能力。具體來說,在 Sigmoid 激活函數中,偏置的作用如下:調整激活函數的輸出:在神經網絡中,激活函數(如 Sigmoid 函數)用于對節點的線性加權和進行非線性轉換。偏置相當于一個常數值,可以使得激活函數的輸出在整體上向上或向下平移。這樣,激活函數可以在不同區域內保持對輸入的敏感性,提高模型的擬合能力。提高模型的靈活性:加入偏置后,神經網絡可以學習到更復雜的表示。偏置參數使神經網絡能夠在沒有輸入(或輸入為零)時產生非零輸出。如果沒有偏置,即使權重參數不同,神經元在輸入為零時的輸出也將相同。因此,引入偏置為神經網絡提供了額外的自由度,使其能夠更好地擬合復雜的數據。以 Sigmoid 函數為例,一個神經元的輸出可以表示為:output = sigmoid(w1 * x1 + w2 * x2 + ... + wn * xn + b)這里,w1、w2、...、wn 是輸入數據(x1、x2、...、xn)對應的權重,b 是偏置。通過調整偏置 b 的值,可以使 Sigmoid 函數的輸出整體上升或下降,從而改變神經元的激活閾值。這使神經網絡能夠更好地適應不同的數據分布,提高模型的泛化能力。FAQs梯度與函數導數的關系?梯度與導數密切相關,但它們有一些區別。對于單變量函數(即只有一個自變量的函數),梯度就是導數。導數表示該函數在某一點處的切線斜率。對于多變量函數(即有多個自變量的函數),梯度是一個向量,包含了函數在某一點處沿著各個坐標軸方向的偏導數。換句話說,梯度是一個向量,它將多個偏導數組合在一起,描述了多變量函數在各個方向上的變化情況。梯度的方向是函數在該點處變化最快的方向,梯度的大小表示函數在該點處的變化速率。總結一下:對于單變量函數,梯度就是導數。對于多變量函數,梯度是一個包含所有偏導數的向量。 AI Advisor公眾號:?參考什么是神經網絡?深度神經網絡(DNN)
標簽:
- 淮劇《小白楊》深情上演 致敬一代代援疆人的“精神豐碑”
- 寧德時代出資20億元在洛陽成立新公司 經營范圍含電池制造等業務_即時焦點
- 小法:我尊重圖多爾但他不尊重我,溫格觀戰是我給他買的票_今日快看
- 農發行湖南省分行違反金融統計規定被警告并罰款135.4萬元 速讀
- 黃曉明回應為新戲增肥30斤:這是我人生中最快樂的時光 觀速訊
- 每日動態!國家統計局:9月份社會消費品零售總額增長3.0%
- 中國之變|這五年,數字化點亮新生活-每日觀點
- 大行評級丨里昂:上調臺積電目標價至2000新臺幣 維持“高度確信跑贏大市”評級_每日時訊
- 熱消息:內蒙古赤峰農村牧區產權流轉服務中心完成首單交易
- 熱資訊!贛C支持湘C!宜春“老表”跨城應援
- 丹尼-格林:姚明如不傷難以想象,文班或能成為他本該成為的人
- 房產投資的風險與收益權衡?
- 鼎佳精密:10月17日獲融資買入291.41萬元_快資訊
- 財報速遞:達瑞電子2025年前三季度凈利潤2.31億元 每日動態
- 廣州湛建建材有限公司成立 注冊資本10萬人民幣|焦點快播
- 今日熱搜:時空科技擬“跨界”收購 切入半導體存儲賽道
- 當前聚焦:佑駕創新中標1185萬元車路云一體化城市交通融合感知項目
- 中原證券擬實施2025年半年度權益分派,共計派發現金紅利3714.31萬元-當前熱議
- 每日視點!主場戰三鎮賽前,大連英博為隊史首位外援羅伯森舉辦退役儀式
- 祥生醫療前三季度營業收入3.43億元,同比下降5.27%
- 江蘇最低工資標準公布
- 首佳科技于10月17日耗資56萬港元回購70萬股-每日消息
- 靳東:延安的變化讓人刮目相看_焦點簡訊
- 當前關注:凡人微光|這座城的精神,正年輕!
- 又見中小銀行密集調降存款利率-簡訊
- 前沿熱點:思源電氣前三季度凈利21.91億元,同比增長46.94%
- 今日快看!劉浩存談藝術的生命力
- 要聞:呂瑞浩公參會見上海市疾控局團組
- 光庭信息:2025年前三季度凈利潤4477.54萬元 同比增長308.53%_最新資訊
- 拿起手機就能免費聽講座、看展覽 “十四五”期間多彩文化點亮生活
延伸閱讀
資訊





