您現在的位置是：首頁 > 垂釣

從未如此簡單，15分鐘就上手的神經網路構建方法

由讀芯術發表于垂釣
2021-10-23

簡介匯入語句和資料集在這個簡單的範例中將用到幾個庫：· Pandas：用於資料載入和處理· Matplotlib：用於資料視覺化處理· PyTorch：用於模型訓練· Scikit-learn：用於拆分訓練集和測試集圖源：unsplash

什麼網路技術上手快

全文共2392字，預計學習時長11分鐘

圖源：unsplash

人工智慧，深度學習，這些詞是不是聽起來就很高大上，充滿了神秘氣息？彷彿是隻對數學博士開放的高階領域？

錯啦！在B站已經變成學習網站的今天，還有什麼樣的教程是網上找不到的呢？深度學習從未如此好上手，至少實操部分是這樣。

假如你只是瞭解人工神經網路基礎理論，卻從未踏足如何編寫，跟著本文一起試試吧。你將會對如何在PyTorch 庫中執行人工神經網路運算，以預測原先未見的資料有一個基本的瞭解。

這篇文章最多10分鐘就能讀完；如果要跟著程式碼一步步操作的話，只要已經安裝了必要的庫，那麼也只需15分鐘。相信我，它並不難。

長話短說，快開始吧！

匯入語句和資料集

在這個簡單的範例中將用到幾個庫：

· Pandas：用於資料載入和處理

· Matplotlib：用於資料視覺化處理

· PyTorch：用於模型訓練

· Scikit-learn：用於拆分訓練集和測試集

圖源：unsplash

如果僅僅是想複製貼上的話，以下幾條匯入語句可供參考：

import torchimport torch。nn as nnimport torch。nn。functional as Fimport pandas as pdimport matplotlib。pyplot as pltfrom sklearn。model_selection import train_test_split

至於資料集，Iris資料集可以在這個URL上找到。下面演示如何把它直接匯入

Pandas：iris = pd。read_csv（‘https：//raw。githubusercontent。com/pandas-dev/pandas/master/pandas/tests/data/iris。csv’）iris。head（）

前幾行如下圖所示：

現在需要將 Name列中鳶尾花的品種名稱更改或者重對映為分類值。——也就是0、1、2。以下是步驟說明：

mappings = { ‘Iris-setosa’： 0， ‘Iris-versicolor’： 1， ‘Iris-virginica’： 2}iris［‘Name’］ = iris［‘Name’］。apply（lambda x： mappings［x］）

執行上述程式碼得到的DataFrame如下：

這恭喜你，你已經成功地邁出了第一步！

拆分訓練集和測試集

在此環節，將使用 Scikit-Learn庫拆分訓練集和測試集。隨後，將拆分過的資料由 Numpy arrays 轉換為PyTorchtensors。

圖源：unsplash

首先，需要將Iris 資料集劃分為“特徵”和“ 標籤集” ——或者是x和y。Name列是因變數而其餘的則是“特徵”（或者說是自變數）。

接下來筆者也將使用隨機種子，所以可以直接複製下面的結果。程式碼如下：

X = iris。drop（‘Name’， axis=1）。valuesy = iris［‘Name’］。valuesX_train， X_test， y_train， y_test = train_test_split（X，y， test_size=0。2， random_state=42）X_train = torch。FloatTensor（X_train）X_test = torch。FloatTensor（X_test）y_train = torch。LongTensor（y_train）y_test = torch。LongTensor（y_test）

如果從 X_train 開始檢查前三行，會得到如下結果：

從 y_train開始則得到如下結果：

地基已經打好，下一環節將正式開始搭建神經網路。

定義神經網路模型

模型的架構很簡單。重頭戲在於神經網路的架構：

1。輸入層（4個輸入特徵（即X所含特徵的數量），16個輸出特徵（隨機））

2。全連線層（16個輸入特徵（即輸入層中輸出特徵的數量），12個輸出特徵（隨機））

3。輸出層（12個輸入特徵（即全連線層中輸出特徵的數量），3個輸出特徵（即不同品種的數量）

大致就是這樣。除此之外還將使用ReLU 作為啟用函式。下面展示如何在程式碼裡執行這個啟用函式。

class ANN（nn。Module）： def __init__（self）： super（）。__init__（） self。fc1 =nn。Linear（in_features=4， out_features=16） self。fc2 =nn。Linear（in_features=16， out_features=12） self。output =nn。Linear（in_features=12， out_features=3） def forward（self， x）： x = F。relu（self。fc1（x）） x = F。relu（self。fc2（x）） x = self。output（x） return x

PyTorch使用的面向物件宣告模型的方式非常直觀。在建構函式中，需定義所有層及其架構，若使用forward（），則需定義正向傳播。

接著建立一個模型例項，並驗證其架構是否與上文所指的架構相匹配：

model = ANN（）model

在訓練模型之前，需註明以下幾點：

· 評價標準：主要使用 CrossEntropyLoss來計算損失

· 最佳化器：使用學習率為0。01的Adam 最佳化演算法

下面展示如何在程式碼中執行CrossEntropyLoss和Adam ：

criterion = nn。CrossEntropyLoss（）optimizer = torch。optim。Adam（model。parameters（）， lr=0。01）

令人期盼已久的環節終於來啦——模型訓練！

模型訓練

這部分同樣相當簡單。模型訓練將進行100輪，持續追蹤時間和損失。每10輪就向控制檯輸出一次當前狀態——以指出目前所處的輪次和當前的損失。

程式碼如下：

%%timeepochs = 100loss_arr = ［］for i in range（epochs）：y_hat = model。forward（X_train）loss = criterion（y_hat， y_train）loss_arr。append（loss）if i % 10 == 0：print（f‘Epoch： {i} Loss： {loss}’）optimizer。zero_grad（）loss。backward（）optimizer。step（）

好奇最後三行是幹嘛用的嗎？答案很簡單——反向傳播——權重和偏置的更新使模型能真正地“學習”。

以下是上述程式碼的執行結果：