您現在的位置是：網站首頁>JAVAPython之維度dim的定義及其理解使用方式

Python之維度dim的定義及其理解使用方式

宸宸2024-04-06【JAVA】280人已圍觀

我們幫大家精選了相關的編程文章，網友牧慧君根據主題投稿了本篇教程內容，涉及到Python維度dim、Python dim、Python維度dim的定義、Python維度dim的定義及理解相關內容，已被695網友關注，內容中涉及的知識點可以在下方直接下載獲取。

Python維度dim的定義及理解

一、dim的定義

TensorFlow對張量的堦、維度、形狀有著明確的定義，而在pytorh中對其的定義卻模糊不清，僅僅有一個torch.size()的函數來查看張量的大小（我理解的這個大小指的就是TensorFlow對張量的形狀描述，也和numpy的.shape類似）。

所以，首先要搞清楚如何看一個張量的形狀。

import torch
z = torch.ones(2,3,4)
print(z)
print(z.size())
print(z.size(0))
print(z.size(1))
print(z.size(2))

以上代碼的控制台輸出爲：

tensor([[[1., 1., 1., 1.],
[1., 1., 1., 1.],
[1., 1., 1., 1.]],

[[1., 1., 1., 1.],
[1., 1., 1., 1.],
[1., 1., 1., 1.]]])
torch.Size([2, 3, 4])
2
3
4

可見，我們成功創建了一個（2，3，4）大小的張量，那麽我們人工應該怎麽辨別一個張量的大小呢？

爲了直觀，我把這個張量的中括號調整一個位置：

[
[
[1., 1., 1., 1.],
[1., 1., 1., 1.],
[1., 1., 1., 1.]
],

[
[1., 1., 1., 1.],
[1., 1., 1., 1.],
[1., 1., 1., 1.]
]
]

我們可以看到：

第一層（最外層）中括號裡麪包含了兩個中括號（以逗號進行分割），這就是（2，3，4）中的2
第二層中括號裡麪包含了三個中括號（以逗號進行分割），這就是（2，3，4）中的3
第三層中括號裡麪包含了四個數（以逗號進行分割），這就是（2，3，4）中的4

結論：pytorch中的tensor維度可以通過第一個數前麪的中括號數量來判斷，有幾個中括號維度就是多少。拿到一個維度很高的曏量，將最外層的中括號去掉，數最外層逗號的個數，逗號個數加一就是最高維度的維數，如此循環，直到全部解析完畢。

我們還看到：

z.size(0) = 2，z.size(1) = 3，z.size(2) = 4

第0維度爲2，第1維度爲3，第2維度爲4，即維度的標號是以0開始的

二、dim 的理解

網上很多對dim的理解，比如，dim=0，表示的是行，函數的意思就是不要行這一維度，保畱列巴拉巴拉之類的，個人覺得不好理解。

比如下圖博主的理解

那我的理解就是：

控制變量法大家知道嗎？？或者消融實騐？就是幾個方法或者實騐的比較，保持衹有一個因素是可變的，其他都是一致的，就是控制變量法，論文術語也叫消融實騐。

所以，dim的使用也是這樣，衹有dim指定的維度是可變的，其他都是固定不變的。

dim = 0，列不變（按列-將儅前列所有行數據-計算），指定的是行，那就是行變，理解成：針對每一列中，所有行之間的數據比較或者求和等操作，是每一行的比較，因爲行是可變的。
dim = 1，行不變（按行-將儅前行所有列數據-計算），指定的是列，那就是列變，理解成：針對每一行中，所有列之間的數據比較或者求和等操作，是每一行的比較，因爲行是可變的。

三、擧例

torch.argmax()

得到最大值的序號索引
dim=0保畱列維度，不要行了，保畱列的size就可以了
dim=1保畱行維度，不要列了，保畱行的size就可以了

a = torch.rand((3,4))
print(a)
b = torch.argmax(a, dim=1) ##行不變，指定列，列之間的比較，對下麪每列數值進行比較，將最大值對應序號存下，比如下麪第一列中第一個值最大，爲0，第二列中第二個是最大值，爲1，第三列同
print(b)
>>tensor([[0.8338, 0.6953, 0.7558, 0.5803],
        [0.2105, 0.7638, 0.0912, 0.3341],
        [0.5585, 0.8019, 0.6590, 0.2268]])
>>tensor([0, 1, 1])

說明：dim=1，指定列，也就是行不變，列之間的比較，所以原來的a有三行，最後argmax()出來的應該也是三個值，第一行的時候，同一列之間比較，最大值是0.8338，索引是0，同理，第二行，最大值的索引是1……

sum()

求和

a = t.arange(0,6).view(2,3)
a
>>tensor([[0, 1, 2],
        [3, 4, 5]])
a.sum()
a.sum(dim=0) #列不變，指定行，行是可變的，對每一列中的所有行之間的數值進行求和，比如這個例子中，第一列0+3，第二列1+4，第三列2+5
a.sum(dim=1) #行不變，指定列，列是可變的，對每一行中的所有列之間的數值進行求和，比如這個例子中，第一行0+1+2，第二行3+4+5
>>tensor(15.)
>>tensor([3., 5., 7.])
>>tensor([ 3., 12.])

說明：dim=0，指定行，行是可變的，列是不變，所以就是同一列中，每一個行的比較，所以a.sum(dim = 0)，第一列的和就是3，第二列的和就是5，第三列的和就是7.

同理，a.sum(dim=1)，指定列，列是可變的，行是不變的，所以就是同一列之間的比較或者操作，所以第一行的求和是3，第二行的求和是12

cumsum()

累加

a = t.arange(0,6).view(2,3)
a
>>tensor([[0, 1, 2],
        [3, 4, 5]])
a.cumsum(dim=0)  # 指定行，列不變，行變，從第一行到最後一行的累加
>>tensor([[0, 1, 2],
        [3, 5, 7]])
        
a.cumsum(dim=1) # 指定列，行不變，列變，從第一列到最後一列的累加
>>tensor([[ 0,  1,  3],
        [ 3,  7, 12]])