App下載

Pytorch怎么用shuffle打亂數(shù)據(jù)?

猿友 2021-07-22 15:06:27 瀏覽數(shù) (5259)
反饋

我們在使用pytorch的時候有時候會需要用到隨機排序的功能,那么pytorch怎么打亂數(shù)據(jù)呢?其實我們可以使用一個叫shuffle的方法來打亂數(shù)據(jù),接下來這篇文章我們就來討論一下pytorch怎么用shuffle打亂數(shù)據(jù)吧。

首先我得告訴你一件事,那就是pytorch中的tensor,如果直接使用random.shuffle打亂數(shù)據(jù),或者使用下面的方式,自己定義直接寫。

 def Shuffle(self, x, y,random=None, int=int):
         if random is None:
            random = self.random
                 for i in range(len(x)):
            j = int(random() * (i + 1))
            if j<=len(x)-1:
                x[i],x[j]=x[j],x[i]
                y[i],y[j]=y[j],y[i]
          retrun x,y

那你就會收獲一堆的混亂數(shù)據(jù),因為使用這種交換的方式對tensor類型的數(shù)據(jù)進行操作,會導致里面的數(shù)據(jù)出現(xiàn)重復復制的問題。

比如我y中的數(shù)據(jù)為【0,1,0,1,0,1】

在經(jīng)過幾次shuffle,其中的數(shù)據(jù)就變成了【1,1,1,1,1,1】。

數(shù)據(jù)頓時出現(xiàn)混亂。

正確的方式是先轉(zhuǎn)成numpy,再進行交換數(shù)據(jù)

比如:

 def Shuffle(self, x, y,random=None, int=int):
        """x, random=random.random -> shuffle list x in place; return None.
        Optional arg random is a 0-argument function returning a random
        float in [0.0, 1.0); by default, the standard random.random.
        """
        if random is None:
            random = self.random #random=random.random
        #轉(zhuǎn)成numpy
        if torch.is_tensor(x)==True:
            if self.use_cuda==True:
               x=x.cpu().numpy()
            else:
               x=x.numpy()
        if torch.is_tensor(y) == True:
            if self.use_cuda==True:
               y=y.cpu().numpy()
            else:
               y=y.numpy()
        #開始隨機置換
        for i in range(len(x)):
            j = int(random() * (i + 1))
            if j<=len(x)-1:#交換
                x[i],x[j]=x[j],x[i]
                y[i],y[j]=y[j],y[i]
        #轉(zhuǎn)回tensor
        if self.use_cuda == True:
            x=torch.from_numpy(x).cuda()
            y=torch.from_numpy(y).cuda()
        else:
            x = torch.from_numpy(x)
            y = torch.from_numpy(y)
        return x,y

補充:python對訓練數(shù)據(jù)集shuffle(打亂)的一些方式

1.通過數(shù)組來shuffle

image_list=[]           # list of images
label_list=[]           # list of labels
 
temp = np.array([image_list, label_list])
temp = temp.transpose()
np.random.shuffle(temp)
 
images = temp[:, 0]     # array of images   (N,)
labels = temp[:, 1]

2.通過索引 Index 來 shuffle

image_list=[]           # list of images
label_list=[]           # list of labels
 
##如果image_list存的是讀取的特征數(shù)據(jù),而不是圖片路徑,不要注釋后面兩句(list無法索引內(nèi)部list)
#[list indices must be integers or slices, not list]
#image_list = np.array(image_list)
#label_list = np.array(label_list)
 
index = [i for i in range(len(image_list))]
np.random.shuffle(index)
images = image_list[index]
labels = label_list[index]

以上就是pytorch怎么用shuffle打亂數(shù)據(jù)的詳細介紹,希望能給大家一個參考,也希望大家多多支持W3Cschool

0 人點贊