『TensorFlow』slim模塊經常使用API

時間 2019-11-12

標籤 TensorFlow slim 模塊經常使用 api 简体版

原文原文鏈接

輔助函數

slim.arg_scope（）

slim.arg_scope能夠定義一些函數的默認參數值，在scope內，咱們重複用到這些函數時能夠不用把全部參數都寫一遍，注意它沒有tf.variable_scope()劃分圖結構的功能，python

with slim.arg_scope([slim.conv2d, slim.fully_connected], 
                    trainable=True,
                    activation_fn=tf.nn.relu, 
                    weights_initializer=tf.truncated_normal_initializer(stddev=0.01), 
                    weights_regularizer=slim.l2_regularizer(0.0001)):
    with slim.arg_scope([slim.conv2d], 
                        kernel_size=[3, 3], 
                        padding='SAME',
                        normalizer_fn=slim.batch_norm):
        net = slim.conv2d(net, 64, scope='conv1'))
        net = slim.conv2d(net, 128, scope='conv2'))
        net = slim.conv2d(net, 256, [5, 5], scope='conv3'))

slim.arg_scope的用法基本都體如今上面了。一個slim.arg_scope內能夠用list來同時定義多個函數的默認參數（前提是這些函數都有這些參數），另外，slim.arg_scope也容許相互嵌套。在其中調用的函數，能夠不用重複寫一些參數（例如kernel_size=[3, 3]），但也容許覆蓋（例如最後一行，卷積核大小爲[5，5]）。
另外，還能夠把這麼多scope封裝成函數：bash

def new_arg_sc():
    with slim.arg_scope([slim.conv2d, slim.fully_connected], 
                        trainable=True,
                        activation_fn=tf.nn.relu, 
                        weights_initializer=tf.truncated_normal_initializer(stddev=0.01), 
                        weights_regularizer=slim.l2_regularizer(0.0001)):
        with slim.arg_scope([slim.conv2d], 
                            kernel_size=[3, 3], 
                            padding='SAME',
                            normalizer_fn=slim.batch_norm) as sc:
            return sc

def main():
    ......
    with slim.arg_scope(new_arg_sc()):
        ......

slim.utils.collect_named_outputs()

將變量取個別名，並收集到collection中網絡

net = slim.utils.collect_named_outputs(outputs_collections,sc.name,net)

參數意義以下，app

return：這個方法會返回本次添加的tensor對象，
參數二：意義是爲tensor添加一個別名，並收集進collections中
查看源碼可見實現以下

if collections:
 append_tensor_alias(outputs,alias)
 ops.add_to_collections(collections,outputs)
return outputs

聽說本方法位置已經被轉移到這裏了，
from tensorflow.contrib.layers.python.layers import utils
utils.collect_named_outputs()

slim.utils.convert_collection_to_dict()

#集合轉換爲字典，{節點名：輸出張量值}
end_points = slim.utils.convert_collection_to_dict(end_points_collection)
 
# 收集 & 釋放 集合值
tf.add_to_collection("loss",mse_loss)
tf.add_n(tf.get_collection("loss"))

層函數

batch_norm處理

slim.batch_norm()函數，以及slim的各個層函數的normalizer_fn=slim.batch_norm調用都會用到，ide

其參數不少，須要以字典的形式傳入，函數

batch_norm_params = {  # 定義batch normalization（標準化）的參數字典
        'is_training': is_training,
        # 是不是在訓練模式，若是是在訓練階段，將會使用指數衰減函數（衰減係數爲指定的decay），
        # 對moving_mean和moving_variance進行統計特性的動量更新，也就是進行使用指數衰減函數對均值和方
        # 差進行更新,而若是是在測試階段，均值和方差就是固定不變的，是在訓練階段就求好的，在訓練階段，
        # 每一個批的均值和方差的更新是加上了一個指數衰減函數，而最後求得的整個訓練樣本的均值和方差就是所
        # 有批的均值的均值，和全部批的方差的無偏估計

        'zero_debias_moving_mean': True,
        # 若是爲True，將會建立一個新的變量對 'moving_mean/biased' and 'moving_mean/local_step'，
        # 默認設置爲False，將其設爲True能夠增長穩定性

        'decay': batch_norm_decay,             # Decay for the moving averages.
        # 該參數可以衡量使用指數衰減函數更新均值方差時，更新的速度，取值一般在0.999-0.99-0.9之間，值
        # 越小，表明更新速度越快，而值太大的話，有可能會致使均值方差更新太慢，而最後變成一個常量1，而
        # 這個值會致使模型性能較低不少.另外，若是出現過擬合時，也能夠考慮增長均值和方差的更新速度，也
        # 就是減少decay

        'epsilon': batch_norm_epsilon,         # 就是在歸一化時，除以方差時，防止方差爲0而加上的一個數
        'scale': batch_norm_scale,
        'updates_collections': tf.GraphKeys.UPDATE_OPS,     
        # force in-place updates of mean and variance estimates
        # 該參數有一個默認值，ops.GraphKeys.UPDATE_OPS，當取默認值時，slim會在當前批訓練完成後再更新均
        # 值和方差，這樣會存在一個問題，就是當前批數據使用的均值和方差老是慢一拍，最後致使訓練出來的模
        # 型性能較差。因此，通常須要將該值設爲None，這樣slim進行批處理時，會對均值和方差進行即時更新，
        # 批處理使用的就是最新的均值和方差。
        #
        # 另外，不管是即便更新仍是一步訓練後再對全部均值方差一塊兒更新，對測試數據是沒有影響的，即測試數
        # 據使用的都是保存的模型中的均值方差數據，可是若是你在訓練中須要測試，而忘了將is_training這個值
        # 改爲false，那麼這批測試數據將會綜合當前批數據的均值方差和訓練數據的均值方差。而這樣作應該是不
        # 正確的。
    }

在以其餘層參數的形式調用時以下，post

normalizer_fn=slim.batch_norm,                               # 標準化器設置爲BN
normalizer_params=batch_norm_params

注意一但使用batch_norm層，在訓練節點定義時須要添加一些語句，slim.batch_norm裏有moving_mean和moving_variance兩個量，分別表示每一個批次的均值和方差。在訓練時還好理解，但在測試時，moving_mean和moving_variance的含義變了，在訓練時，性能

update_ops = tf.get_collection(tf.GraphKeys.UPDATE_OPS)  
    with tf.control_dependencies(update_ops):  
        train_step = tf.train.GradientDescentOptimizer(0.01).minimize(total_loss)  
# 注意並tf本體的batch_normal操做也須要這步操做
# 其中，tf.control_dependencies(update_ops)表示with段中的操做是在update_ops操做執行以後 再執行的

tf.contrib.slim.conv2d()

convolution(inputs,
          num_outputs,
          kernel_size,
          stride=1,
          padding='SAME',
          data_format=None,
          rate=1,
          activation_fn=nn.relu,
          normalizer_fn=None,
          normalizer_params=None,
          weights_initializer=initializers.xavier_initializer(),
          weights_regularizer=None,
          biases_initializer=init_ops.zeros_initializer(),
          biases_regularizer=None,
          reuse=None,
          variables_collections=None,
          outputs_collections=None,
          trainable=True,
          scope=None)
inputs                        是指須要作卷積的輸入圖像
num_outputs             指定卷積核的個數（就是filter的個數）
kernel_size               用於指定卷積核的維度（卷積核的寬度，卷積核的高度）
stride                         爲卷積時在圖像每一維的步長
padding                     爲padding的方式選擇，VALID或者SAME
data_format              是用於指定輸入的input的格式
rate                           這個參數不是太理解，並且tf.nn.conv2d中也沒有，對於使用atrous convolution的膨脹率（不是太懂這個atrous convolution）
activation_fn             用於激活函數的指定，默認的爲ReLU函數
normalizer_fn           用於指定正則化函數
normalizer_params 用於指定正則化函數的參數
weights_initializer     用於指定權重的初始化程序
weights_regularizer 爲權重可選的正則化程序
biases_initializer       用於指定biase的初始化程序
biases_regularizer biases可選的正則化程序
reuse                        指定是否共享層或者和變量
variable_collections 指定全部變量的集合列表或者字典
outputs_collections   指定輸出被添加的集合
trainable                    卷積層的參數是否可被訓練
scope                        共享變量所指的variable_scope測試

slim.conv2d是基於tf.conv2d的進一步封裝，省去了不少參數，通常調用方法以下：spa

net = slim.conv2d(inputs, 256, [3, 3], stride=1, scope='conv1_1')

slim.max_pool2d

這個函數更簡單了，用法以下：

net = slim.max_pool2d(net, [2, 2], scope='pool1')

slim.fully_connected

slim.fully_connected(x, 128, scope='fc1')

前兩個參數分別爲網絡輸入、輸出的神經元數量。

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。