中文亚洲精品无码_熟女乱子伦免费_人人超碰人人爱国产_亚洲熟妇女综合网

當(dāng)前位置: 首頁 > news >正文

基礎(chǔ)微網(wǎng)站開發(fā)口碑好seo基礎(chǔ)入門

基礎(chǔ)微網(wǎng)站開發(fā)口碑好,seo基礎(chǔ)入門,直銷公司排名100,成都專業(yè)建站推廣公司在多頭注意力機制中,通常輸入的數(shù)據(jù)包括查詢(Q)、鍵(K)和值(V)。這些數(shù)據(jù)的維度以及權(quán)重矩陣的維度在多頭注意力機制中扮演關(guān)鍵角色。下面對數(shù)據(jù)及權(quán)重的維度進(jìn)行解釋: 輸入數(shù)據(jù)&…

在多頭注意力機制中,通常輸入的數(shù)據(jù)包括查詢(Q)、鍵(K)和值(V)。這些數(shù)據(jù)的維度以及權(quán)重矩陣的維度在多頭注意力機制中扮演關(guān)鍵角色。下面對數(shù)據(jù)及權(quán)重的維度進(jìn)行解釋:

  1. 輸入數(shù)據(jù)(Queries, Keys, Values):

    • Queries (Q): 表示待查詢的信息,通常對應(yīng)輸入序列的每個位置。其維度通常為 (batch_size, seq_length, q_dim),其中 q_dim 是查詢向量的維度。
    • Keys (K): 表示用于計算注意力分?jǐn)?shù)的信息,也通常對應(yīng)輸入序列的每個位置。其維度通常為 (batch_size, seq_length, key_dim),其中 key_dim 是鍵向量的維度。
    • Values (V): 表示待加權(quán)求和的信息,同樣對應(yīng)輸入序列的每個位置。其維度通常為 (batch_size, seq_length, value_dim),其中 value_dim 是值向量的維度。
  2. 權(quán)重矩陣:

    • 查詢權(quán)重矩陣 (Q_weights): 用于對查詢(Q)進(jìn)行線性變換,將其映射到多個注意力頭的維度。其維度通常為 (q_dim, num_heads,?head_dim),其中 num_heads 是注意力頭的數(shù)量,head_dim 是每個注意力頭的維度。
    • 鍵權(quán)重矩陣 (K_weights): 用于對鍵(K)進(jìn)行線性變換,同樣映射到多個注意力頭的維度。其維度通常為 (key_dim, num_heads,?head_dim)。
    • 值權(quán)重矩陣 (V_weights): 用于對值(V)進(jìn)行線性變換,映射到多個注意力頭的維度。其維度通常為 (value_dim, num_heads,?head_dim)。
def glorot_uniform():return hk.initializers.VarianceScaling(scale=1.0,mode='fan_avg',distribution='uniform')def stable_softmax(logits: jax.Array) -> jax.Array:"""Numerically stable softmax for (potential) bfloat 16."""if logits.dtype == jnp.float32:output = jax.nn.softmax(logits)elif logits.dtype == jnp.bfloat16:# Need to explicitly do softmax in float32 to avoid numerical issues# with large negatives. Large negatives can occur if trying to mask# by adding on large negative logits so that things softmax to zero.output = jax.nn.softmax(logits.astype(jnp.float32)).astype(jnp.bfloat16)else:raise ValueError(f'Unexpected input dtype {logits.dtype}')return outputclass Attention(hk.Module):"""Multihead attention."""def __init__(self, config, global_config, output_dim, name='attention'):super().__init__(name=name)self.config = configself.global_config = global_configself.output_dim = output_dimdef __call__(self, q_data, m_data, mask, nonbatched_bias=None):"""Builds Attention module.Arguments:q_data: A tensor of queries, shape [batch_size, N_queries, q_channels].m_data: A tensor of memories from which the keys and values areprojected, shape [batch_size, N_keys, m_channels].mask: A mask for the attention, shape [batch_size, N_queries, N_keys].nonbatched_bias: Shared bias, shape [N_queries, N_keys].Returns:A float32 tensor of shape [batch_size, N_queries, output_dim]."""# Sensible default for when the config keys are missingkey_dim = self.config.get('key_dim', int(q_data.shape[-1]))value_dim = self.config.get('value_dim', int(m_data.shape[-1]))num_head = self.config.num_headassert key_dim % num_head == 0assert value_dim % num_head == 0key_dim = key_dim // num_headvalue_dim = value_dim // num_head# weights維度(數(shù)據(jù)最后一維的維度數(shù),注意力頭數(shù)量,每個注意力頭映射的數(shù)據(jù)維度)q_weights = hk.get_parameter('query_w', shape=(q_data.shape[-1], num_head, key_dim),dtype=q_data.dtype,init=glorot_uniform())k_weights = hk.get_parameter('key_w', shape=(m_data.shape[-1], num_head, key_dim),dtype=q_data.dtype,init=glorot_uniform())v_weights = hk.get_parameter('value_w', shape=(m_data.shape[-1], num_head, value_dim),dtype=q_data.dtype,init=glorot_uniform())# bqa: 輸入張量 q_data 的軸的標(biāo)記。(batch_size, seq_length, q_dim)# 'b' :batch 維度,'q':查詢序列維度,'a' 查詢向量的維度。所以,'bqa' 表示 q_data 的三個軸。# ahc:查詢權(quán)重矩陣的形狀, a:查詢向量的維度,h:注意力頭的數(shù)量,c: 每個注意力頭中查詢的維度。# key_dim**(-0.5) 注意力縮放,避免注意力分?jǐn)?shù)過大或過小# jnp.einsum:Einstein Summation Notation(愛因斯坦求和約定)。# 一種緊湊、靈活的方式來指定和計算張量的乘積、求和和轉(zhuǎn)置等操作。q = jnp.einsum('bqa,ahc->bqhc', q_data, q_weights) * key_dim**(-0.5)k = jnp.einsum('bka,ahc->bkhc', m_data, k_weights)v = jnp.einsum('bka,ahc->bkhc', m_data, v_weights)# 注意力分?jǐn)?shù),計算每個查詢(q)和鍵(k)之間的點積,以獲得注意力分?jǐn)?shù)。# 結(jié)果維度為bhqk (batch_size, num_heads, num_q, num_k),?# num_q/num_k為查詢/鍵的數(shù)量,一般為 seq_length。logits = jnp.einsum('bqhc,bkhc->bhqk', q, k)if nonbatched_bias is not None:logits += jnp.expand_dims(nonbatched_bias, axis=0)# 注意力分?jǐn)?shù)中加入masklogits = jnp.where(mask, logits, _SOFTMAX_MASK)# 對注意力分?jǐn)?shù)進(jìn)行softmax操作,我們得到每個位置對輸入序列的權(quán)重分配。weights = stable_softmax(logits)# 注意力分?jǐn)?shù)對值進(jìn)行加權(quán)求和,得到多頭注意力機制的輸出# 兩個向量的點積可以用于度量它們之間的相似性。如果兩個向量越相似,它們的點積就越大weighted_avg = jnp.einsum('bhqk,bkhc->bqhc', weights, v)if self.global_config.zero_init:init = hk.initializers.Constant(0.0)else:init = glorot_uniform()# 帶有bias的門控注意力if self.config.gating:gating_weights = hk.get_parameter('gating_w',shape=(q_data.shape[-1], num_head, value_dim),dtype=q_data.dtype,init=hk.initializers.Constant(0.0))gating_bias = hk.get_parameter('gating_b',shape=(num_head, value_dim),dtype=q_data.dtype,init=hk.initializers.Constant(1.0))gate_values = jnp.einsum('bqc, chv->bqhv', q_data,gating_weights) + gating_biasgate_values = jax.nn.sigmoid(gate_values)# ⊙ 對應(yīng)元素相乘weighted_avg *= gate_valueso_weights = hk.get_parameter('output_w', shape=(num_head, value_dim, self.output_dim),dtype=q_data.dtype,init=init)o_bias = hk.get_parameter('output_b', shape=(self.output_dim,),dtype=q_data.dtype,init=hk.initializers.Constant(0.0))# 線性變換到輸出維度大小output = jnp.einsum('bqhc,hco->bqo', weighted_avg, o_weights) + o_biasreturn output

http://www.risenshineclean.com/news/41061.html

相關(guān)文章:

  • 信譽好的武漢網(wǎng)站建設(shè)seo課培訓(xùn)
  • 怎么使用vs2017做網(wǎng)站關(guān)鍵詞排名怎么快速上去
  • 百度做的網(wǎng)站字體侵權(quán)百度一下百度主頁官網(wǎng)
  • 爐石做任務(wù)抽獎網(wǎng)站windows優(yōu)化大師下載安裝
  • WordPress潮流媒體主題sem推廣和seo的區(qū)別
  • 溫州市手機網(wǎng)站制作班級優(yōu)化大師官方免費下載
  • wordpress欄目圖片seo上排名
  • wordpress獨立博客免費seo視頻教程
  • 哲學(xué)專業(yè)特色建設(shè)網(wǎng)站谷歌搜索廣告優(yōu)化
  • 畢業(yè)論文做cad圖的網(wǎng)站江蘇網(wǎng)頁設(shè)計
  • 網(wǎng)站投訴平臺寧波seo快速排名
  • WordPress可以做社交網(wǎng)站嘛網(wǎng)絡(luò)平臺怎么創(chuàng)建
  • 溫州做網(wǎng)站設(shè)計網(wǎng)絡(luò)營銷類型有哪些
  • 滑動 手機網(wǎng)站 代碼優(yōu)化人員配置
  • wordpress添加友情練級濟南seo網(wǎng)絡(luò)優(yōu)化公司
  • wordpress視頻站主題百度一下你就知道下載
  • 明年做哪個網(wǎng)站致富站長工具seo綜合查詢降級
  • 抖音短視頻代運營公司太原seo網(wǎng)絡(luò)優(yōu)化招聘網(wǎng)
  • 鄭州市熱點新聞優(yōu)化游戲卡頓的軟件
  • 公司網(wǎng)站制作 步驟seo優(yōu)化師是什么
  • 網(wǎng)站備案值得嗎常見的搜索引擎
  • 做機械設(shè)計的要知道哪些網(wǎng)站產(chǎn)品優(yōu)化是什么意思
  • 深圳外貿(mào)網(wǎng)站建設(shè)公司企業(yè)管理培訓(xùn)班
  • 濟南哪里有建網(wǎng)站seo公司怎樣找客戶
  • 網(wǎng)站上的截圖怎么做動態(tài)網(wǎng)站的制作與設(shè)計
  • 玉溪網(wǎng)絡(luò)推廣 網(wǎng)站建設(shè)國外網(wǎng)站加速
  • 寧波做日用品外貿(mào)公司網(wǎng)站百度搜索引擎原理
  • 湖北網(wǎng)站建設(shè)找哪家如何做好營銷推廣
  • asp.net網(wǎng)站安全太原網(wǎng)站制作優(yōu)化seo公司
  • 安順住房和城鄉(xiāng)建設(shè)部網(wǎng)站網(wǎng)站app開發(fā)公司