中文亚洲精品无码_熟女乱子伦免费_人人超碰人人爱国产_亚洲熟妇女综合网

當(dāng)前位置: 首頁 > news >正文

qq網(wǎng)站直接登錄網(wǎng)絡(luò)營銷與直播電商是干什么的

qq網(wǎng)站直接登錄,網(wǎng)絡(luò)營銷與直播電商是干什么的,鄭州網(wǎng)站建設(shè)設(shè)計(jì),搜索引擎推廣網(wǎng)站Github 倉庫:https://github.com/One-sixth/flash-linear-attention-pytorch flash-linear-attention-pytorch 純 Pytorch 實(shí)現(xiàn) TransnormerLLM 中快速線性注意力算子。 用于學(xué)習(xí)目的。 如果你希望用于訓(xùn)練模型,你可能要修改為 CUDA 或 Triton 的實(shí)現(xiàn)&…

Github 倉庫:https://github.com/One-sixth/flash-linear-attention-pytorch

flash-linear-attention-pytorch

純 Pytorch 實(shí)現(xiàn) TransnormerLLM 中快速線性注意力算子。
用于學(xué)習(xí)目的。
如果你希望用于訓(xùn)練模型,你可能要修改為 CUDA 或 Triton 的實(shí)現(xiàn),不然會很慢。

注意

這個(gè)算子有精度問題,誤差較大,是正常的。
這是因?yàn)樽⒁饬仃嚊]有激活函數(shù),導(dǎo)致注意力矩陣的值很大。
在使用 float16 類型時(shí)需要特別小心。

這是一個(gè)簡單的緩解方法:限制 q 和 k 的值,從而減少float16溢出的可能性。

q = q / q.norm(-1, keepdim=True)
k = k / k.norm(-1, keepdim=True)
o = linear_attention(q, k, v, m)

使用方法

import torch
from flash_linear_attention_ops import flash_linear_attention, normal_linear_attentionbatch_size = 16
seq_len = 1024
dim = 64
n_head = 12
device = 'cuda'
dtype = torch.float32Q = torch.randn(batch_size, n_head, seq_len, dim, requires_grad=True, dtype=dtype, device=device)
K = torch.randn(batch_size, n_head, seq_len, dim, requires_grad=True, dtype=dtype, device=device)
V = torch.randn(batch_size, n_head, seq_len, dim, requires_grad=True, dtype=dtype, device=device)
M = torch.randint(0, 2, (1, 1, seq_len, seq_len), device=device, dtype=dtype)O_flash = flash_linear_attention(Q, K, V, M)
O_normal = normal_linear_attention(Q, K, V, M)print('O_flash.shape', O_flash.shape)
print('O_normal.shape', O_normal.shape)print('O diff', (O_flash - O_normal).abs().max().item())

參考引用

https://github.com/OpenNLPLab/TransnormerLLM
https://github.com/shreyansh26/FlashAttention-PyTorch

http://www.risenshineclean.com/news/23324.html

相關(guān)文章:

  • 優(yōu)酷網(wǎng)站誰做的sem外包
  • 白云區(qū)建網(wǎng)站網(wǎng)絡(luò)推廣產(chǎn)品公司
  • 企業(yè)網(wǎng)站的建設(shè)有哪些經(jīng)典問題seo優(yōu)化技術(shù)排名
  • 動態(tài)網(wǎng)站沒有數(shù)據(jù)庫怎么做產(chǎn)品推廣策劃書
  • dw網(wǎng)頁設(shè)計(jì)制作網(wǎng)站的成品自己創(chuàng)建網(wǎng)頁
  • 無錫高端網(wǎng)站建設(shè)開發(fā)在線咨詢 1 網(wǎng)站宣傳
  • 快設(shè)計(jì)網(wǎng)站官網(wǎng)seo國外英文論壇
  • b2b跟b2c有什么區(qū)別seo網(wǎng)上培訓(xùn)課程
  • 做網(wǎng)站一定要后臺嘛網(wǎng)站建設(shè)優(yōu)化400報(bào)價(jià)
  • 廈門網(wǎng)站建設(shè)哪家好小程序制作
  • 鞍山疫情最新情況鄭州網(wǎng)站seo公司
  • 做網(wǎng)站的目標(biāo)是什么福鼎網(wǎng)站優(yōu)化公司
  • nas服務(wù)器 做網(wǎng)站域名大全免費(fèi)網(wǎng)站
  • wordpress多大伊春seo
  • 武漢微信網(wǎng)站建設(shè)網(wǎng)站seo推廣員招聘
  • 如何做商業(yè)推廣網(wǎng)站淘寶搜索排名
  • 做外貿(mào)家紡資料網(wǎng)站重慶店鋪整站優(yōu)化
  • 關(guān)于做花茶網(wǎng)站的策劃書windows優(yōu)化大師有必要安裝嗎
  • 哈爾濱 微網(wǎng)站設(shè)計(jì)百度站長工具
  • 政府網(wǎng)站建設(shè)開題報(bào)告企業(yè)網(wǎng)站怎么制作
  • 個(gè)人免費(fèi)網(wǎng)站注冊seo整站優(yōu)化服務(wù)
  • 在線代碼編輯器seo 優(yōu)化案例
  • 音樂網(wǎng)站開發(fā)分享企拓客軟件怎么樣
  • 如何給自己網(wǎng)站做反鏈全國今日新增疫情
  • 網(wǎng)站制作設(shè)計(jì)方案行業(yè)網(wǎng)站網(wǎng)址
  • 天津外貿(mào)網(wǎng)站建設(shè)阿里云域名注冊流程
  • 十堰網(wǎng)站建設(shè)公司公司品牌推廣方案范文
  • 托管型網(wǎng)站專業(yè)網(wǎng)絡(luò)推廣公司排名
  • wordpress4.0 中文深圳專業(yè)seo
  • 有哪些做海島的網(wǎng)站seo推廣主要做什么