中文亚洲精品无码_熟女乱子伦免费_人人超碰人人爱国产_亚洲熟妇女综合网

當前位置: 首頁 > news >正文

網站常用架構個人網站推廣方法

網站常用架構,個人網站推廣方法,做運營常用的網站,做 b2b平臺的網站🌍杭州:全球數(shù)貿港核心區(qū)建設方案擬出臺 爭取國家支持杭州在網絡游戲管理給予更多權限 🎄Kimi深夜炸場:滿血版多模態(tài)o1級推理模型!OpenAI外全球首次!Jim Fan:同天兩款國產o1絕對不是巧合&#x…

🌍杭州:全球數(shù)貿港核心區(qū)建設方案擬出臺 爭取國家支持杭州在網絡游戲管理給予更多權限

?🎄Kimi深夜炸場:滿血版多模態(tài)o1級推理模型!OpenAI外全球首次!Jim Fan:同天兩款國產o1絕對不是巧合!

?切爾諾貝利核電站傳出爆炸聲 澤連斯基發(fā)聲

14日1時50分左右,切爾諾貝利核電站的“新安全封隔”設施內傳出爆炸聲并出現(xiàn)火情,該封隔設施負責保護切爾諾貝利核電站4號反應堆。據了解,一架無人機撞上了“新安全封隔”設施頂部

1.Seed Research | 視頻生成模型最新成果,可僅靠視覺認知世界!現(xiàn)已開源

1. 模型僅靠“視覺”即可學習知識?

面向本次研究,研究團隊構建了兩個實驗環(huán)境:視頻圍棋對戰(zhàn)和視頻機器人模擬操控。

其中,圍棋可以很好地評估模型的規(guī)則學習、推理和規(guī)劃能力,且圍棋關鍵信息僅有黑白兩色及棋盤,可將外觀、紋理等復雜細節(jié)與高級知識的評估分離,非常適合對上述問題的探索。同時,團隊還選取了機器人任務,以考察模型在理解控制規(guī)則和規(guī)劃任務方面的能力。

在模型訓練環(huán)節(jié),團隊構建了一個包含大量視頻演示數(shù)據的離線數(shù)據集,讓模型“觀看”學習,以此得到一個可以根據過往觀測,預測未來畫面的視頻生成器。

模型架構上,團隊使用樸素的自回歸模型實例化視頻生成器,它包含一個 VQ-VAE 編碼器 - 解碼器和一個自回歸 Transformer 。編碼器負責將視頻幀(畫面)轉換為離散標記,Transformer 在訓練期間使用這些標記預測下一標記。

在推理過程中,Transformer 生成下一幀(畫面)的離散標記,這些標記隨后由解碼器轉換回像素空間。通過任務相關的映射函數(shù),模型可將生成畫面轉換為任務執(zhí)行動作。這讓視頻生成實驗模型可在不依賴任何動作標簽情況下,學習和執(zhí)行具體任務。

基于上述樸素的框架對圍棋和機器人視頻數(shù)據進行建模,團隊觀測到,模型可以掌握基本的圍棋規(guī)則、走棋策略以及機器人操縱能力。

但團隊同時也發(fā)現(xiàn),視頻序列的知識挖掘效率顯著落后于文本形式,具體如下圖所示。

圖片

團隊將這歸因于——視頻中存在大量冗余信息,影響了模型的學習效率。

例如,學習棋子移動過程中,模型只需通過狀態(tài)序列中少量位置標記編碼,但面向視頻數(shù)據,編碼器則會產生過多冗余標記,不利于模型對復雜知識的快速學習。

2. 壓縮視覺變化,讓視頻學習更加高效?

根據上述觀測結果,團隊提出 VideoWorld 。它在保留豐富視覺信息的同時,壓縮了關鍵決策和動作相關的視覺變化,實現(xiàn)了更有效的視頻學習。

通常,視頻編碼需要數(shù)百或數(shù)千個離散標記來捕捉每幀內的視覺信息,這導致知識被稀疏地嵌入標記中。為此,VideoWorld 引入了一個潛在動態(tài)模型(Latent Dynamics Model, LDM),可將幀間視覺變化壓縮為緊湊的潛在編碼,提高模型的知識挖掘效率。

舉例而言,圍棋中的多步棋盤變化或機器人連續(xù)動作均表現(xiàn)出強時間相關性,通過將這些多步變化壓縮成緊湊嵌入,不僅讓策略信息更緊湊,還將前向規(guī)劃指導信息進行編碼。

LDM 采用了 MAGVITv2 風格的編碼器 - 解碼器結構,同時取消時間維度下采樣,以保留每幀細節(jié)。

對于一個視頻片段,LDM 采樣每一幀及其后續(xù)固定數(shù)量幀,編碼器先以因果方式提取每幀特征圖,且進行量化,以保留詳細視覺信息。

接下來,LDM 定義了一組注意力模塊和對應可學習向量。每個向量通過注意力機制捕捉第一幀至后續(xù)固定幀的動態(tài)變化信息,然后通過 FSQ 量化。其中,量化器作為信息篩選器,防止 LDM 簡單記憶后續(xù)幀原始內容,而非壓縮關鍵動態(tài)信息。

最后,解碼器使用第一幀的特征圖和幀之間的視覺變化編碼重建后續(xù)幀,最終實現(xiàn)對未來動作的預測和規(guī)劃,實現(xiàn)對知識的認知學習。

下圖為模型架構概覽,左側為整體架構,右側為潛在動態(tài)模型。

圖片

通過使用多個向量順序編碼第一幀到后續(xù)多幀的動態(tài)變化,VideoWorld 實現(xiàn)了緊湊且信息豐富的視覺表示,可以捕捉視覺序列中的短期和長期依賴關系。這對于長期推理和規(guī)劃任務至關重要。

通過引入 LDM ,VideoWorld 在僅有 300M 參數(shù)量下,達到專業(yè) 5 段的 9x9 圍棋水平,且不依賴任何強化學習中的搜索或獎勵函數(shù)機制。在機器人任務上,VideoWorld 也展現(xiàn)出了對多任務、多環(huán)境的泛化能力。?3. 純視覺模型可“預測”未來,并能“理解”因果關系覺模型可“預測”未來,并能“理解”因果關系?

3.純視覺模型可“預測”未來,并能“理解”因果關系

針對 LDM 提高視頻學習效率的原因,團隊進行了更為細致地分析,得出如下 3 點結論:

  • LDM 建模了訓練集的數(shù)據模式。

下圖為 LDM 潛在編碼 UMAP 可視化呈現(xiàn),面向圍棋和機器人訓練集,每個點代表一個潛在編碼。

其中,UMAP 是一種流行的降維算法,用于將高維數(shù)據映射到低維空間,展現(xiàn)模型特征提取情況。

在下圖左側中,奇數(shù)步表示白方走棋,偶數(shù)步表示黑方,圖例展示了新增黑棋的一些常見模式。UMAP 可視化表明:LDM 建模了訓練集中常見的走棋模式,并能將短期和長期數(shù)據模式壓縮至潛在空間中,提取并總結走棋規(guī)律。

同理,下圖右側為機械臂沿 X/Y/Z 軸運動方向可視化潛在編碼,隨著步數(shù)(Step)增多,也能看到 LDM 可以建模多步動態(tài)依賴關系。

圖片

  • LDM 幫助模型在測試時進行前向規(guī)劃。

團隊還研究了 LDM 在模型推理中的價值。

如下圖 UMAP 可視化所示,在測試階段,模型生成的潛在編碼按照時間步(Time-step)進行分組,使得模型能夠從更長遠視角進行圍棋決策。

圖片

在機器人場景實驗中,團隊也觀察到了類似現(xiàn)象。

下圖展示了 VideoWorld 在不同機器人操控任務中預測的潛在編碼。不同時間步的潛在編碼根據任務類型進行分組,突顯了模型逐步捕捉特定任務長程變化的能力。

圖片

  • LDM 可以生成因果相關的編碼。?

為進一步研究潛在編碼的影響,團隊進行了一項干預實驗:用隨機標記替換不同時間步的潛在編碼,并觀察其對模型性能的影響。

實驗結果顯示,干預第一個編碼的影響最大,這可能由于編碼之間存在因果依賴,團隊認為:改變第一個編碼,即下一時間步的最佳決策,會影響所有未來的決策,側面說明模型可生成因果相關編碼,理解因果關系。

2.蘋果據稱繼續(xù)與百度合作 為中國iPhone用戶開發(fā)AI功能 以分散風險

 據媒體援引消息人士報道,盡管與阿里巴巴建立了合作關系,但蘋果公司仍繼續(xù)與百度合作,為中國iPhone用戶開發(fā)人工智能(AI)功能。

  據悉,百度正在開發(fā)一種能處理圖片和文本的AI搜索功能,并對中文版Siri語音助手進行升級,這些功能屬于“Apple Intelligence”(蘋果智能)套件的一部分。

  蘋果在去年的WWDC(全球開發(fā)者大會)上首次公布了Apple Intelligence,并宣布與AI公司OpenAI合作。去年12月,Apple Intelligence在美國、英國、澳大利亞和加拿大等英語國家率先上線。

  有消息稱蘋果自 2023 年起開始測試來自中國開發(fā)者的不同AI模型,以推出面向中國市場的Apple Intelligence,并且一度選擇了百度作為主要合作伙伴。

  據媒體周二報道稱,蘋果近幾個月開始考慮其他選項,除了騰訊、阿里和字節(jié)跳動等中國互聯(lián)網巨頭外,該公司還測試了近來火爆的AI初創(chuàng)公司深度求索(DeepSeek)的AI模型。

  這一消息公布后,蘋果和阿里股價均大幅上漲。

  在經過權衡之后,蘋果最終選擇了與阿里合作開發(fā)AI功能。阿里董事局主席蔡崇信周四在迪拜的一場峰會上證實了這一合作關系。

  蘋果同時與百度和阿里合作,顯示出其在中國市場采取了多方合作的策略,以降低風險。蘋果在中國市場面臨著來自華為和Vivo等本土智能手機品牌的激烈競爭。

  在國際市場,Apple Intelligence依靠的是蘋果自研AI模型和與OpenAI的合作,后者的聊天機器人ChatGPT在處理iPhone的復雜任務上發(fā)揮了更多作用。

3.Anthropic秘密「混合模型」 Claude 4首曝細節(jié),硬剛GPT-5!深度推理模型來了

Anthropic終于要開始搞點事情啦!

近期的「推理模型」熱潮中,Anthropic除了其CEO打了幾個嘴炮外,還沒有掏出一個拿得出手的產品。

在這樣下去,可能要退出AI一線模型玩家行列了。Anthropic自己顯然不想看到這種情況發(fā)生。

就在剛剛,有消息稱,Anthropic會在未來幾周內發(fā)布其全新的「混合AI」模型。

Anthropic版「推理模型」,測試時計算完全掌控

在OpenAI去年秋季發(fā)布其「推理模型」后,谷歌以及國內眾多AI公司紛紛推出了自己的模型。作為一個主要的競爭對手,Anthropic在這場推理競賽中卻明顯缺席。

現(xiàn)在,我們知道了原因——Anthropic開發(fā)的是一款融合了推理能力的混合AI模型。

具體來說,這種「混合模型」可以使用更多的計算資源來計算復雜問題,但也能像傳統(tǒng)LLM一樣快速處理更簡單的任務,無需額外計算。

此外,模型還可以讓客戶控制它在查詢時使用的算力——換句話說就是,它在解決問題時「推理」的時長。

開發(fā)者可以通過一個滑動條來調整模型在嘗試找出答案或完成任務時將處理或生成的token數(shù)量。

通過將滑動條設置為「0」,開發(fā)者可以將Anthropic模型作為一個普通的、非推理AI使用,類似于OpenAI的GPT-4o。

OpenAI也有類似的功能,允許開發(fā)者控制其推理模型「思考」的時間。

但開發(fā)者僅限于「低」、「中」和「高」三種設置,很難預測模型在這些級別上實際會處理多少token——因此,也很難預測單次查詢的成本。

現(xiàn)在,OpenAI可能轉而成為追隨者。

2月13日,CEO Sam Altman表示,OpenAI計劃將其Orion大語言模型作為GPT-4.5發(fā)布——這是一個傳統(tǒng)的、非推理模型。之后,則會把GPT模型和o系列推理模型合并為一個單一的AI。

在外界看來,這和Anthropic尚未公開的技術路線可謂是如出一轍。(去年11月The Information曾做過相關預測)

從Anthropic和OpenAI設計模型和產品的方式,我們可以清晰地看出它們在競爭激烈的AI市場中的戰(zhàn)略定位。

OpenAI顯然更希望ChatGPT成為面向消費者或個人專業(yè)人士的突破性應用,這可能就是它在推理模型中使用低-中-高命名法的原因,因為這更容易讓普通用戶理解。

Anthropic則更專注于企業(yè)市場,這就是為什么它致力于開發(fā)能讓開發(fā)者通過滑動條方式更好地控制成本、速度和定價的功能。

據知情人士透露,Anthropic即將推出的模型在編程方面也取得了特別顯著的進展,這已經成為生成式AI在企業(yè)中最強大的應用之一。

當允許Anthropic模型使用最長時間「思考」時,在某些編程基準測試中,它的表現(xiàn)已經超過了客戶目前能訪問到的最先進的OpenAI推理模型(即o3-mini high)。

這位人士表示,雖然OpenAI的推理模型在更學術性的問題上表現(xiàn)更好,比如競爭性編程問題,但Anthropic的模型更擅長處理企業(yè)工程師可能遇到的實際編程任務。

例如,Anthropic的模型更善于理解由數(shù)千個文件組成的復雜代碼庫,并能一次性生成可用的完整代碼行。

不過,仍然懸而未決的重要問題是,Anthropic的新模型將收取多少費用,以及它是否會比OpenAI最近發(fā)布的o3-mini推理模型更便宜。后者因比OpenAI最受歡迎的非推理模型GPT-4o更便宜而給開發(fā)者留下了深刻印象。

目前還不清楚像DeepSeek和谷歌最新的Gemini模型這樣的超低價AI是否會推動所有模型的價格趨近于零。

就目前來看,市場上似乎在進行著兩場不同的競爭:

  • 在AI開發(fā)的前沿,那些在推理或編程方面能夠逐步改進的模型將繼續(xù)保持定價優(yōu)勢;
  • 在另一個更大的市場中,那些「夠用就好」(good-enough)的模型則可能會繼續(xù)展開價格戰(zhàn)。

對于這個全新的「混合模型」,有網友認為,Anthropic新模型的成敗將取決于它的成本,畢竟性能也很強的o3-mini是一個小模型,成本很低。

2027年收入飆至345億美元

根據The Information的報道,Anthropic在2023年燒了56億美元現(xiàn)金后,計劃在2025年將支出減少近半,并在2027年實現(xiàn)高達345億美元的收入。

要實現(xiàn)這樣的增長,Anthropic需要大幅縮小與市場領導者OpenAI之間的差距。目前OpenAI的收入可能是Anthropic的5倍以上——在2027年實現(xiàn)4,400億美元的收入。

Anthropic和OpenAI一直是企業(yè)在生成式AI投資方面的風向標,因此科技投資者正密切關注兩家公司的表現(xiàn)。

在最可能的基本情況下,Anthropic表示其收入將從2025年的22億美元增長至2027年的120億美元。

目前外界并不知道Anthropic在2024年的具體收入,不過其月收入從年初的約800萬美元上升到年底的約8,000萬美元,這表明其全年收入在4億至6億美元之間。Anthropic即將推出的新一代旗艦模型Claude有望支持其宏偉的增長目標。據知情人士透露,新模

型預計在未來幾周內發(fā)布。

然而,最近像DeepSeek這樣的超低成本模型的發(fā)布,引發(fā)了人們對AI公司是否需要降價以保持競爭力的質疑。

在DeepSeek發(fā)布后,Anthropic也是少數(shù)幾個沒有大幅降低模型價格的AI實驗室之一。

從Anthropic的融資材料來看,公司認為通過API向企業(yè)提供技術服務的機會,要大于與ChatGPT等聊天機器人競爭。

OpenAI的ChatGPT在普通用戶以及程序員、營銷人員和律師等專業(yè)人士群體中取得了突破性成功,截至去年底,其訂閱收入每月超過3.33億美元。

http://www.risenshineclean.com/news/21483.html

相關文章:

  • 武漢建設工程價格信息網杭州網站優(yōu)化體驗
  • 做時時彩網站牌照申請騰訊廣告
  • asp.net 價格查詢網站免費隱私網站推廣
  • 網站機房建設成本湖南網站seo營銷
  • 永城做網站利爾化學股票
  • 個人如何開網站賺錢平臺
  • 社區(qū)網站如何做長沙seo免費診斷
  • 網站前置審批流程seo建站公司
  • wordpress免費商城seo網站優(yōu)化軟件價格
  • 付費網站做推廣哪個好產品質量推廣營銷語
  • 青海建設廳網站特種作業(yè)seo怎樣優(yōu)化網站
  • 百度推廣基木魚重慶seo網站管理
  • 肇慶網絡推廣公司重慶做優(yōu)化的網絡公司
  • 幫客戶做插邊球網站谷歌google地圖
  • 網站開發(fā)用技術seo優(yōu)化方案報價
  • 創(chuàng)意網紅墻圖片互聯(lián)網seo是什么
  • 阿里云網站備案好了 怎么建站阿里巴巴運營
  • 莆田的外貿網站營銷軟文范例
  • 中國菲律賓商會win7優(yōu)化大師官網
  • 特色的網站建設百度站長平臺官網登錄入口
  • 哪個網站專業(yè)做商鋪網站建設的一般步驟
  • 企業(yè)級網站開發(fā)項目教程西點培訓學校
  • 國外商業(yè)網站建設無錫百度seo優(yōu)化
  • 做網站干什么用江蘇疫情最新消息
  • 網站建設大致價格2017推廣文案怎么寫吸引人
  • 淘寶上網站開發(fā)退款網絡營銷策劃的具體流程是
  • 上海定制網站建設費用在線磁力搜索神器
  • 泉州做網站開發(fā)公司關聯(lián)詞有哪些關系
  • 政府網站群建設 采購需求做百度關鍵詞排名的公司
  • 做餐飲在環(huán)保局網站備案靠譜的代運營公司