網(wǎng)站建設淺析昆明seo
在大語言模型 (LLM) 蓬勃發(fā)展的時代,諸如大規(guī)模多任務語言理解 (MMLU) 之類的基準測試,在推動 AI 于不同領域的語言理解與推理能力邁向極限方面,發(fā)揮著至關重要的關鍵作用。
然而,伴隨模型的持續(xù)改進與優(yōu)化,LLM 在這些基準測試中的表現(xiàn)已經(jīng)逐步趨于穩(wěn)定,這使得區(qū)分不同模型能力的差異變得越來越困難。
為了更好地評估 LLM 的能力,滑鐵盧大學、多倫多大學和卡內(nèi)基梅隆大學的研究人員聯(lián)合發(fā)布了 MMLU-Pro 數(shù)據(jù)集,整合了來自多個來源的問題,包括原始 MMLU 數(shù)據(jù)集、 STEM 網(wǎng)站、 TheoremQA 和 SciBench 等。該數(shù)據(jù)集現(xiàn)已在 hyper.ai 提供下載,下拉文章獲取鏈接~
9 月 9 日-9 月 14 日,hyper.ai 官網(wǎng)更新速覽:
-
優(yōu)質(zhì)公共數(shù)據(jù)集:10 個
-
優(yōu)質(zhì)教程精選:3 個
-
社區(qū)文章精選:4 篇
-
熱門百科詞條:5 條
-
9 月截稿頂會:3 個
訪問官網(wǎng):hyper.ai
公共數(shù)據(jù)集精選
1. MMLU-Pro 大規(guī)模多任務理解數(shù)據(jù)集
MMLU-Pro 數(shù)據(jù)集是一個更強大且更具挑戰(zhàn)性的大規(guī)模多任務理解數(shù)據(jù)集,旨在更嚴格地對大型語言模型的功能進行基準測試。該數(shù)據(jù)集包含 12K 個跨學科的復雜問題。
直接使用:https://go.hyper.ai/PwJDW
2. DeepGlobe18 道路提取數(shù)據(jù)集
道路挑戰(zhàn)賽的訓練數(shù)據(jù)包含 6,226 張 RGB 衛(wèi)星圖像,尺寸為 1024×1024 。圖像分辨率為 50 厘米像素,由 DigitalGlobe 的衛(wèi)星收集。
直接使用:https://go.hyper.ai/VIg0J
3. OpenForensics 人臉偽造檢測數(shù)據(jù)集
該數(shù)據(jù)集由 115K 張野外圖像和 334K 張人臉組成,所有圖像都有豐富的面部注釋,包括偽造類別、 邊界框 、分割掩碼、偽造邊界和一般面部地標,包含各種背景和多個不同年齡、性別、姿勢、位置和面部遮擋的人。
直接使用:https://go.hyper.ai/jTTRz
4. DeepfakeTIMIT 深度偽造檢測數(shù)據(jù)集
該數(shù)據(jù)集包含了使用 開源 的基于 生成 對抗網(wǎng)絡 (GAN) 的方法交換面孔的視頻。這些視頻基于原始的自動編碼器基礎的 Deepfake 算法 創(chuàng)建。
直接使用:https://go.hyper.ai/me1TI
5. SESYD 合成文檔數(shù)據(jù)庫
該數(shù)據(jù)集包含了具有基準真實信息的文檔圖像, 由 11 個集合組成,包含 284k 圖像、 190k 符號和 284k 字符,主要針對文檔圖像分析領域的 2 個主要研究問題:(1) 在線繪圖圖像(如平面圖和電路圖)中的象征識別和定位;(2) 地理地圖中字符的分割和識別。
直接使用:https://go.hyper.ai/ZqRTQ
6. LAV-DF 多模態(tài) DeepFake 音頻視覺數(shù)據(jù)集
LAV-DF 是一個多模態(tài)(視頻篡改和音頻篡改)數(shù)據(jù)集,源自 VoxCeleb2 數(shù)據(jù)集,包含 136,304 段視頻,其中 36,431 段真實視頻,99,873 段偽造視頻。
直接使用:https://go.hyper.ai/ujock
7. Vibrent Clothes Rental Dataset 服裝租賃數(shù)據(jù)集
該數(shù)據(jù)集包含 64k 筆交易、 2.2k 名匿名用戶的租賃歷史記錄和 15.8k 套獨特的服裝,其中每件實物的屬性和租賃歷史都有細致的信息記錄。所有服裝都列為單件商品或其相應的商品組,指的是單件商品之間的共享設計,每件服裝都附有一組描述其某些屬性的 標簽 。
直接使用:https://go.hyper.ai/PFlKA
8. FFIW10K 人臉偽造數(shù)據(jù)集
該數(shù)據(jù)包括從 Youtube 收集的 10k 個高質(zhì)量偽造視頻,平均每幀有三個人臉,每個視頻都包含真實人臉和偽造人臉,更加接近現(xiàn)實復雜場景。操縱過程是全自動的,由領域?qū)官|(zhì)量評估網(wǎng)絡控制,使數(shù)據(jù)集具有高度可擴展性和低人力成本。
直接使用:https://go.hyper.ai/AHS7y
9. ForgeryNet 人臉偽造數(shù)據(jù)集
該數(shù)據(jù)集包含了 290 萬張圖像和 221,247 個視頻,涵蓋了來自全球的 7 種圖像層面和 8 種視頻層面的偽造操作方法。這個數(shù)據(jù)集為研究者提供了豐富的資源,以支持圖像和視頻層面的 4 種任務:圖像偽造分類、空間偽造定位、視頻偽造分類和時間偽造定位。
直接使用:https://go.hyper.ai/Yx0mj
10. EEG Eve State Dataset 眼部狀態(tài)腦電圖數(shù)據(jù)集
該數(shù)據(jù)集包含了 EEG 測量的實例,其輸出是眼睛是睜開還是閉合的狀態(tài)。數(shù)據(jù)集中的值按時間順序排列,其中 0 表示眼睛睜開狀態(tài),1 表示眼睛閉合狀態(tài)。數(shù)據(jù)集包含 14 個 EEG 測量值,分別標記為 AF3, F7, F3, FC5, T7, P, O1, O2, P8, T8, FC6, F4, F8, AF4 。
直接使用:https://go.hyper.ai/RTBDy
更多公共數(shù)據(jù)集,請訪問:
https://hyper.ai/datasets
公共教程精選
1. 一鍵部署 DeepSeek-Prover-V1.5
該模型是 DeepSeek 于 2024 年開源的數(shù)學定理證明模型,研究團隊在 Lean 4 中引入了該模型,模型通過自我迭代和 Lean 證明器監(jiān)督,構建了一個「圍棋」式的學習環(huán)境。該教程是對模型進行一鍵部署 Demo 的分步使用。
直接使用:https://go.hyper.ai/MevMB
2. LLaVA OneVision 多模態(tài)全能視覺模型 Demo
該模型能夠處理圖像、文本、圖像文本交錯輸入和視頻,是首個能夠同時突破開放多模態(tài)模型在這三個重要 計算機視覺 場景性能瓶頸的單模型。進入官網(wǎng)克隆并啟動容器,直接復制 API 地址,即可對模型進行推理體驗。
直接使用:https://go.hyper.ai/Dcg74
3. 在線教程|大人,文生圖的時代又變了!SD 核心成員自立門戶,首個模型 FLUX.1 硬剛 SD 3 和 Midjourney
文生圖模型的競爭愈發(fā)激烈!前 Stable Diffusion 核心成員自立門戶,發(fā)布了文生圖模型 FLUX,從商業(yè)用途到開源個人使用,全面覆蓋。生成效果非常接近真人實拍,人物細節(jié)表現(xiàn)十分逼真。目前 hyper.ai 已上線「FLUX ComfyUI(含黑神話悟空 LoRA 訓練版)」,點擊以下鏈接即可根據(jù)教程部署。
直接使用:https://go.hyper.ai/trQhv
社區(qū)文章精選
1. 數(shù)據(jù)集匯總|DeepFake 亂象叢生,用魔法打敗魔法!高質(zhì)量數(shù)據(jù)集助力偽造監(jiān)測技術發(fā)展
對于人臉識別、 DeepFake 亂象,亟需升級人臉識別和偽造檢測技術,以精確判斷被篡改的圖像和視頻。 HyperAI 超神經(jīng)為大家匯總了常用的 11 個人臉識別、 DeepFake 數(shù)據(jù)集,點擊一鍵下載。
查看完整匯總:https://go.hyper.ai/EMKo2
2. Apple Intelligence 深夜炸場!蘋果發(fā)布 4 顆自研芯片,iPhone/iWatch/AirPods 大升級
在 9 月 10 日的秋季新品發(fā)布會上,蘋果推出 iPhone 16 、 AirPods 4 、 Apple Watch Series 10 等新品,基于自研芯片,在性能上實現(xiàn)了重大飛躍,同時全面融入 Apple Intelligence,為用戶帶來前所未有的 智能體 驗。本文是對 Apple 秋季新品發(fā)布會的全面報道。
查看完整報道:https://go.hyper.ai/H7P8X
3. 靈敏度提高 56%,港中文/復旦/耶魯?shù)嚷?lián)袂提出全新蛋白質(zhì)同源物檢測方法
在對蛋白質(zhì)的識別過程中,蛋白質(zhì)序列的同源性鑒定是其中一項至關重要的任務。為解決蛋白質(zhì)遠同源性研究的痛點,基于蛋白質(zhì)語言模型和密集檢索技術,香港中文大學李煜,聯(lián)合復旦大學智能復雜體系實驗室、上海 人工智能 實驗室青年研究員孫思琦、耶魯大學 Mark Gerstein 提出了一種超快速、高靈敏度的同源物檢測框架——密集同源物檢索器。本文是對研究論文的詳細解讀與分享。
查看完整報道:https://go.hyper.ai/vLAej
4. 基于 2,500 平方公里實景數(shù)據(jù),北師大團隊提出 StarFusion 模型,實現(xiàn)高空間分辨率圖像預測
北京師范大學地表過程與資源生態(tài)國家重點實驗室陳晉團隊,提出了一種雙流時空解耦融合架構模型 StarFusion,該模型能夠克服大多數(shù)現(xiàn)有 深度學習 算法需要 HSR 時間序列圖像進行訓練的問題,充分實現(xiàn)高空間分辨率圖像的預測。本文是對研究論文的詳細解讀與分享。
查看完整報道:https://go.hyper.ai/7LmzA
熱門百科詞條精選
- Sigmoid 函數(shù)
- 配對 t 檢驗 Paired t-Test
- 對比學習 Contrastive Learning
- 半 監(jiān)督學習 Semi-Supervised Learning
- 數(shù)據(jù)增強 Data Augmentation
這里匯編了數(shù)百條 AI 相關詞條,讓你在這里讀懂「人工智能」:
https://go.hyper.ai/wiki
一站式追蹤人工智能學術頂會:https://go.hyper.ai/event
關于 HyperAI 超神經(jīng) (hyper.ai)
HyperAI 超神經(jīng) (hyper.ai) 是國內(nèi)領先的人工智能及高性能計算社區(qū), 致力于成為國內(nèi) 數(shù)據(jù)科學 領域的基礎設施,為國內(nèi)開發(fā)者提供豐富、優(yōu)質(zhì)的公共資源,截至目前已經(jīng):
-
為 1300+ 公開數(shù)據(jù)集提供國內(nèi)加速下載節(jié)點
-
收錄 400+ 經(jīng)典及流行在線教程
-
解讀 100+ AI4Science 論文案例
-
支持 500+ 相關詞條查詢
-
托管國內(nèi)首個完整的 Apache TVM 中文文檔
訪問官網(wǎng)開啟學習之旅:
https://hyper.ai