二維碼轉(zhuǎn)短鏈接生成器做排名優(yōu)化
推薦算法與系統(tǒng)在全球范圍內(nèi)已得到廣泛應(yīng)用,為用戶提供了更個(gè)性化和智能化的產(chǎn)品推薦體驗(yàn)。在推薦系統(tǒng)領(lǐng)域,AI建模中特征數(shù)據(jù)的復(fù)用、一致性等問(wèn)題嚴(yán)重影響了建模效率。阿里云機(jī)器學(xué)習(xí)平臺(tái) PAI 推出特征平臺(tái)(PAI-FeatureStore) 。在所有需要特征的AI建模場(chǎng)景,用戶可通過(guò) Feature Store 輕松地共享和重用特征數(shù)據(jù),減少資源和時(shí)間成本、提升工作效率。
什么是特征平臺(tái)
特征平臺(tái)(Feature Store) 是一種中心化的數(shù)據(jù)管理和共享平臺(tái),用于組織、存儲(chǔ)和管理機(jī)器學(xué)習(xí)和數(shù)據(jù)科學(xué)中使用的特征數(shù)據(jù)。在多個(gè)細(xì)分場(chǎng)景解決AI模型的訓(xùn)練和推理輸入特征數(shù)據(jù)問(wèn)題。
阿里云機(jī)器學(xué)習(xí)平臺(tái) PAI-FeatureStore 與阿里云多個(gè)云產(chǎn)品的深度結(jié)合,封裝從特征到模型的全鏈路。并且,基于推薦算法流程的開(kāi)發(fā),實(shí)現(xiàn)與已有的成熟推薦流程無(wú)縫銜接,進(jìn)一步提升算法工程師和開(kāi)發(fā)人員的效率。
通過(guò) PAI-FeatureStore,有效地提升工作效率、減少資源成本和開(kāi)發(fā)時(shí)間。作為一個(gè)集中的、可擴(kuò)展的、高效的特征數(shù)據(jù)存儲(chǔ)和訪問(wèn)解決方案,解決了在AI建模中特征數(shù)據(jù)的復(fù)用、一致性、可發(fā)現(xiàn)性和可管理性等問(wèn)題。PAI-FeatureStore 自動(dòng)完成在線和離線表的構(gòu)建,保證在線和離線的一致性,同時(shí)在特征表只存一份的情況下,能夠向多人共享特征;離線存儲(chǔ)方面支持阿里云云原生大數(shù)據(jù)計(jì)算服務(wù)MaxCompute,在線存儲(chǔ)方面支持阿里云實(shí)時(shí)數(shù)倉(cāng)Hologres、GraphCompute 和 TableStore 等產(chǎn)品,算法工程師無(wú)需深入了解各個(gè)存儲(chǔ)產(chǎn)品的使用細(xì)節(jié),通過(guò)網(wǎng)頁(yè)手動(dòng)操作或 Python SDK 即可完成特征處理。
PAI-FeatureStore 適用場(chǎng)景及優(yōu)勢(shì)功能
阿里云機(jī)器學(xué)習(xí)平臺(tái) PAI-FeatureStore 適用于推薦場(chǎng)景、用戶增長(zhǎng)、廣告或者是金融風(fēng)控場(chǎng)景等需要特征的AI建模場(chǎng)景,為數(shù)據(jù)分析師和建模人員提供統(tǒng)一的數(shù)據(jù)特征存儲(chǔ)和管理平臺(tái),方便進(jìn)行數(shù)據(jù)處理、特征提取和分析。
目前 PAI-FeatureStore 主要功能如下:
- 離線數(shù)據(jù)和在線數(shù)據(jù)一致:PAI-FeatureStore 中,各個(gè)產(chǎn)品的數(shù)據(jù)同步操作都封裝為一行數(shù)據(jù)同步的代碼,幫忙用戶屏蔽了不同存儲(chǔ)產(chǎn)品繁瑣的數(shù)據(jù)授權(quán)等操作細(xì)節(jié),保證數(shù)據(jù)一致性,提高特征數(shù)據(jù)處理和使用的準(zhǔn)確率和效率;
- 自動(dòng)關(guān)聯(lián)特征表:PAI-FeatureStore 中,支持將模型訓(xùn)練所需要的各種特征組合在一起,導(dǎo)出成模型訓(xùn)練所需要的訓(xùn)練表。當(dāng)訓(xùn)練所需的特征散落在多張不同的表里時(shí),PAI-FeatureStore支持自動(dòng)將多張表關(guān)聯(lián)導(dǎo)出。并且,支持序列表導(dǎo)出、按event_time關(guān)聯(lián)導(dǎo)出、自動(dòng)按表大小排序及優(yōu)化導(dǎo)出時(shí)間等;
- 自動(dòng)模型特征分析:PAI-FeatureStore 支持PAI-EAS自動(dòng)分析出模型需要使用的特征,并且自動(dòng)加載好相關(guān)特征。通過(guò)指定好PAI-FeatureStore 中的項(xiàng)目名、模型特征名等,預(yù)測(cè)引擎能自動(dòng)分析出所需要的特征并進(jìn)行加載,簡(jiǎn)化使用流程;
- 實(shí)時(shí)特征秒級(jí)讀取:PAI-FeatureStore 支持客戶對(duì)特征進(jìn)行分類的注冊(cè)。在實(shí)時(shí)特征值存在秒級(jí)別變化的推薦場(chǎng)景中,對(duì)特征鏈路要求高,當(dāng)有線上請(qǐng)求來(lái)讀取特征時(shí),PAI-FeatureStore會(huì)判斷需要讀取的若為實(shí)時(shí)特征,直接對(duì)在線存儲(chǔ)的進(jìn)行讀取。上千個(gè)實(shí)時(shí)特征的讀取可以在15ms,滿足低延遲要求;
- 多版本特征管理:PAI-FeatureStore 支持增量挖掘特征,解決特征種類復(fù)雜,線上數(shù)據(jù)來(lái)源多樣的問(wèn)題。方便線上模型迭代,同時(shí)節(jié)約存儲(chǔ)資源;
此外,PAI-FeatureStore 還有深度結(jié)合PAI全鏈路推薦系統(tǒng)PAI-REC,實(shí)現(xiàn)離在線一致性檢查;通過(guò)SDK可直接使用 PAI-FeatureStore 所有產(chǎn)品能力;支持 PAI-EAS 直接從 MaxCompute 拉取特征,減少在線存儲(chǔ)壓力等功能。
如何使用 PAI-FeatureStore
使用步驟請(qǐng)參考產(chǎn)品文檔:https://help.aliyun.com/zh/pai/user-guide/feature-store/
PAI-FeatureStore預(yù)計(jì)將于2023年9月中下旬在全Region正式上線。
目前PAI-FeatureStore僅供白名單申請(qǐng)使用,如果您希望使用 PAI-FeatureStore 功能,您在釘釘搜索群號(hào)“34415007523”或掃描下方二維碼進(jìn)入申請(qǐng)答疑群。