中文亚洲精品无码_熟女乱子伦免费_人人超碰人人爱国产_亚洲熟妇女综合网

當(dāng)前位置: 首頁(yè) > news >正文

小地方的旅游網(wǎng)站怎么做網(wǎng)絡(luò)公司排名

小地方的旅游網(wǎng)站怎么做,網(wǎng)絡(luò)公司排名,香港服務(wù)器推薦,什么網(wǎng)站比較容易做🥰大家知道嗎,之前在給AI大模型"喂數(shù)據(jù)"的時(shí)候,我們往往需要把非結(jié)構(gòu)化數(shù)據(jù)(比如PDF、PPT、Excel等)自己手動(dòng)轉(zhuǎn)成結(jié)構(gòu)化的格式,這可真是太累人兒了。🥵 幸好現(xiàn)在有了Unstructured這個(gè)神級(jí)庫(kù),它內(nèi)置的數(shù)據(jù)提取函數(shù)可以幫我們快速高效地完成這個(gè)…

🥰大家知道嗎,之前在給AI大模型"喂數(shù)據(jù)"的時(shí)候,我們往往需要把非結(jié)構(gòu)化數(shù)據(jù)(比如PDF、PPT、Excel等)自己手動(dòng)轉(zhuǎn)成結(jié)構(gòu)化的格式,這可真是太累人兒了。🥵

幸好現(xiàn)在有了Unstructured這個(gè)神級(jí)庫(kù),它內(nèi)置的數(shù)據(jù)提取函數(shù)可以幫我們快速高效地完成這個(gè)轉(zhuǎn)換過(guò)程。而且支持常見(jiàn)的多種文件格式!🐶

比如說(shuō),如果我們要從一個(gè)PPT文件里提取數(shù)據(jù),可以用partition_pptx函數(shù):

from unstructured.partition.pptx import partition_pptxfilename = "example_files/msft_openai.pptx"
elements = partition_pptx(filename=filename)

這個(gè)函數(shù)會(huì)把PPT文件的內(nèi)容解析成一個(gè)elements列表,每個(gè)元素都是一個(gè)Element對(duì)象,分別代表PPT里的標(biāo)題、文字、圖片等內(nèi)容。

但是我們想要的是結(jié)構(gòu)化數(shù)據(jù)而不是對(duì)象呀,所以還需要再轉(zhuǎn)換一下:

element_dict = [el.to_dict() for el in elements]
print(json.dumps(element_dict, indent=2))

這兩行代碼的作用是:

  1. 遍歷elements列表,把每個(gè)Element對(duì)象都轉(zhuǎn)換成字典(調(diào)用它們的to_dict方法)
  2. 把這些字典組成一個(gè)新列表element_dict
  3. 使用json.dumpselement_dict轉(zhuǎn)成Json格式的字符串,并指定indent=2讓結(jié)果更加美觀

是不是很酷?現(xiàn)在我們就擁有了結(jié)構(gòu)化的數(shù)據(jù)啦!

如果是PDF文件的話,流程也差不多:

from unstructured.shared import Files, PartitionParameters
from unstructured.openai_api import SDKfilename = "example_files/CoT.pdf"
with open(filename, "rb") as f:files = Files(content=f.read(), file_name=filename)req = PartitionParameters(files=files, strategy='hi_res', pdf_infer_table_structure=True)s = SDK.get_instance() 
resp = s.general.partition(req)
print(json.dumps(resp.elements, indent=2))

這里主要新的地方是用Files對(duì)象來(lái)存PDF文件的內(nèi)容,然后定義一個(gè)PartitionParameters來(lái)設(shè)置處理策略(比如識(shí)別表格等)。

最后就是創(chuàng)建SDK實(shí)例,調(diào)用partition方法,傳入之前定義的參數(shù),就能獲取PDF里的結(jié)構(gòu)化數(shù)據(jù)啦!

對(duì)于Excel文件,官方文檔里也有介紹,應(yīng)該也是類似的操作。

有了這些技能,我們就能把海量的非結(jié)構(gòu)化數(shù)據(jù)高效地轉(zhuǎn)換成結(jié)構(gòu)化格式,喂給大模型"吃"啦!以后制作AI應(yīng)用的時(shí)候,效率和開(kāi)發(fā)體驗(yàn)都會(huì)更上一層樓~🚀

http://www.risenshineclean.com/news/60152.html

相關(guān)文章:

  • 宜昌網(wǎng)站制作公司億騰百度風(fēng)云排行榜官網(wǎng)
  • 網(wǎng)站優(yōu)化靠譜seoseo零基礎(chǔ)教學(xué)
  • 買外貿(mào)衣服的網(wǎng)站佛山抖音seo
  • 小紅書關(guān)鍵詞排名優(yōu)化網(wǎng)站優(yōu)化包括哪些內(nèi)容
  • 宣傳冊(cè)設(shè)計(jì)與制作圖片網(wǎng)站排名優(yōu)化服務(wù)
  • 鄭州網(wǎng)站建設(shè)優(yōu)點(diǎn)如何注冊(cè)域名及網(wǎng)站
  • jsp 響應(yīng)式網(wǎng)站模板下載seo網(wǎng)絡(luò)營(yíng)銷外包
  • 鮮花網(wǎng)站建設(shè)主要內(nèi)容it培訓(xùn)機(jī)構(gòu)排行榜
  • 做網(wǎng)站公司深圳國(guó)外產(chǎn)品推廣平臺(tái)
  • 網(wǎng)站建設(shè)要代碼有什么好處中國(guó)疫情最新數(shù)據(jù)
  • 做網(wǎng)站怎么自定義背景圖片管理系統(tǒng)
  • 做圖書網(wǎng)站的代碼熊貓seo實(shí)戰(zhàn)培訓(xùn)
  • 重慶江津網(wǎng)站建設(shè)外包seo服務(wù)收費(fèi)標(biāo)準(zhǔn)
  • 域名及網(wǎng)站建設(shè)實(shí)驗(yàn)報(bào)告長(zhǎng)尾關(guān)鍵詞快速排名軟件
  • 網(wǎng)站建設(shè)客戶需求表 文庫(kù)北京網(wǎng)站推廣營(yíng)銷服務(wù)電話
  • 做網(wǎng)站什么都不懂 怎么做電工培訓(xùn)機(jī)構(gòu)
  • 短鏈接生成算法淄博seo網(wǎng)絡(luò)公司
  • 濟(jì)南旅游網(wǎng)站建設(shè)現(xiàn)狀sem和seo哪個(gè)工作好
  • 連云港網(wǎng)站 建設(shè)百度一下就知道
  • 手機(jī)網(wǎng)站開(kāi)發(fā)者工具淄博seo網(wǎng)站推廣
  • 飼料公司網(wǎng)站建設(shè)方案如何制作一個(gè)宣傳網(wǎng)頁(yè)
  • 溫州外貿(mào)網(wǎng)站設(shè)計(jì)如何進(jìn)行網(wǎng)站宣傳推廣
  • 為什么說(shuō)做網(wǎng)站賺錢搜索排名影響因素
  • 蘇州網(wǎng)站建設(shè)科技有限公司html網(wǎng)頁(yè)制作
  • 上海做設(shè)計(jì)公司網(wǎng)站疫情最新政策最新消息
  • vs 2008網(wǎng)站做安裝包太原seo公司
  • 日本做受視頻網(wǎng)站互聯(lián)網(wǎng)廣告代理商
  • 校園網(wǎng)站如何建立網(wǎng)站關(guān)鍵詞排名優(yōu)化方法
  • 鄭州東區(qū)做網(wǎng)站的公司蘋果自研搜索引擎或?yàn)樘娲雀?/a>
  • 行政部建設(shè)公司網(wǎng)站值得收藏的五個(gè)搜索引擎