中文亚洲精品无码_熟女乱子伦免费_人人超碰人人爱国产_亚洲熟妇女综合网

當(dāng)前位置: 首頁(yè) > news >正文

專(zhuān)業(yè)APP客戶端做網(wǎng)站蘇州首頁(yè)關(guān)鍵詞優(yōu)化

專(zhuān)業(yè)APP客戶端做網(wǎng)站,蘇州首頁(yè)關(guān)鍵詞優(yōu)化,個(gè)人視頻制作公司,做網(wǎng)站開(kāi)發(fā)有什么專(zhuān)業(yè)證引言: 處理大量PDF文檔的文本提取任務(wù)可能是一項(xiàng)繁瑣的工作。本文將介紹一個(gè)使用Python編寫(xiě)的工具,可通過(guò)簡(jiǎn)單的操作一鍵提取大量PDF文檔中的文本內(nèi)容,極大地提高工作效率。 import wx import pathlib import fitzclass PDFExtractor(wx.Fr…

引言:

處理大量PDF文檔的文本提取任務(wù)可能是一項(xiàng)繁瑣的工作。本文將介紹一個(gè)使用Python編寫(xiě)的工具,可通過(guò)簡(jiǎn)單的操作一鍵提取大量PDF文檔中的文本內(nèi)容,極大地提高工作效率。

import wx
import pathlib
import fitzclass PDFExtractor(wx.Frame):def __init__(self, parent, title):super(PDFExtractor, self).__init__(parent, title=title, size=(400, 200))panel = wx.Panel(self)vbox = wx.BoxSizer(wx.VERTICAL)self.file_picker = wx.FilePickerCtrl(panel, style=wx.FLP_DEFAULT_STYLE | wx.FLP_USE_TEXTCTRL)self.save_picker = wx.DirPickerCtrl(panel, style=wx.DIRP_DEFAULT_STYLE | wx.DIRP_USE_TEXTCTRL)self.extract_button = wx.Button(panel, label="提取")self.extract_button.Bind(wx.EVT_BUTTON, self.on_extract)vbox.Add(wx.StaticText(panel, label="選擇PDF文件:"), 0, wx.ALL | wx.EXPAND, 5)vbox.Add(self.file_picker, 0, wx.ALL | wx.EXPAND, 5)vbox.Add(wx.StaticText(panel, label="選擇輸出路徑:"), 0, wx.ALL | wx.EXPAND, 5)vbox.Add(self.save_picker, 0, wx.ALL | wx.EXPAND, 5)vbox.Add(self.extract_button, 0, wx.ALL | wx.CENTER, 5)panel.SetSizer(vbox)def on_extract(self, event):pdf_path = self.file_picker.GetPath()save_path = self.save_picker.GetPath()if pdf_path and save_path:progress_dialog = wx.ProgressDialog("提取進(jìn)度", "正在提取...", maximum=100, parent=self)try:with fitz.open(pdf_path) as doc:total_pages = len(doc)progress = 0for index, page in enumerate(doc):text = page.get_text()output_file = pathlib.Path(save_path) / f"page_{index + 1}.txt"output_file.write_text(text, encoding="utf-8")progress = int((index + 1) / total_pages * 100)progress_dialog.Update(progress, f"正在提取第 {index + 1} 頁(yè) / 共 {total_pages} 頁(yè)")progress_dialog.Update(100, "提取完成!")wx.MessageBox("提取完成!", "成功", wx.OK | wx.ICON_INFORMATION)except Exception as e:wx.MessageBox(str(e), "錯(cuò)誤", wx.OK | wx.ICON_ERROR)finally:progress_dialog.Destroy()else:wx.MessageBox("請(qǐng)選擇PDF文件和輸出路徑!", "錯(cuò)誤", wx.OK | wx.ICON_ERROR)def main():app = wx.App()frame = PDFExtractor(None, "PDF提取器")frame.Show()app.MainLoop()if __name__ == '__main__':main()

在這個(gè)示例中,我們創(chuàng)建了一個(gè)wx.ProgressDialog對(duì)象,用于顯示提取進(jìn)度。在提取每一頁(yè)的文本時(shí),我們使用enumerate函數(shù)獲取當(dāng)前頁(yè)的索引,并根據(jù)總頁(yè)數(shù)計(jì)算提取進(jìn)度的百分比。然后,我們使用progress_dialog.Update方法更新進(jìn)度條的進(jìn)度和顯示的文本。

請(qǐng)注意,由于提取過(guò)程可能需要一些時(shí)間,所以我們使用進(jìn)度條對(duì)話框來(lái)顯示進(jìn)度并阻止用戶的交互。在提取完成后,進(jìn)度條對(duì)話框會(huì)自動(dòng)關(guān)閉。

其中:

1)文檔選擇:?

? ? ? self.file_picker = wx.FilePickerCtrl(panel, style=wx.FLP_DEFAULT_STYLE | wx.FLP_USE_TEXTCTRL)

2、文件夾選擇:? ? ?

 ? self.save_picker = wx.DirPickerCtrl(panel, style=wx.DIRP_DEFAULT_STYLE | wx.DIRP_USE_TEXTCTRL)

3、進(jìn)度顯示:

progress = int((index + 1) / total_pages * 100)progress_dialog.Update(progress, f"正在提取第 {index + 1} 頁(yè) / 共 {total_pages} 頁(yè)")progress_dialog.Update(100, "提取完成!")

4、最重要的:獲得pdf中的文本:

with fitz.open(pdf_path) as doc:total_pages = len(doc)progress = 0for index, page in enumerate(doc):text = page.get_text()output_file = pathlib.Path(save_path) / f"page_{index + 1}.txt"output_file.write_text(text, encoding="utf-8")

結(jié)果如下:

??

http://www.risenshineclean.com/news/65932.html

相關(guān)文章:

  • 如何做一個(gè)網(wǎng)站營(yíng)銷(xiāo)策劃方案1000例
  • 網(wǎng)站域名禁止續(xù)費(fèi)自助建站系統(tǒng)源碼
  • 青島建站模板制作什么平臺(tái)打廣告比較好免費(fèi)的
  • 珠海 網(wǎng)站 設(shè)計(jì)百度收錄查詢
  • 做pc端網(wǎng)站訊息上海廣告公司
  • 網(wǎng)站建設(shè)排名奉節(jié)縣關(guān)鍵詞seo排名優(yōu)化
  • 番禺人才網(wǎng)賬號(hào)是什么南昌seo網(wǎng)站推廣
  • 網(wǎng)站建設(shè) 長(zhǎng)安淄博網(wǎng)站優(yōu)化
  • 網(wǎng)站建設(shè)案例資料國(guó)外免費(fèi)網(wǎng)站域名服務(wù)器查詢
  • 網(wǎng)站建設(shè)怎么開(kāi)票怎么建立自己的網(wǎng)站
  • 做網(wǎng)站v1認(rèn)證是什么意思常見(jiàn)的網(wǎng)絡(luò)營(yíng)銷(xiāo)平臺(tái)有哪些
  • 外匯期貨喊單網(wǎng)站怎么做的網(wǎng)絡(luò)營(yíng)銷(xiāo)產(chǎn)品策略
  • WordPress手機(jī)縮略圖過(guò)大優(yōu)化關(guān)鍵詞的公司
  • 電子 網(wǎng)站建設(shè)申請(qǐng)過(guò)程網(wǎng)站排名seo培訓(xùn)
  • 網(wǎng)頁(yè)設(shè)計(jì)怎么做網(wǎng)站西安網(wǎng)站建設(shè)方案優(yōu)化
  • 做網(wǎng)站大概要多搜索引擎競(jìng)價(jià)排名
  • 對(duì)電子商務(wù)網(wǎng)站與建設(shè)的心得谷歌瀏覽器下載安裝2022最新版
  • 政府網(wǎng)站建設(shè)內(nèi)容保障機(jī)制建網(wǎng)站的軟件
  • 網(wǎng)站開(kāi)發(fā)后怎么上線推廣app平臺(tái)
  • 外貿(mào)網(wǎng)站推廣軟件提高工作效率總結(jié)心得
  • 東莞網(wǎng)站建設(shè)圖表搜索引擎優(yōu)化的各種方法
  • 大氣的網(wǎng)站設(shè)計(jì)常見(jiàn)的系統(tǒng)優(yōu)化軟件
  • 做視頻網(wǎng)站新手教學(xué)近期國(guó)際新聞
  • 建設(shè)專(zhuān)業(yè)網(wǎng)站電話咨詢百度推廣效果
  • 深圳微商城網(wǎng)站制作聯(lián)系電話南寧百度推廣代理商
  • 網(wǎng)站總體規(guī)劃設(shè)計(jì)說(shuō)明南京seo建站
  • 網(wǎng)站建設(shè)好的廣州seo推廣培訓(xùn)
  • 網(wǎng)站開(kāi)發(fā) 定制 合同范本qq群推廣鏈接
  • 網(wǎng)站建設(shè)流程草圖企業(yè)網(wǎng)站開(kāi)發(fā)制作
  • 虛擬服務(wù)器建網(wǎng)站2023最新15件重大新聞