世界做詭異的地方網站站長工具seo綜合查詢收費嗎
pyWhat:精簡海聯(lián)數據,直達數據弱點要害- 精選真開源,釋放新價值。
概覽
pyWhat是Github社區(qū)上一款比較實用的開源Python腳本工具。它能夠快速提取信息中的 IP 地址、郵箱、信用卡、數字貨幣錢包地址、YouTube 視頻等內容。當你遇到了一串莫名其妙的文本,比如說“5f4dcc3b5aa765d61d8327deb882cf99”,而你又一頭霧水的時候,你該怎么辦?在pyWhat的幫助下,我們只需要詢問what “5f4dcc3b5aa765d61d8327deb882cf99”,那么pyWhat就會告訴你你想知道的一切!pyWhat的任務就是幫助你識別目標數據,無論你提供的是文件還是文本,甚至是十六進制參數!不僅如此,pyWhat 還可對文件和目錄進行掃描,通過遞歸搜索,快速獲取核心信息,并對結果進行篩選、過濾、排序、導出等操作
主要功能
- Pcap文件快速分析
假設你在一次網絡攻擊活動中獲取到了一個.pcap文件,那么pyWhat將可以快速幫助你識別下列信息:
所有的哈希 | 信用卡卡號 | 加密貨幣地址 |
---|---|---|
社保號碼 | … |
只需幾秒鐘,pyWhat就可以快速幫助你識別目標文件中的關鍵數據。
-
如何使用
$ pip3 install pywhat
installs optional dependencies that may improve the speed
$ pip3 install pywhat[optimize]
$ brew install pywhat
-
漏洞賞金
你可以使用 PyWhat 來掃描一些可以通過漏洞賞金計劃賺錢的東西,例如:API 密鑰、Webhook、證書
和更多的事務。使用以下命令運行 PyWhat:
pywhat --include "Bug Bounty" TEXT
示例:GitHub 存儲庫 API 密鑰泄露
-
下載組織的所有 GitHub 存儲庫;
-
搜索任何可以作為賞金提交的內容,例如 API 密鑰;
Download all repositories
GHUSER=CHANGEME; curl “https://api.github.com/users/$GHUSER/repos?per_page=1000” | grep -o ‘git@[^"]*’ | xargs -L1 git clone
Will print when it finds things.
Loops over all files in current directory.
find . -type f -execdir pywhat --include ‘Bug Bounty’ {} ;
示例: 掃描所有網頁以尋找賞金
# Recursively download all web pages of a site
wget -r -np -k https://skerritt.blog# Will print when it finds things.
# Loops over all files in current directory.
find . -type f -execdir pywhat --include 'Bug Bounty' {} \;
- 排序、導出
排序:可以使用pyWhat對輸出進行排序,使用what --help獲取更多信息。
what -k rarity --reverse TEXT
導出:可以使用pyWhat導出為 json what --json,并且可以使用 將結果直接發(fā)送到文件what --json > file.json。
無邊界模式:pyWhat具有一種特殊模式,用于匹配字符串中的可識別信息。默認情況下,它在 CLI 中啟用,但在 API 中禁用。使用what --help或參考API文檔https://github.com/bee-san/pyWhat/wiki/API了解更多信息。
- 性能比較與優(yōu)化
在性能比較與優(yōu)化方面,PyWhat庫在文本解析任務中展現了出色的效率。以下是一些性能測試和優(yōu)化建議,以幫助開發(fā)者更好地了解和提升PyWhat庫的性能。
import time
from pywhat import what# 生成一個包含大量文本的列表
texts = ["文本內容" + str(i) for i in range(100000)]# 記錄解析開始時間
start_time = time.time()# 在大量文本上執(zhí)行解析操作
for text in texts:result = what(text)# 記錄解析結束時間
end_time = time.time()# 計算解析時間
elapsed_time = end_time - start_time
print(f"解析 {len(texts)} 個文本的總時間: 0.0545 秒")
- 多語言支持
PyWhat庫支持多種語言,使其更具國際化的特性。用戶可以選擇在文本解析中使用的語言,以確保對不同語種的支持。以下是一個使用語言選擇的示例:
from pywhat import whattext = "明天天氣如何?"
result = what(text, lang="zh") # 選擇中文語言解析print(result)
- 自定義規(guī)則
PyWhat庫允許用戶定義自己的規(guī)則,以適應特定的文本解析需求。這對于處理特殊格式或特定領域的文本非常有用。以下是一個自定義規(guī)則的示例:
from pywhat import what, Ruletext = "根據自定義規(guī)則解析文本"
rule = Rule("自定義規(guī)則", ["自定義", "解析"])
result = what(text, custom_rules=[rule])print(result)
信息
截至發(fā)稿概況如下:
-
軟件地址:https://github.com/bee-san/pyWhat
-
軟件協(xié)議: MIT license
-
編程語言:
語言 | 占比 |
---|---|
Python | 99.7% |
Dockerfile | 0.3% |
- 收藏數量:6.4K
pyWhat是一款強大的開源Python工具,它在信息識別與數據分析領域展示了高度的靈活性與實用性。該工具能夠智能解析文本或文件中的各種關鍵信息,比如IP地址、電子郵件、信用卡號乃至加密貨幣錢包地址等,顯著提升了從復雜數據中提取價值的效率。對于安全研究人員而言,其快速分析Pcap文件的能力,以及在漏洞賞金狩獵場景中的應用尤為突出,能夠幫助用戶自動化發(fā)現API密鑰、Webhook配置等敏感信息,有效促進網絡安全的維護。
隨著數據量的爆炸性增長,如何進一步優(yōu)化像pyWhat這類工具的性能,使其在保持高速解析能力的同時,又能兼顧資源消耗與跨平臺兼容性?此外,用戶自定義規(guī)則的潛力如何被充分挖掘,以應對日新月異的互聯(lián)網信息格式與安全挑戰(zhàn),也是值得深入探討的話題。
各位在使用 PyWhat 的過程中是否發(fā)現了什么問題?熱烈歡迎各位在評論區(qū)分享交流心得與見解!!!
聲明:本文為辣碼甄源原創(chuàng),轉載請標注"辣碼甄源原創(chuàng)首發(fā)"并附帶原文鏈接。