服務(wù)器與網(wǎng)站全網(wǎng)seo是什么意思
-------------詞云圖集合-------------
用Wordcloud+PyQt5寫個(gè)詞云圖生成器1.0
WordCloud去掉停用詞(fit_words+generate)的2種用法
通過詞頻來繪制詞云圖(jieba+WordCloud)
Python教程95:去掉停用詞+詞頻統(tǒng)計(jì)+jieba.tokenize示例用法
將進(jìn)酒—李白process_text詞頻統(tǒng)計(jì),及詞頻可視化分析
使用wordcloud模塊,繪制一個(gè)自定義的詞云圖形狀
使用WordCloud模塊中repeat參數(shù),做一個(gè)關(guān)鍵字重復(fù)的詞云圖
關(guān)于詞云圖顯示異常,出現(xiàn)亂碼的解決辦法
盤點(diǎn)WordCloud模塊,詞云圖的相關(guān)知識(shí)點(diǎn)
Python源碼05:使用Pyecharts畫詞云圖圖
1.WordCloud參數(shù)的用法:
1.1.基本參數(shù)
font_path:字符串類型,指定字體文件的路徑。由于默認(rèn)字體可能不支持中文,因此需要指定一個(gè)支持中文的字體文件路徑來正確顯示中文。
width:整數(shù)類型,默認(rèn)值為400。指定生成詞云圖的寬度(像素)。
height:整數(shù)類型,默認(rèn)值為200。指定生成詞云圖的高度(像素)。
background_color:顏色值類型,默認(rèn)值為"black"。指定詞云圖的背景顏色。
1.2.詞云形狀和布局
mask:ndarray類型或None,默認(rèn)值為None。如果指定了一個(gè)ndarray作為遮罩,則詞云圖的形狀將被該遮罩取代。遮罩圖像中白色(#FFFFFF)的部分將不會(huì)繪制詞云,其余部分將用于繪制。
scale:浮點(diǎn)數(shù)類型,默認(rèn)值為1。指定計(jì)算和繪圖之間的比例,即放大畫布的尺寸(比例尺)。對(duì)于大型詞云圖,使用比例尺可能比設(shè)置畫布尺寸更快,但單詞匹配可能不是很好。
prefer_horizontal:浮點(diǎn)數(shù)類型,默認(rèn)值為0.9。指定詞語(yǔ)水平方向排版出現(xiàn)的頻率。由于水平排版和垂直排版概率之和為1,因此默認(rèn)垂直方向排版頻率為0.1。
1.3.字體和詞頻
min_font_size:整數(shù)類型,默認(rèn)值為4。指定詞云中顯示的最小字體大小。
max_font_size:整數(shù)類型或None,默認(rèn)值為None。指定詞云中顯示的最大字體大小。如果沒有設(shè)置,則直接使用畫布的大小作為參考。
font_step:整數(shù)類型,默認(rèn)值為1。指定詞云中字體大小的步進(jìn)間隔。如果步長(zhǎng)大于1,會(huì)加快運(yùn)算速度但可能導(dǎo)致結(jié)果出現(xiàn)較大的誤差。
max_words:數(shù)字類型,默認(rèn)值為200。指定要顯示的詞的最大個(gè)數(shù)。
stopwords:字符串集合或None,默認(rèn)值為None。指定需要屏蔽的詞。如果為空,則使用內(nèi)置的停用詞列表。
1.4.顏色和配色
colormap:字符串或matplotlib colormap類型,默認(rèn)值為"viridis"。指定給每個(gè)單詞隨機(jī)分配顏色的配色方案。如果指定了color_func參數(shù),則忽略此參數(shù)。
color_func:可調(diào)用對(duì)象,默認(rèn)值為None。指定生成新顏色的函數(shù)。如果為空,則使用默認(rèn)的顏色生成函數(shù)。
1.5.其他參數(shù)
mode:字符串類型,默認(rèn)值為"RGB"。當(dāng)參數(shù)為"RGBA"并且background_color不為空時(shí),背景為透明。
relative_scaling:浮點(diǎn)數(shù)類型,默認(rèn)值為0.5。指定詞頻和字體大小的關(guān)聯(lián)性。如果設(shè)置為1,則一個(gè)單詞出現(xiàn)兩次時(shí),其字體大小為原來的兩倍。
regexp:字符串或None(可選)。指定使用正則表達(dá)式分隔輸入的文本。如果沒有指定,則使用默認(rèn)的正則表達(dá)式進(jìn)行分詞。
collocations:布爾類型,默認(rèn)值為True。指定是否包括兩個(gè)詞的搭配(雙賓語(yǔ))。
1.6.常用函數(shù)方法
fit_words(frequencies):根據(jù)詞頻生成詞云。
generate(text):根據(jù)文本生成詞云。
generate_from_frequencies(frequencies[, …]):根據(jù)詞頻生成詞云,類似于fit_words方法。
generate_from_text(text):根據(jù)文本生成詞云,類似于generate方法。
recolor([random_state, color_func, colormap]):對(duì)現(xiàn)有輸出重新著色。重新上色會(huì)比重新生成整個(gè)詞云快很多。
完畢!!感謝您的收看
----------★★歷史博文集合★★----------
我的零基礎(chǔ)Python教程,Python入門篇 進(jìn)階篇 視頻教程 Py安裝py項(xiàng)目 Python模塊 Python爬蟲 Json Xpath 正則表達(dá)式 Selenium Etree CssGui程序開發(fā) Tkinter Pyqt5 列表元組字典數(shù)據(jù)可視化 matplotlib 詞云圖 Pyecharts 海龜畫圖 Pandas Bug處理 電腦小知識(shí)office自動(dòng)化辦公 編程工具 NumPy Pygame