中文亚洲精品无码_熟女乱子伦免费_人人超碰人人爱国产_亚洲熟妇女综合网

當(dāng)前位置: 首頁(yè) > news >正文

長(zhǎng)治網(wǎng)站建設(shè)收費(fèi)多少2022最好的百度seo

長(zhǎng)治網(wǎng)站建設(shè)收費(fèi)多少,2022最好的百度seo,萬(wàn)網(wǎng)域名注冊(cè)官網(wǎng)gname,網(wǎng)站建設(shè)成都筆者要做命名實(shí)體識(shí)別(NER)的工作,選擇了Doccano平臺(tái)來(lái)進(jìn)行文本標(biāo)注。 Doccano平臺(tái)對(duì)標(biāo)注結(jié)果的導(dǎo)出格式是JSONL格式,我們導(dǎo)出了NER.jsonl文件。 但是用python語(yǔ)言搭建深度學(xué)習(xí)模型來(lái)實(shí)現(xiàn)NER時(shí),一般接收的輸入數(shù)據(jù)格式…

筆者要做命名實(shí)體識(shí)別(NER)的工作,選擇了Doccano平臺(tái)來(lái)進(jìn)行文本標(biāo)注。

Doccano平臺(tái)對(duì)標(biāo)注結(jié)果的導(dǎo)出格式是JSONL格式,我們導(dǎo)出了NER.jsonl文件。

但是用python語(yǔ)言搭建深度學(xué)習(xí)模型來(lái)實(shí)現(xiàn)NER時(shí),一般接收的輸入數(shù)據(jù)格式為CoNLL 2003格式,需要將Doccano導(dǎo)出的JSONL數(shù)據(jù)轉(zhuǎn)換成CoNLL 2003格式。CoNLL 2003格式大概長(zhǎng)下面這樣,左邊是原文,右邊是標(biāo)簽:

剛開(kāi)始我還琢磨怎么變代碼做轉(zhuǎn)換,后來(lái)查到Doccano有官方的轉(zhuǎn)換工具:doccano-transformer,就是個(gè)python庫(kù),用起來(lái)很方便,下面是官方給出的使用代碼:

先在命令提示符里安裝:

pip install doccano-transformer

再用python語(yǔ)句來(lái)使用:

from doccano_transformer.datasets import NERDataset
from doccano_transformer.utils import read_jsonldataset = read_jsonl(filepath='example.jsonl', dataset=NERDataset, encoding='utf-8')
dataset.to_conll2003(tokenizer=str.split)

但是官方給的代碼不夠完整,沒(méi)有把結(jié)果轉(zhuǎn)成可以直接操作的txt文本,下面是我真正使用的代碼,增加了將轉(zhuǎn)換結(jié)果存儲(chǔ)成txt文件這一環(huán)節(jié):?

from doccano_transformer.datasets import NERDataset
from doccano_transformer.utils import read_jsonldataset = read_jsonl(filepath='NER.jsonl', dataset=NERDataset, encoding='utf-8')
gen=dataset.to_conll2003(tokenizer=str.split)file_name="CoNLL.txt"with open(file_name, "w", encoding = "utf-8") as file:for item in gen:file.write(item["data"] + "\n")

但卻報(bào)錯(cuò),提示:KeyError: 'The file should includes either "labels" or "annotations".':

?

在網(wǎng)上找了很久發(fā)現(xiàn)了解決辦法,需要兩步:

①將導(dǎo)出的jsonl文件里的“entities”標(biāo)簽轉(zhuǎn)換成“annotations”。

②將“doccano_transformer\examples.py”腳本中第29行的“doccano_transformer\examples.py”修改成“labels[0].append([”。(截圖中使用Notepad++打開(kāi)的examples.py腳本)

然后再按照我們之前的轉(zhuǎn)換代碼運(yùn)行就可以了:

from doccano_transformer.datasets import NERDataset
from doccano_transformer.utils import read_jsonldataset = read_jsonl(filepath='NER.jsonl', dataset=NERDataset, encoding='utf-8')
gen=dataset.to_conll2003(tokenizer=str.split)file_name="CoNLL.txt"with open(file_name, "w", encoding = "utf-8") as file:for item in gen:file.write(item["data"] + "\n")

http://www.risenshineclean.com/news/50499.html

相關(guān)文章:

  • 上海百度地圖百度快速seo軟件
  • 網(wǎng)站建設(shè)優(yōu)化文章重慶今日頭條新聞消息
  • 石家莊免費(fèi)做網(wǎng)站杭州seo公司
  • 哈爾濱做設(shè)計(jì)和網(wǎng)站的公司嗎電話營(yíng)銷外包公司
  • 地方門戶網(wǎng)站模板seo教程seo優(yōu)化
  • 網(wǎng)頁(yè)制作模板的含義和作用在線seo工具
  • 簡(jiǎn)單介紹網(wǎng)站建設(shè)的一般流程專業(yè)公司網(wǎng)絡(luò)推廣
  • 網(wǎng)站seo建設(shè)方案浙江seo推廣
  • 網(wǎng)站建設(shè)費(fèi) 科目天津網(wǎng)站排名提升多少錢
  • 網(wǎng)站宣傳方案網(wǎng)絡(luò)推廣長(zhǎng)沙網(wǎng)絡(luò)推廣
  • 商城網(wǎng)站備案做網(wǎng)站哪家公司比較好而且不貴
  • 做購(gòu)物網(wǎng)站適合的服務(wù)器站長(zhǎng)工具國(guó)色天香
  • 政務(wù)網(wǎng)站集約化建設(shè)難點(diǎn)與建議湖南關(guān)鍵詞優(yōu)化首選
  • 網(wǎng)站導(dǎo)航css代碼培訓(xùn)課
  • 做高級(jí)電工題的網(wǎng)站外鏈工具在線
  • 校園互動(dòng)網(wǎng)站建設(shè)站長(zhǎng)工具同大全站
  • 食品營(yíng)銷網(wǎng)站建設(shè)調(diào)查問(wèn)卷免費(fèi)網(wǎng)站流量統(tǒng)計(jì)工具
  • 做汽配找哪個(gè)網(wǎng)站好軟件排名工具
  • ruby 做網(wǎng)站谷歌推廣公司哪家好
  • 長(zhǎng)沙手機(jī)網(wǎng)站建設(shè)哪些內(nèi)容建網(wǎng)站需要什么條件
  • icp網(wǎng)站備案系統(tǒng)中國(guó)最好的營(yíng)銷策劃公司
  • 公司做網(wǎng)站推廣的價(jià)格鮮花網(wǎng)絡(luò)營(yíng)銷推廣方案
  • 做優(yōu)化網(wǎng)站哪個(gè)公司好win10優(yōu)化大師是官方的嗎
  • 啟東做網(wǎng)站的網(wǎng)絡(luò)公司有哪些外貿(mào)網(wǎng)絡(luò)營(yíng)銷推廣
  • 做阿里巴巴網(wǎng)站圖片尺寸枸櫞酸西地那非片的功效與作用
  • 通過(guò)網(wǎng)站如何做海外貿(mào)易大連seo按天付費(fèi)
  • 如何在門戶網(wǎng)站做搜索引擎廈門網(wǎng)站建設(shè)公司
  • 響應(yīng)式網(wǎng)站介紹東莞網(wǎng)絡(luò)排名優(yōu)化
  • 做網(wǎng)站一定要學(xué)java嗎寫軟文平臺(tái)
  • php 網(wǎng)站 模板無(wú)錫百度競(jìng)價(jià)公司