棗莊做網(wǎng)站的公司/seo技術(shù)306
信息抽取
自動(dòng)從半結(jié)構(gòu)或無結(jié)構(gòu)的文本中抽取出結(jié)構(gòu)化信息的任務(wù)。常見的信息抽取任務(wù)有三類:實(shí)體抽取、關(guān)系抽取、事件抽取。
1、實(shí)體抽取
從一段文本中抽取出文本內(nèi)容并識(shí)別為預(yù)定義的類別。

- 重復(fù)嵌套,原文中多個(gè)實(shí)體之間共享片段
- 不連續(xù),一個(gè)實(shí)體由多個(gè)不連續(xù)片段組成
2、關(guān)系抽取
從文本中抽取一對(duì)實(shí)體和預(yù)定義的關(guān)系類型。
傳統(tǒng)的關(guān)系抽取任務(wù)實(shí)現(xiàn)方案是先進(jìn)行實(shí)體抽取,再輸入頭尾實(shí)體與原文進(jìn)行關(guān)系分類。
簡(jiǎn)單關(guān)系抽取解碼設(shè)計(jì)

- 關(guān)系重疊,一個(gè)實(shí)體屬于多個(gè)關(guān)系
- 實(shí)體對(duì)組合,實(shí)體對(duì)有多重組合方式
針對(duì)關(guān)系重疊問題的解碼設(shè)計(jì)

針對(duì)實(shí)體對(duì)組合問題的解碼設(shè)計(jì)

綜合解決上述問題的解碼設(shè)計(jì)

3、事件抽取
從一段文本中抽取出預(yù)定義的事件觸發(fā)詞和事件要素。
在實(shí)際使用的過程當(dāng)中,我們可以把除了關(guān)系以外的所有復(fù)雜信息全部拆解成關(guān)系抽取來解決事件抽取問題。
事件抽取是信息抽取的難點(diǎn)問題
事件抽取依賴實(shí)體抽取和關(guān)系抽取;
目前對(duì)事件還沒有統(tǒng)一的定義,在不同領(lǐng)域針對(duì)不同應(yīng)用不同人對(duì)事件有不同的描述;
信息抽取中事件的定義
事件:是發(fā)生在某個(gè)特定的時(shí)間段、某個(gè)特定的地域范圍內(nèi),由一個(gè)或者多個(gè)角色參與的一個(gè)或者多個(gè)動(dòng)作組成的事件或者狀態(tài)的改變。
事件類型: 不同動(dòng)作或者狀態(tài)的改變代表不同類型的事件;
事件元素: 同一類型的事件中不同的時(shí)間、地點(diǎn)、元素代表了不同的時(shí)間實(shí)例;
參考:
1、https://blog.csdn.net/qq_40671063/article/details/123693613
2、https://aistudio.baidu.com/aistudio/course/introduce/24177?sharedType=1&sharedUserId=151203&ts=1675913362694