午夜毛片免费看,老师老少妇黄色网站,久久本道综合久久伊人,伊人黄片子

實體識別模型的訓練方法、實體識別方法、裝置及設備與流程

文檔序號:39728660發(fā)布日期:2024-10-22 13:32閱讀:2來源:國知局
實體識別模型的訓練方法、實體識別方法、裝置及設備與流程

本申請涉及模型訓練,特別涉及一種實體識別模型的訓練方法、實體識別方法、實體識別模型的訓練裝置、電子設備及計算機可讀存儲介質(zhì)。


背景技術:

1、實體識別(name?entity?recognition,ner)是指在一段文本中,將預先定義好的實體類型(例如,人名、機構、地名等)識別出來。實體識別是信息提取的重要內(nèi)容,屬于自然語言處理中一個非常重要且基礎的問題。

2、在現(xiàn)有技術中,可以通過各種自然語言處理模型(例如,大模型)實現(xiàn)實體識別任務。但是,現(xiàn)有大模型在面對不同的實體識別任務時,泛化能力較差,因此,對于不同實體識別任務,可能需要重新進行微調(diào)訓練,以提升模型泛化能力,從而滿足多樣化的實體識別任務需求。


技術實現(xiàn)思路

1、本申請?zhí)峁┮环N實體識別模型的訓練方法、實體識別方法、實體識別模型的訓練裝置、電子設備及計算機可讀存儲介質(zhì),通過優(yōu)化的實體識別指令模版構建訓練指令集,從而提升實體識別模型的訓練效果,獲得準確性和泛化性更高的實體識別模型。

2、第一方面,本申請?zhí)峁┝艘环N實體識別模型的訓練方法,該實體識別模型的訓練方法包括:根據(jù)預設的實體識別指令模板構建訓練指令集,其中,所述實體識別指令模板至少包括實體類型標注字段、實體類型解釋標注字段、思維鏈提示字段和預測字段,所述訓練指令集包括多個訓練指令,且至少部分訓練指令的預測字段對應的輸出順序不同;將所述訓練指令集輸入待訓練的實體識別模型,得到實體識別預測結果;根據(jù)所述實體識別預測結果調(diào)整所述待訓練的實體識別模型的模型參數(shù),以得到訓練好的實體識別模型。

3、第二方面,本申請?zhí)峁┝艘环N實體識別方法,該實體識別方法包括:將待識別文本數(shù)據(jù)輸入實體識別模型,得到與所述待識別文本數(shù)據(jù)對應的實體識別結果;其中,所述實體識別模型采用上述的實體識別模型的訓練方法獲得。

4、第三方面,本申請?zhí)峁┝艘环N實體識別模型的訓練裝置,該實體識別模型的訓練裝置包括:構建模塊,用于根據(jù)預設的實體識別指令模板構建訓練指令集,其中,所述實體識別指令模板至少包括實體類型標注字段、實體類型解釋標注字段、思維鏈提示字段和預測字段,所述訓練指令集包括多個訓練指令,且至少部分訓練指令的預測字段對應的輸出順序不同;預測模塊,用于將所述訓練指令集輸入待訓練的實體識別模型,得到實體識別預測結果;調(diào)整模塊,用于根據(jù)所述實體識別預測結果調(diào)整所述待訓練的實體識別模型的模型參數(shù),以得到訓練好的實體識別模型。

5、第四方面,本申請?zhí)峁┝艘环N電子設備,該電子設備包括:至少一個處理器;以及與所述至少一個處理器通信連接的存儲器;其中,所述存儲器存儲有可被所述至少一個處理器執(zhí)行的一個或多個計算機程序,一個或多個所述計算機程序被所述至少一個處理器執(zhí)行,以使所述至少一個處理器能夠執(zhí)行上述的實體識別模型的訓練方法或?qū)嶓w識別方法。

6、第五方面,本申請?zhí)峁┝艘环N計算機可讀存儲介質(zhì),其上存儲有計算機程序,其中,所述計算機程序在被處理器/處理核執(zhí)行時實現(xiàn)上述的實體識別模型的訓練方法或?qū)嶓w識別方法。

7、本申請所提供的實施例,首先,根據(jù)預設的實體識別指令模板構建訓練指令集,其中,實體識別指令模板至少包括實體類型標注字段、實體類型解釋標注字段、思維鏈提示字段和預測字段,訓練指令集包括多個訓練指令,且至少部分訓練指令的預測字段對應的輸出順序不同;其次,將訓練指令集輸入待訓練的實體識別模型,得到實體識別預測結果;最后,根據(jù)實體識別預測結果調(diào)整待訓練的實體識別模型的模型參數(shù),以得到訓練好的實體識別模型,一方面通過在實體識別指令模板中包含實體類型標注字段、實體類型解釋標注字段,從而在訓練實體識別模型時,能夠提升實體識別模型對于不同實體類型的理解能力,另一方面,通過在實體識別指令模板中包含思維鏈提示字段和預測字段,且至少部分訓練指令的預測字段對應的輸出順序不同,從而根據(jù)訓練指令集訓練實體識別模型時,不僅可以提升模型的實體識別能力,還能提升模型對于對實體識別任務的拆解能力,有效提升了訓練后的實體識別模型對于不同實體識別任務的識別準確率。

8、應當理解,本部分所描述的內(nèi)容并非旨在標識本申請的實施例的關鍵或重要特征,也不用于限制本申請的范圍。本申請的其它特征將通過以下的說明書而變得容易理解。



技術特征:

1.一種實體識別模型的訓練方法,其特征在于,所述方法包括:

2.根據(jù)權利要求1所述的方法,其特征在于,所述根據(jù)預設的實體識別指令模板構建訓練指令集,包括:

3.根據(jù)權利要求1所述的方法,其特征在于,所述思維鏈提示字段包括多個推理步驟字段,且所述多個推理步驟字段對應的推理邏輯用于執(zhí)行預設的實體識別任務;

4.根據(jù)權利要求1所述的方法,其特征在于,所述實體識別預測結果包括實體類型預測字段和實體類型解釋預測字段;

5.根據(jù)權利要求1或4所述的方法,其特征在于,所述實體識別指令模板包括實體類型標注字段、實體類型解釋標注字段和實體解釋標注字段,所述實體識別預測結果包括實體類型預測字段、實體類型解釋預測字段和實體解釋預測字段;

6.根據(jù)權利要求5所述的方法,其特征在于,所述基于所述第一損失值、所述第二損失值、所述第三損失值和所述第四損失值,調(diào)整所述待訓練的實體識別模型的模型參數(shù),包括:

7.一種實體識別方法,其特征在于,所述方法包括:

8.一種實體識別模型的訓練裝置,所述裝置包括:

9.一種電子設備,其特征在于,包括:

10.一種計算機可讀存儲介質(zhì),其上存儲有計算機程序,其特征在于,所述計算機程序在被處理器執(zhí)行時實現(xiàn)如權利要求1-6中任一項所述的實體識別模型的訓練方法,或,如權利要求7所述的實體識別方法。


技術總結
本申請?zhí)峁┝艘环N實體識別模型的訓練方法、實體識別方法、裝置及設備,屬于模型訓練技術領域。該方法包括:根據(jù)預設的實體識別指令模板構建訓練指令集,其中,實體識別指令模板至少包括實體類型標注字段、實體類型解釋標注字段、思維鏈提示字段和預測字段,訓練指令集包括多個訓練指令,且至少部分訓練指令的預測字段對應的輸出順序不同;將訓練指令集輸入待訓練的實體識別模型,得到實體識別預測結果;根據(jù)實體識別預測結果調(diào)整待訓練的實體識別模型的模型參數(shù),以得到訓練好的實體識別模型。本申請實施例能夠提升模型的實體識別能力、模型對于實體類型的理解能力以及對任務的拆解能力,從而提高訓練后的模型對于實體識別任務的識別準確率。

技術研發(fā)人員:王展,羅華剛,崔明飛,賈敬伍,車成富,于皓,張杰
受保護的技術使用者:北京中科金得助智能科技有限公司
技術研發(fā)日:
技術公布日:2024/10/21
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1